Google Gemini zamienia zdjęcia w piosenki. Nowy model AI komponuje muzykę w 30 sekund

Kalendarz 2/20/2026

Google rozszerza możliwości swojego asystenta AI. W aplikacji Google Gemini pojawiła się funkcja generowania muzyki, która pozwala tworzyć kompletne utwory nie tylko z opisu tekstowego, ale również na podstawie zdjęć, dokumentów czy plików PDF. To kolejny krok w rozwoju narzędzi kreatywnych opartych na sztucznej inteligencji. Nowa funkcja działa globalnie i obsługuje wszystkie języki dostępne w Gemini.

Lyria 3. AI komponuje i pisze teksty

Za generowanie muzyki odpowiada model Lyria 3, opracowany przez zespół Google DeepMind. System przekształca krótkie opisy w gotowe nagrania trwające około 30 sekund.

Użytkownik może określić:

  • gatunek muzyczny,

  • nastrój utworu,

  • tempo,

  • styl wokalu,

  • charakter brzmienia.

Model generuje zarówno wersje instrumentalne, jak i pełne piosenki z tekstem oraz wokalem. Co istotne, Lyria 3 analizuje także przesłane pliki. Wystarczy wgrać zdjęcie, prezentację czy dokument, a system na podstawie ich treści stworzy tekst i dopasowaną kompozycję. Gotowe nagrania otrzymują unikalne okładki generowane przez model Nano Banana. Pliki można pobrać lub udostępnić linkiem.

Dream Track trafia do twórców Shorts

Google udostępnia tę samą technologię twórcom wideo na YouTube Shorts. Funkcja o nazwie Dream Track pozwala generować podkłady muzyczne do krótkich filmów i stopniowo trafia do użytkowników poza Stanami Zjednoczonymi. Nowa wersja modelu przynosi poprawę jakości dźwięku względem wcześniejszych testów. Utwory mają bardziej dopracowane wokale i lepszą spójność kompozycyjną. Wszystkie wygenerowane nagrania zawierają niewidoczny dla ucha znak wodny SynthID.

Gemini potrafi wykryć jego obecność i potwierdzić, czy plik został stworzony przez system Google. Firma wdrożyła również zabezpieczenia zapobiegające kopiowaniu stylu konkretnych artystów. Wpisanie nazwiska muzyka w poleceniu nie powoduje stworzenia utworu w jego stylu, a jedynie traktowane jest jako inspiracja do stworzenia nowej kompozycji. Google podkreśla, że narzędzie ma wspierać kreatywność użytkowników, a nie zastępować profesjonalnych twórców.

Nowa funkcja w Gemini pokazuje, jak szybko rozwijają się narzędzia generatywne. Tworzenie muzyki ze zdjęcia lub dokumentu w pół minuty jeszcze niedawno wydawało się futurystyczne, dziś staje się elementem codziennej aplikacji mobilnej. Lyria 3 rozszerza możliwości AI o pełnoprawne kompozycje z wokalem, a Dream Track może zmienić sposób tworzenia treści w Shorts.

Źródło: Google

Katarzyna Petru Avatar
Katarzyna Petru

Dziennikarz, recenzent i felietonista portalu "Wybierz TV"