Nvidia GauGAN2
fot. Nvidia

Fascynujące! AI NVIDII tworzy zdjęcia na podstawie… kilku wyrazów

Osiągnięcia sztucznej inteligencji stają się coraz bardziej imponujące. Jedno z takich, które jest w stanie zrobić spore wrażenie, zaprezentowała właśnie NVIDIA. GauGAN2, bo o nim mowa, potrafi tworzyć realistyczne obrazy z zaledwie kilku wyrazów.

Nvidia stała się magicznym artystą

Stworzenie realistycznego obrazu może być nie lada wyzwaniem dla człowieka, w szczególności, jeśli za dane wejściowe służy zaledwie równoważnik zdania. Dla sztucznej inteligencji, takiej jak GauGAN2, nie stanowi to jednak najmniejszego problemu. Pierwsza wersja tego AI pojawiła się już dwa lata temu, kiedy to producent kart graficznych umożliwił przekształcanie prostych rysunków w prawdziwe dzieła sztuki.

W porównaniu do swojego starszego brata, GauGAN2 wymaga jeszcze mniej uzdolnienia artystycznego, pozwalając na tworzenie zapierających dech w piersiach obrazów na podstawie zaledwie kilku wyrazów.

Wystarczy wpisać do generatora dowolną frazę, którą mamy w głowie, a sztuczna inteligencja z niemal natychmiastowym skutkiem stworzy fotorealistyczny rysunek przedstawiający naszą myśl.

Możliwości jest nieskończenie wiele. Marzy wam się piękny, sierpniowy wieczór nad wodą? Wystarczy wpisać „zachód słońca na kamienistej plaży”, a GauGAN2 stworzy obraz, który jeszcze bardziej przybliży nas do niego myślami. Jeśli jednak zmienicie zdanie, wystarczy zmodyfikować frazę, by uzyskać zupełnie nowy widok. Przykładowo, zamiast „zachód słońca” wstawić „deszczowy dzień”, a AI Nvidii bez chwili zastanowienia wygeneruje całkowicie nowy obrazek.

Jeśli jednak koncepcja jest trafna, lecz nie do końca zgadza się z wizją w waszej głowie, zawsze można przejść do trybu rysowania, który umożliwi naszkicowanie pomysłu, przetworzenie go przez GauGAN2 i stworzenie kolejnego obrazu. Możliwe jest stworzenie dzięki temu również nieco odbiegających od rzeczywistości widoków, takich jak krajobraz planety Tatooine z serii Star Wars. AI poradziło sobie bezbłędnie z wygenerowaniem dodanego ręcznie drugiego słońca.  

Nowa sztuczna inteligencja łączy więc generowanie obrazu na podstawie tekstu z mapowaniem segmentów i rysowaniem odręcznym. Jest to potężne narzędzie, dzięki któremu stworzenie prawdziwego dzieła sztuki zajmuje zaledwie kilka kliknięć.

obraz wygenerowany przez Nvidia GauGAN, przedstawiający jezioro otoczone drzewami w mglisty dzień
Obraz wygenerowany na podstawie frazy „spokojne jezioro otoczone wysokimi drzewami w mglisty dzień” (fot. Nvidia)

Nvidia podaje, że model sztucznej inteligencji stojący za GauGAN2 został przeszkolony na podstawie 10 milionów zdjęć wysokiej jakości przedstawiających krajobrazy. Naukowcy, stojący za projektem, wykorzystali sieć neuronową do powiązania wyrazów z odpowiadającymi im krajobrazami.

Jeżeli chcecie sprawdzić, w jaki sposób działa generowanie obrazów na podstawie słów, możecie skorzystać z interaktywnej wersji demo dostępnej na stronie dedykowanej sztucznej inteligencji Nvidii.