Marka Google opracowała nowy model AI Space-Time-U-Net, o który oparto narzędzie Lumiere. Jest to generator wideo, który może tworzyć płynne, realistyczne, kilkusekundowe klipy. Jest jednak coś, co wyróżnia go na tle innych programów.
Sposób działania nowego modelu i narzędzia AI
Sztuczna inteligencja rozwija się i zdarza się, że wzbudza mieszane uczucia, a nawet niepokój. Ponad rok temu w ręce użytkowników trafił chatbot AI ChatGPT, który odpowiedzialny jest za tworzenie tekstu. Z czasem zyskaliśmy dostęp do kolejnych narzędzi, m.in. generujących obrazy. Teraz natomiast nadchodzi czas, w którym sztuczna inteligencja może produkować krótkie filmy.
Generator wideo Lumiere to kolejna propozycja tworzona w ramach eksperymentu przez markę Google. Jego możliwości zostały oparte o nowy model AI Space-Time-U-Net, nazywany także w skrócie U-Net. Choć w sieci pojawiały się już podobne narzędzia, to ten wyróżnia się sposobem działania. Dotychczas tworzenie klipów przez sztuczną inteligencję realizowane było przez wyprodukowanie pojedynczych klatek i połączenie ich w całość. Efekt był dość kiepski, a film mało realistyczny.
Google podszedł do sprawy nieco inaczej i zaprzęgnął U-Net do określenia przestrzeni klipu oraz poruszania się obiektów w nim występujących. Nowy generator wideo tworzy wyłącznie pierwszą klatkę w oparciu o zaproponowany przez użytkownika tekst, a następnie zajmuje się jego animacją. Dzięki temu otrzymywany klip jest bardziej płynny.
Generator wideo i możliwe zastosowania
Google Lumiere mogłoby znaleźć zastosowanie w przypadku tworzenia krótkich animacji, które będą charakteryzowały się lepszym poziomem wyrazistości i kreatywności. Jednak trzeba szczerze przyznać, że póki co ten generator wideo nie ma szans, aby stać się autorem długich, a już na pewno pełnometrażowych filmów. Na ten moment propozycja technologicznego giganta jest w stanie opracować klip zawierający 80 klatek, czyli może trwać kilka sekund.
Lumiere to nie tylko generator, ale również narzędzie do edycji i stylizowania istniejących filmów czy też animowania przesłanych obrazów, a nawet sposób na uzupełnienie brakujących fragmentów klipu.