Sztuczna inteligencja
Sztuczna inteligencja

Zapamiętajcie tę nazwę! Make-A-Video to imponujące generowanie wideo z tekstu

Inżynierowie firmy Meta, znanej jako macierzysta firma Facebooka, zaprezentowała nowy system Make-A-Video, który pozwoli użytkownikom na stworzenie krótkich filmów wideo. Nowoczesny system umożliwi wygenerowanie krótkiego filmu jedynie na podstawie opisu sceny, który został przesłany przez użytkownika.

Sztuczny i imponujący system

Meta ciągle zaskakuje, tworząc coraz to nowsze systemy AI – m. in. sztuczną inteligencję. System tworzenia wideo na podstawie tekstu jest kolejną nowinką w portfolio tej firmy. Powstające w systemie Make-A-Video krótkie animacje wideo mają ożywiać wyobraźnię, a także tworzyć wyjątkowe filmy, które będą wypełnione żywymi kolorami, postaciami czy krajobrazami.

Sam Mark Zuckerberg opisuje nowoczesny system tworzenia animacji jako niesamowity postęp ze względu na trudność generowania wideo w porównaniu do zdjęć, do których wytworzenia wystarczy prawidłowe stworzenie każdego piksela. W przypadku generowania filmów wideo konieczne jest także przewidzenie zmieniania się pikseli w czasie.

System Make-A-Video tworzy klipy o długości pięciu sekund, które nie zawierają dźwięku. Klipy generowane są komputerowo, co sugeruje, że ich jakość z pewnością polepszy się w kolejnych latach, idąc za rozwojem i postępem w dziedzinie wideo.

Zapamiętajcie tę nazwę! Make-A-Video to imponujące generowanie wideo z tekstu

Ciemne strony jasnej przyszłości nowego systemu AI

Niepokojącym dla twórców faktem jest możliwość powstawania treści o niewłaściwym charakterze. Generowanie filmów w systemie Make-A-Video może prowadzić do tworzenia dezinformacyjnych, propagandowych czy też pornograficznych klipów, które mogą być wykorzystywane w sieci.

Naukowcy, na podstawie zaprezentowanego przez firmę Meta artykułu, zauważają jednak, że powstałe klipy mają wiele ograniczeń technicznych, a także powstałe materiały filmowe, w postaci animacji, są rozmyte i chaotyczne. Obecnie system Make-A-Video generuje animację na podstawie 16 klatek wideo o rozdzielczości 64 na 64 piksele, które powiększane są do rozmiaru 768 na 768 poprzez użycie oddzielnego modelu AI.

Meta planuje wydać demonstracyjną wersję systemu, jednak nieznane są szczegóły dotyczące ograniczeń w jego działaniu oraz czasu wydania nowego systemu. Firma twierdzi również, że dzieli się trwającymi nadal badaniami nad systemem Make-A-Video, aby uzyskać opinię społeczności, a następnie udoskonalać i rozwijać nowoczesną technologię.