Budynki miasto
źródło: Pexels

Google stworzył kolejny algorytm. Kto chętny na perspektywę drona?

Google ogłosił nowy program, oparty na algorytmach AI. Ma on pozwolić użytkownikom ożywić statyczny obraz, w perspektywie z lotu ptaka.

Stosunkowo niedawno fascynowaliśmy się algorytmami, które generują obrazy na bazie słów. Programy, takie jak Midjourney AI czy DALL-E 2, wymusiły całkowitą redefinicję dotychczasowego pojęcia sztuki cyfrowej. Zastosowań dla tego typu algorytmów jest bowiem wiele – od stworzenia idealnej dziewczyny na bazie tagów, po wygrywanie konkursów artystycznych.

Jednak obrazy to nie wszystko, co potrafią wygenerować algorytmy. Istnieje już bowiem wirtualny raper FN Meka, a poza nim znamy również generator filmów, działający na podobnej zasadzie, co algorytmy tworzące obrazy. Wracając jednak do obrazów…

Algorytm Google pozwala na zmianę perspektywy

Skoro istnieje algorytm, który potrafi „dokończyć” dzieła sztuki, to dlaczego by nie stworzyć takiego, który poradzi sobie ze zmianą perspektywy? Google zadało sobie podobne pytanie (lub nie) i stworzyło algorytm, który pozwala na wygenerowanie wideo z perspektywą z lotu ptaka (ewentualnie drona) na podstawie pojedynczego zdjęcia.

Tak, dobrze przeczytałaś/-eś – pojedynczego. Nie są potrzebne ujęcia z różnych perspektyw czy też wiele podobnych zdjęć, na podstawie których AI wygeneruje resztę ujęć. Wszystko odbędzie się na bazie jednego pliku, który zostanie wprowadzony do algorytmu.

Jak się nazywa? „Perpetual View Generation of Natural Scenes from Single Images”, co można przetłumaczyć jako „Nieustannie Generowany Widok Scen Naturalnych na bazie Pojedynczych Zdjęć”. Dość długa nazwa – miejmy nadzieję, że wraz z wprowadzeniem algorytmu, dojdzie do jej skrócenia.

portland
Ten statyczny widok może stać się dynamiczny, dzięki Perpetual View Generation of Natural Scenes from Single Images.
Jak na mój gust, to średnio chwytliwy spot reklamowy…

Jak to działa?

Przede wszystkim, należy wprowadzić obraz do algorytmu. Warto zaznaczyć, że program działa ze zdjęciami przedstawiającymi krajobrazy. Chociaż jestem pewien, że gdy tylko dojdzie do udostępnienia kodu, to znajdą się osoby chętne na ujrzenie (przykładowo) łysej głowy z lotu ptaka. Bądź innych, mniej lub bardziej związanych z krajobrazami i/lub obrazoburczych rzeczy.

Ale wracając do pierwotnego tematu. Następnie algorytm generuje i dostosowuje elementy, znajdujące się poza kadrem. Kolejnym krokiem jest dostosowanie kamery, która to może przesuwać się na prawo i lewo, bądź w linii prostej. Łatwiej chyba nie jestem w stanie przedstawić zasady działania.

Jeśli jednak nie satysfakcjonuje Cię udzielona przeze mnie odpowiedź, to zachęcam do odwiedzenia podstrony InfiniteNature-Zero, poświęconej „Perpetual View Generation of Natural Scenes from Single Images”. Twórcy narzędzia przedstawiają tam o wiele dokładniej zasady działania algorytmu.

Efekty pracy AI Google

Przedstawione na stronie krótkie filmy wideo są nad wyraz dobrej jakości. Faktycznie, zdarzają się różnego rodzaju artefakty, ale ogólnie efekt jest naprawdę dobry. Jeśli badania będą kontynuowane, a algorytm stale rozwijany, to jestem przekonany, iż w ciągu paru lat nie będą nam potrzebne drony, aby tworzyć świetne ujęcia w perspektywie z lotu ptaka.