Generowanie obrazów na podstawie monitu tekstowego chyba zaczyna się nudzić. Przyszedł czas na możliwości edytorskie wybranych na zdjęciach elementów. Google pokazał potencjał swojego Imagen Editora.
Sztuczna inteligencja i jej przełomowe narzędzia
Zapał technologicznych gigantów do sztucznej inteligencji nie gaśnie. Choć Microsoft nadal mocno w tym przoduje, Google próbuje go dogonić, pokazując coraz to nowsze możliwości swoich narzędzi. W przeciwieństwie do Binga i Image Creatora, generatora Bard oraz narzędzia Imagen nadal nie możemy przetestować. Mimo to, Google pokazało kolejną możliwość w swoim kreatorze obrazów AI. Tym razem padło na edycję.
Wiele z nas przetestowało już moc generatywnej sztucznej inteligencji, gdyż sporo narzędzi dostępnych jest za darmo. Pozwoliło to nam wyzwolić pokłady swojej kreatywności. Jednak edycja obrazów została nieco w tyle. Google jednak o niej nie zapomniał i pokazał możliwości Imagen Editora, który opiera się o kaskadowy model dyfuzji.
Nowe narzędzie ma wiernie odtwarzać wpisywane monity tekstowe przy zastosowaniu tzw. detektorów obiektów. Każdy drobny szczegół danego obrazu pozwala na wykrycie i określenie szczegółów. Z kolei test EditBench umożliwia porównanie zmian na naturalnych i generowanych obrazach, tworzonych na podstawie tekstu.
W jaki sposób przebiega edycja w Imagen?
Jak wynika z informacji, edycja zdjęć ma być niezwykle prosta i intuicyjna. Aby możliwe było przerobienie danego obrazu, należy go zwyczajnie przesłać do systemu. Kolejnym krokiem jest wybranie części obrazu, który chcielibyśmy zmienić, obrysowując dany element. Na koniec wystarczy wpisać monit tekstowy, opisujący nasze zamiary wobec danego rysunku, zdjęcia czy obrazu.
Wszystko wygląda naprawdę prosto. Jest jednak jeden „niewielki” haczyk. Narzędzie póki co nie jest dostępne, a pliki do pobrania przeznaczone są wyłącznie dla deweloperów. Zatem na obecny moment nie jest możliwe nawet minimalne wypróbowanie pokazanych możliwości. Co więcej, nie jest znana data premiery wersji przeznaczonej dla użytkowników, ba, nie jest nawet pewne, że kiedykolwiek trafi w nasze ręce. Szkoda, miejmy nadzieję, że Google uwolni kiedyś ten potencjał. Lepiej późno niż wcale!