Wykorzystanie sztucznej inteligencji do tworzenia obrazów nie jest niczym nowym, ale ostatnio na popularności zyskuje trend generowania obrazów na podstawie tekstu. Z pewnością wśród dostępnych rozwiązań wyróżnia się Imagen opracowany przez specjalistów z Google.
Wystarczy kilka słów
Jak przed chwilą wspomniałem, ostatnio możemy zaobserwować trend stosowania sztucznej inteligencji do tworzenia obrazów na podstawie wyłącznie tekstu wprowadzonego przez użytkownika. Dotychczas liderem było tutaj narzędzie DALL-E, za którego stworzenie odpowiada firma OpenAI.
Trzeba przyznać, że technologia DALL-E robi spore wrażenie, zarówno pod względem poprawności odczytywania zamiarów osoby wprowadzającej tekst, jak i jakością stworzonych obrazów. Niewykluczone jednak, że na horyzoncie pojawiło się jeszcze lepsze rozwiązanie – Imagen od Google.
Najlepszym pokazem możliwości systemu, opracowanego przez zespół firmy z Mountain View, jest po prostu odwiedzenie specjalnej przygotowanej strony internetowej, na której możemy zapoznać się z efektami pracy sztucznej inteligencji.
Co więcej, Google chwali się, że Imagen prawie zawsze produkuje lepsze obrazy niż DALL-E, co mają potwierdzać wyniki z benchmarku DrawBench. W celu ustalenia najlepszego narzędzia zamieniającego tekst na obraz wprowadzono 200 słów, a następnie wyniki zostały ocenione przez ludzi. W znacznej większości przypadków jako lepsze uznawane były obrazy wygenerowane przez Imagen.
Sami nie możemy jednak w pełni ocenić możliwości sztucznej inteligencji
Oczywiście nic nie stoi na przeszkodzie, aby odwiedzić stronę poświęconą Imagen, ale mamy dostępne wyłącznie już gotowe obrazy, które zostały wygenerowane wcześniej. Możemy również sprawdzić na podstawie jakich tekstów zostały one stworzone.
Niestety, Google nie zdecydowało się udostępnić narzędzia zainteresowanym użytkownikom. Nie możemy więc sami wprowadzić tekstu, aby następnie zobaczyć obraz stworzony przez sztuczną inteligencję. Oczywiście materiały wrzucone przez firmę robią spore wrażenie, ale wysoce prawdopodobne, że zostały wybrane tylko najlepsze obrazy, a te niespełniające kryteriów po prostu odrzucono.
Google broni swojej decyzji twierdząc, że technologia oferowana przez Imagen mogłaby zostać wykorzystana w nieodpowiedni sposób. Na przykład do tworzenia fake newsów czy różnych rasistowskich, seksistowskich i toksycznych obrazów. Cóż, obecnie pozostaje więc przeglądanie wyłącznie grafik dostępnych na stronie internetowej projektu.