Obraz wygenerowany przez AI (źródło: Midjourney)
Obraz wygenerowany przez AI (źródło: Midjourney)

Tworzyć każdy może, z Midjourney lepiej, a bez niego gorzej

Sztuką jednak wielką pozostaje kwestia, ubrania dzieła w słowa. Aby sztuczna głowa, stworzyła piękną pracę – za zerową płacę… Dziś pokażę Wam, jak tworzyć dzieła z użyciem Midjourney – krok po kroku.

Dobrze, wracam do standardowego pisania, wiersze – mimo wszystko – nie są mi zbyt bliskie. Niedawno informowaliśmy o konkursie, w którym główna wygrana przypadła obrazowi wygenerowanemu przez algorytm Midjourney AI. Jednak czym on dokładnie jest? Czy efekt prac jest zadowalający? Jak można z niego skorzystać? Na te i inne pytania odpowiem w poniższym artykule.

Jak będzie wyglądał test zdolności artystycznych Midjourney AI?

Cóż, to dość proste. Wezmę na warsztat 3 kategorie: cytaty, tytuły (w obu kategoriach z filmu, gry oraz książki) oraz postacie (dwie fikcyjne oraz jedna historyczna). Następnie zamieszczę efekty pracy Midjourney AI oraz pozostawię Tobie do oceny kwestie estetyczne. Wpuszczę jednak własne przemyślenia, związane z tym, jak dobrze (bądź źle) algorytm zinterpretował zagadnienie.

Już wcześniej trochę bawiłem się DALL-E mini, natomiast z Midjourney będzie to moja pierwsza przygoda. Dobrze, ale zanim zaczniemy, pasowałoby podać kilka podstawowych informacji dotyczących algorytmu…

Czym jest Midjourney AI?

Midjourney AI jest generatorem obrazów, które powstają na podstawie wprowadzonych przez użytkownika słów. Niekoniecznie muszą to być tagi, jak w generatorze idealnych kobiet, czy słowa kluczowe, algorytm jest w stanie przetworzyć całe opisy.

Odpowiedzialnymi za program są inżynierowie z niezależnego laboratorium Midjourney. Wspomniane laboratorium składa się z 11 osób, natomiast jednym z ich głównych zainteresowań jest sztuczna inteligencja. Zespół nie ma zewnętrznego finansowania i sam pozyskuje środki na prowadzenie i rozwój swoich badań. Jeśli chcecie się dowiedzieć o nich czegoś więcej, to odsyłam na oficjalną stronę Midjourney (mającą zresztą świetny design).

Jak korzystać z algorytmu?

To też kwestia prosta, choć nie aż tak, jak w przypadku DALL-E mini. Po wejściu na stronę Midjourney należy kliknąć „Join the beta”. Strona przekieruje Cię do oficjalnego Discorda, za pomocą którego przekazywane są instrukcje dotyczące obrazu, który użytkownik chce stworzyć.

Po zalogowaniu się oraz dołączeniu do kanału, musisz znaleźć zakładkę Newcommers Room, a pod nią kanały „newbies-(cyferki)”. Będzie ich kilka, ale nieważne, którą wybierzesz – wszystkie działają tak samo. Po wejściu w kanał, w oknie czatu musisz wpisać komendę „/imagine” i wybrać opcję, która Ci się pokaże. Następnie w polu „prompt” musisz wpisać to, co chcesz, aby zostało wygenerowane. Pamiętaj, że Midjourney AI działa w języku angielskim, więc jeśli skorzystasz z innego języka, to wyniki mogą być dalekie od idealnych. Jeśli w ogóle zostaną przetworzone 😉.

Po wpisaniu frazy wystarczy kliknąć „wyślij” i Midjourney zabierze się do pracy. Po zakończeniu na kanale pojawi się nowa wiadomość, zawierająca wykreowane przez algorytm obrazy oraz 9 opcji. Po dwie do każdej z 4 grafik oraz 1, która pozwala na ponowne wytworzenie dzieł na podstawie tych samych słów. Opcje dotyczące poszczególnych grafik natomiast to zwiększenie rozdzielczości obrazka (U) oraz stworzenie nowych na podstawie jednego z zaprezentowanych (V).

Obrazkowa wersja instrukcji znajduje się poniżej. Mam nadzieję, że to Ci pomoże tworzyć wymyślne dzieła!

Tworzyć każdy może, z Midjourney lepiej, a bez niego gorzej
Kolaż stworzony w Paincie, czyli obrazkowa instrukcja obsługi

Pamiętaj jednak o ważnej rzeczy – wszystkie obrazy, które wygenerujesz, będą publicznie widoczne (chyba, że zdecydujesz się na subskrypcję, która między innymi dodaje dostęp do generowania grafik w trybie prywatnym). Dlatego też sugeruję nie szarżować z kontrowersyjnymi pomysłami. Szczególnie, że kanał ma swoich moderatorów. Ich czujność co prawda jest wybiórcza, ale lepiej nie próbować szczęścia, jeśli nie chcesz dostać bana.

Kategoria 1 – Cytaty

Koniec przynudzania, przechodzimy do eksperymentowania! Jak wspomniałem na wstępie, kategorią, która pójdzie na pierwszy ogień, będą cytaty. Od dawna są już wybrane – pierwszy będzie z nowej trylogii prequeli Gwiezdnych Wojen. Drugi zostanie wyciągnięty z gry o tytule Mass Effect 3. Trzeci natomiast będzie cytatem z Biblii. Test możliwości Midjourney AI czas zacząć!

„Czy słyszałeś kiedyś o tragedii Darth Plagueisa Mądrego?”

Tworzyć każdy może, z Midjourney lepiej, a bez niego gorzej
Midjourney AI najwyraźniej słyszało kiedyś podobną opowieść

Cóż, żaden z obrazów nie przedstawia tragedii Darth Plagueisa, ale trzeci w mojej opinii wygląda najlepiej.
Co ciekawe, algorytm nie ma najmniejszych wątpliwości, jak powinien wyglądać mroczny lord z uniwersum Gwiezdnych Wojen. Cała reszta to w zasadzie zmodyfikowany Imperator Palpatine, który był uczniem wspomnianego wcześniej Sitha.

„Stań w prochach biliona martwych dusz i zapytaj duchów czy honor się liczy. Milczenie jest twoją odpowiedzią.”

Tworzyć każdy może, z Midjourney lepiej, a bez niego gorzej
Widzę mroczne tony. To dobrze.

Cytat pochodzi z ust Javika, ostatniego żywego przedstawiciela rasy Protean. Nie będę wgłębiał się w szczegóły, ale jego historia jest niesamowicie przygnębiająca.

Tak samo, jak te obrazy – wyraźnie samotna postać pośród ogromnego pola maków, które od starożytności są uważane za symbol śmierci. Na pierwszym z obrazów jest to rzeźba, na reszcie jednak humanoidalne stworzenie. Nie wspominając o płomieniach oraz wszechobecnym popiele.

Niesamowicie podoba mi się możliwa interpretacja drugiego obrazu. Postać patrząca na wyraźnie widocznego ducha przywodzi na myśl samuraja, a dla tych wojowników honor od zawsze był jedną z najwyższych wartości.

Artystycznie podobają mi się wszystkie, najbardziej jednak przemawiają do mnie obrazy trzeci oraz czwarty. Do tego stopnia, że maksymalnie podniosłem im rozdzielczość i zapisałem. Zostaną tapetami na moich monitorach.

„Na imię mi Legion, bo jest nas wielu”

Cytat biblijny, swego czasu na punkcie demona (demonów?) o tym imieniu miałem niemałą obsesję. Szukałem każdej możliwej informacji na jego (ich?) temat. Nawet nawiązałem dyskusję z katechetką (której nie pozdrawiam) oraz księdzem na ten temat. Niemniej ilość oraz jakość informacji, do których dotarłem, mnie nie usatysfakcjonowała. Może Midjourney AI mnie zaskoczy…?

Tworzyć każdy może, z Midjourney lepiej, a bez niego gorzej
Czuję się zaskoczony, ale swoimi skojarzeniami…

Napiszę to wprost – bardziej komunistycznego obrazka dla podanej frazy niż pierwszy prawdopodobnie nie byłem sobie w stanie nigdy wyobrazić. Czerwona dystopia, gdzie najniższe warstwy są najjaśniejsze (trzymanie obywateli w przekonaniu, że wszystko jest cudowne). Im wyżej w hierarchii, tym ciemniejsza rzeczywistość (osoby z jakimś wpływem i szerszą perspektywą wiedzą jak jest naprawdę, ale nie interesuje ich los obywateli, tylko własne korzyści).

Niebo natomiast przesłania czarna chmura, zza której nie jest w stanie przedostać się światło. To może oznaczać niemożliwość wpłynięcia na obywateli zweryfikowanymi informacjami, przez wzgląd na hermetycznie wręcz zamknięcie społeczeństwa w bańce. Widzę sporą analogię w kwestii czerwonej dystopii oraz wielu obywateli, ale pozostawię ją dla siebie.

Reszta obrazów z kolei do mnie nie przemawia, aczkolwiek niewątpliwie ma swój urok estetyczny (z jednym wyjątkiem). Jak Tobie się kojarzą te rezultaty pracy AI?

Kategoria 2 – tytuły

Powiem tak zupełnie szczerze, że artykuł ten przybrał niesamowicie mroczny ton. Może uda się go zmienić, wykorzystując tytuły tekstów kultury. Bardzo na to liczę…

Midjourney AI, co sądzisz o filmie „Bękarty Wojny”?

Jest to jedyna produkcja Quentina Tarantino, która bardzo mi się podobała. Nie wiem, czy AI będzie miało podobne odczucia, ale jak tylko skończy się proces generowania, to się dowiem.

Tworzyć każdy może, z Midjourney lepiej, a bez niego gorzej
Obrazek numer 2 mówi, że Midjourney AI ma mieszane uczucia

Jakkolwiek drugi obraz wydaje mi się najbardziej trafny, jeśli chodzi o film (postać wygląda jak pomieszanie pułkownika Landy z porucznikiem Rainem). Gorzej jest z resztą – jakby, co takiego bękarciego jest w lesie? Ewentualnie co w lesie mamy z infamii? Biało-czerwoną szatę kolorystyczną jestem w stanie zrozumieć, przez wzgląd na wygląd oryginalnego plakatu. Niemniej skojarzenia z Polską wydają się być z jakiegoś powodu trafne…

Cóż, jest tylko jedna metoda, by sprawdzić, czy algorytm inspirował się tagami wojennymi, czy też plakatem filmu. Nakazać stworzenie większej ilości prac. To już będzie Twoje zadanie, a instrukcje, jak to zrobić, znajdują się powyżej. Koniecznie daj znać, czy dzieła wygenerowane dla Ciebie są w podobnym tonie!

Midjourney AI, co wiesz o „Assassin’s Creed”?

Tego tytułu zwyczajnie nie mogło tutaj zabraknąć. Niedawno seria obchodziła swoje 15-te urodziny, a Ubisoft zapowiedział nowe produkcje, które dołączą do obecnych już części. Fani wreszcie oficjalnie mogą oczekiwać niemal wymarzonego już asasyna w Japonii. Miejmy nadzieję, że będzie przynajmniej dobry.

Tworzyć każdy może, z Midjourney lepiej, a bez niego gorzej
Mam skojarzenia z konkretnymi częściami

Pierwszy obraz jest ciekawy, ponieważ przywodzi mi na myśl dwie postaci. Pierwszą jest Evie Frye, która debiutowała wraz z Assassin’s Creed Syndicate, drugą natomiast żona Altaira – Maria Amelia Thorpe. Skąd skojarzenie z tą drugą? Przez wzgląd na widoczny wzór Zakonu Templariuszy na szacie asasynki. Jest on jednak zniekształcony, co definitywnie nie było celowym zabiegiem algorytmu, aczkolwiek dodaje uroku temu obrazowi w kontekście przeciwstawiania się Zakonowi.

Jeśli chodzi o resztę obrazów – na ostanim widzę inspirację postacią Jacoba Frye (AC: Syndicate), na drugim Edwarda Kenwaya (AC IV: Black Flag), a na trzecim – Altairem (pierwszy Assassin’s Creed). W tej wersji jednak ma dziwny kaptur oraz operuje we współczesności. Niemniej, żadnej z tych grafik nie dałoby się pomylić z innym uniwersum.

Midjourney AI – znasz może „Hyperiona” pióra Dana Simmonsa?

Tworzyć każdy może, z Midjourney lepiej, a bez niego gorzej
Algorytm definitywnie zna okładki jednego z wydań

Nie widzę najmniejszego powiązania między tymi obrazami, a książką. Może poza kolorami, których dobór przywodzi na myśl okładki konkretnych wydań. Niemniej same obrazy wyglądają bardzo dobrze – kolejny materiał na tapety znaleziony!

Kategoria 3 – postacie

Zbliżamy się ku końcowi tego testu. Zanim jednak do tego dojdzie, pragnę stworzyć podobizny dwóch fikcyjnych postaci oraz jednej historycznej. Głównie chodzi o sprawdzenie, jak algorytm radzi sobie z konkretnymi figurami ludzkimi (i nie tylko), ale bez podawania szczegółów. Podane zostaną same imiona plus w pierwszym przykładzie rodzaj interakcji.

Algorytmie, narysuj Eragona lecącego na Safirze

Tworzyć każdy może, z Midjourney lepiej, a bez niego gorzej
Jest nieźle…

Widoczna jest humanoidalna postać lecąca na czymś, co miało być smokiem, ale takowym nie jest. Niemniej trudni o to winić AI, skoro nie wpisałem frazy „smok” do polecenia. Algorytm jednak wydaje się wiedzieć, że postaci te należą do przedstawicieli innych gatunków, mało tego, prawidłowo odczytuje kolor Saphiry. Choć może to kwestia powiązania ze słowem „sapphire”, czyli szafir…

To moja ostatnia prośba, obiecuję!

Przynajmniej ostatnia na potrzeby tego artykułu. Na prywatne natomiast mam dalekosiężne plany, ale to już inna rzecz. Kimże będzie więc ta postać historyczna, której wygenerowania pragnę?

Tworzyć każdy może, z Midjourney lepiej, a bez niego gorzej
Poznajesz tego przystojniaka?

Oto Fryderyk Franciszek Chopin, w wersji stworzonej przez algorytm. Jestem w szoku, ponieważ AI świetnie sobie poradziła z twarzą, gdzie DALL-E ma z tym niesamowity problem. Im dłużej patrzę w wygenerowane grafiki, tym więcej podobieństw dostrzegam, więc brawa dla Midjourney AI za dobrze wykonaną pracę!

Podsumowując wyniki eksperymentu

Tworzenie grafik na podstawie słów jest niesamowite. Jestem pozytywnie zaskoczony szczególnie ostatnim eksperymentem, gdzie algorytm musiał stworzyć postaci. Dziwna wariacja Saphiry urzekła mnie podobieństwem w kwestii koloru, natomiast portrety Chopina, choć nie tak doskonałe, to wyglądają bardzo dobrze.

Reszta obrazów również w jakiś sposób nawiązywała do wprowadzonej przeze mnie frazy. Największe artystyczne wrażenie, jednak wywarły na mnie obrazy stworzone na bazie słów Javika (kategoria 1, cytaty). Oglądając je odczuwam coś, czego nie dała mi nigdy żadna galeria sztuki, włącznie z Luwrem. Nie jestem co prawda żadnym koneserem, ani znawcą, niemniej do tej pory, patrząc na obraz nie miałem żadnych emocji z nim związanych.

Teraz jednak widzę przejmujący smutek, desperację, nawet utraconą nadzieję. Ale może to kwestia tego, że znam pełen kontekst, w którym padły te słowa? Może zrozumienie daje możliwość faktycznego przejęcia się sztuką?

Tego typu dywagacje jednak pozostawmy psychologom oraz znawcom sztuki. Ja pozwolę sobie jeszcze raz pochwalić algorytm Midjourney AI, ponieważ wygenerowane przez nią obrazy są niesamowite. Polecam przeglądnąć sobie prace wygenerowane na bazie słów wprowadzonych przez innych użytkowników, ponieważ co poniektóre obrazy to małe dzieła sztuki.