Wyobrażaliście sobie kiedyś, że komputery mogą tworzyć dzieła sztuki? I to nie przez długie godziny, ale niemal natychmiast? To już nie fantastyka, ale rzeczywistość, dzięki przełomowi dokonanemu przez naukowców z MIT. Odkryli sposób, by proces, który zwykle wymagał wielu kroków, zamienić w jedną, szybką akcję.
Prościej znaczy szybciej – i lepiej
Tradycyjne metody tworzenia obrazów przez AI były skomplikowane i czasochłonne. Ale grupa badaczy z Laboratorium Nauki i Sztucznej Inteligencji Komputerowej MIT (CSAIL) postanowiła to zmienić. Wprowadzili metodę dystrybucyjnego dopasowania destylacji (DMD), dzięki której maszyny mogą nauczyć się tworzenia obrazów w jednym kroku.
Co więcej, obrazy te nie tracą na jakości, a wręcz przeciwnie – mogą być jeszcze lepsze. To trochę tak jak kiedy uczysz się nowej sztuczki – na początku powoli, krok po kroku, a potem nagle wszystko staje się jasne i możesz to robić znacznie szybciej.
Metoda DMD działa na dwóch podstawowych zasadach. Po pierwsze, używa czegoś, co nazywa się „stratą regresji”, co po prostu pomaga utrzymać cały proces w ryzach, tak aby wszystko szło gładko i obrazy układały się we właściwym porządku. Po drugie, wprowadza „dopasowanie dystrybucji„, co oznacza, że sprawdza, czy obrazy tworzone przez AI mają sens i czy pasują do tego, co zwykle widzimy wokół nas. Dzięki tym dwóm krokom, proces tworzenia jest szybki i sprawny, bo wszystko dzieje się za jednym zamachem, bez potrzeby wielokrotnego powtarzania tych samych czynności.
Jak to działa w praktyce?
Porównując metodę DMD z innymi, starszymi sposobami zauważono, że jest ona równie skuteczna. Szczególnie przy tworzeniu obrazów z określonych kategorii jest ona pierwszą techniką, która w jednym kroku tworzy obrazy niemal tak dobre, jak te z bardziej skomplikowanych modeli. Jednak należy zauważyć, że w niektórych trudniejszych zadaniach potrzebuje jeszcze trochę wprawy. Jakość obrazów mocno zależy od tego, jak dobry jest model wykorzystywany w roli „nauczyciela”. Obecnie jest to Stable Diffusion v1.5, jednak w planach jest zmiana na lepszy, w celu poprawy dokładności.
Najlepszym plusem tej nowej metody jest to, że potrafi tworzyć super obrazy aż 30 razy szybciej niż starsze sposoby. Dzięki temu komputery robią swoje zadania znacznie szybciej. To duży krok naprzód, bo może pomóc w różnych dziedzinach, jak szybsze tworzenie różnych treści, nowe odkrycia w medycynie czy lepsze projektowanie w 3D. Wszędzie tam, gdzie liczy się jakość, ale i sprawność działania.