Porównanie DMD i Stable Diffusion (źródło: tianweiy.github.io)

DMD i Stable Diffusion (źródło: tianweiy.github.io)

·2 min czytania

Naukowcy z MIT przyśpieszyli tworzenie obrazów przez AI 30-krotnie

Marta Borkowska·23 marca 2024

Strona główna

Wyobrażaliście sobie kiedyś, że komputery mogą tworzyć dzieła sztuki? I to nie przez długie godziny, ale niemal natychmiast? To już nie fantastyka, ale rzeczywistość, dzięki przełomowi dokonanemu przez naukowców z MIT. Odkryli sposób, by proces, który zwykle wymagał wielu kroków, zamienić w jedną, szybką akcję.

Prościej znaczy szybciej – i lepiej

Tradycyjne metody tworzenia obrazów przez AI były skomplikowane i czasochłonne. Ale grupa badaczy z Laboratorium Nauki i Sztucznej Inteligencji Komputerowej MIT (CSAIL) postanowiła to zmienić. Wprowadzili metodę dystrybucyjnego dopasowania destylacji (DMD), dzięki której maszyny mogą nauczyć się tworzenia obrazów w jednym kroku.

Co więcej, obrazy te nie tracą na jakości, a wręcz przeciwnie – mogą być jeszcze lepsze. To trochę tak jak kiedy uczysz się nowej sztuczki – na początku powoli, krok po kroku, a potem nagle wszystko staje się jasne i możesz to robić znacznie szybciej.

Porównanie DMD i Stable Diffusion (źródło: tianweiy.github.io)

Metoda DMD działa na dwóch podstawowych zasadach. Po pierwsze, używa czegoś, co nazywa się „stratą regresji”, co po prostu pomaga utrzymać cały proces w ryzach, tak aby wszystko szło gładko i obrazy układały się we właściwym porządku. Po drugie, wprowadza „dopasowanie dystrybucji„, co oznacza, że sprawdza, czy obrazy tworzone przez AI mają sens i czy pasują do tego, co zwykle widzimy wokół nas. Dzięki tym dwóm krokom, proces tworzenia jest szybki i sprawny, bo wszystko dzieje się za jednym zamachem, bez potrzeby wielokrotnego powtarzania tych samych czynności.

Porównanie DMD i Stable Diffusion AI (źródło: tianweiy.github.io)

Jak to działa w praktyce?

Porównując metodę DMD z innymi, starszymi sposobami zauważono, że jest ona równie skuteczna. Szczególnie przy tworzeniu obrazów z określonych kategorii jest ona pierwszą techniką, która w jednym kroku tworzy obrazy niemal tak dobre, jak te z bardziej skomplikowanych modeli. Jednak należy zauważyć, że w niektórych trudniejszych zadaniach potrzebuje jeszcze trochę wprawy. Jakość obrazów mocno zależy od tego, jak dobry jest model wykorzystywany w roli „nauczyciela”. Obecnie jest to Stable Diffusion v1.5, jednak w planach jest zmiana na lepszy, w celu poprawy dokładności.

Najlepszym plusem tej nowej metody jest to, że potrafi tworzyć super obrazy aż 30 razy szybciej niż starsze sposoby. Dzięki temu komputery robią swoje zadania znacznie szybciej. To duży krok naprzód, bo może pomóc w różnych dziedzinach, jak szybsze tworzenie różnych treści, nowe odkrycia w medycynie czy lepsze projektowanie w 3D. Wszędzie tam, gdzie liczy się jakość, ale i sprawność działania.

Zobacz również

Generator wideo AI VLOGGER (źródło: Google)

Nowy system AI Google ożywia zdjęcia ludzi i tworzy realistyczne filmy

Nowy model Stable Diffusion (źródło: Stability AI)

AI w nowej wersji Stable Diffusion nie psuje już tekstu na obrazach

Nowy model dla generatorów obrazów Stable Cascade (źródło: Stability AI)

Nowy model AI dla generatorów obrazów. Stable Cascade przebija Stable Diffusion

Przykład użycia Stable Doodle (źródło: Stability AI)

Stable Doodle zamieni dowolny szkic w artystyczny obraz