Firma Stability AI zwiększyła wydajność swojego narzędzia. Stable Diffusion XL Turbo może teraz generować obrazy „w czasie rzeczywistym”. Oznacza to, że tworzenie grafik odbywa się niemalże równo z przesyłaniem opisu tekstowego przez użytkownika. Jak to możliwe?
Narzędzie tworzy obrazy w okamgnieniu
Generatory obrazów mocno zyskały na popularności w 2023 roku. Kolejne firmy wyprzedzały się wzajemnie swoimi możliwościami i funkcjami, ale także jakością i szybkością tworzenia grafik. Firma Stability AI właśnie pokazała nową wersję narzędzia, które tworzy grafiki tak szybko, jak tylko użytkownik jest w stanie pisać komendy.
Stable Diffusion XL Turbo został uruchomiony 28 listopada 2023 roku. Wydajny model może tworzyć obrazy tuż po przesłaniu opisu do narzędzia, przy czym komenda nie musi być wcale kompletna. Firma określa narzędzie jako generator działający „w czasie rzeczywistym”. Co ciekawe, nowa propozycja Stability AI potrafi pobierać statyczne obrazy z kamery internetowej, by przekształcać je „na żywo”.
Technologia nowej wersji generatora AI
Uzyskanie tak wysokiej wydajności było możliwe dzięki Adversarial Diffusion Distillation, w skrócie nazywanej ADD. Technologia ta pozwoliła na ograniczenie tworzenia obrazu do jednego lub kilku kroków, zamiast kilkudziesięciu. Działanie modelu opiera się o syntezę istniejących obrazów, co nazywane jest destylacją punktacji, oraz stratę kontradyktoryjną, która wpływa na uzyskanie realistycznej grafiki.
Choć narzędzie z dodatkiem Turbo jest dużo szybsze w porównaniu do wersji Stable Diffusion XL, nie jest w stanie uzyskać tak dokładnych i szczegółowych zdjęć – przynajmniej na ten moment. Jak donosi portal Ars Technica, nowa propozycja Stability AI generuje obraz 1024×1024 pikseli w ciągu zaledwie 4 sekund. Starsza wersja natomiast jest w stanie opracować zdjęcie w około 26 sekund. Model Stable Diffusion XL Turbo jest już dostępny, jednak skierowany jest do osób z licencją do badań niekomercyjnych.