Stability AI opracowało nowy model, który pozwoli na przyspieszenie i ulepszenie pracy generatorów obrazów. Stable Cascade został podzielony na trzy części, dzięki czemu działa szybciej i zajmuje mniej pamięci. Nowa technologia może również rozszerzać istniejące zdjęcia, a także uzupełniać brakujące w nich fragmenty.
Najnowszy model Stability AI
Generatory obrazów stają się coraz lepsze, a jedną z firm, która odpowiedzialna jest za rozpowszechnienie się tego typu narzędzi jest Stability AI. To właśnie ta marka stoi za popularnym modelem Stable Diffusion, wydanym w 2022 roku, który poruszył technologiczny świat i stał się podstawą wielu generatorów. Teraz przedsiębiorstwo pochwaliło się kolejną propozycją, a jest nią Stable Cascade.
Najnowsza propozycja ma cechować się większą szybkością działania w porównaniu do obecnie rozpowszechnionej wersji Stable Diffusion. Model jest zapowiadany jako „potężniejszy” w porównaniu do poprzednika i może nie tylko generować zdjęcia, ale także podawać różne wersje opracowanego obrazu, a nawet wpływać na zwiększenie rozdzielczości już istniejących ujęć.
Stable Cascade obejmuje również funkcję inpaintingu oraz outpaintingu. Pierwsza z nich odpowiedzialna jest za uzupełnianie brakujących, zniszczonych czy uszkodzonych fragmentów zdjęć, natomiast druga opcja pozwala na poszerzenie obecnego obrazu, które powiększy dane ujęcie, wykazując się dostosowaniem charakteru i kolorystyki przesłanej grafiki.
Generatory obrazów mogą być szybsze
Najnowsza propozycja Stability AI nie jest dostępna dla użytku komercyjnego. Póki co skierowana została do badaczy i można ją wypróbować w GitHub. Stable Cascade to nie jeden duży model językowy, a trzy różne, wydajne architektury dyfuzji tekstu na obraz nazwane Würstchen. Oznacza to, że generowanie obrazów realizowane jest w trzech etapach. Pierwszy z nich jest oznaczany literą C i odpowiada za skompresowanie podpowiedzi tekstowych.
Taka metoda pozwala na zmniejszenie pamięci potrzebnej do tworzenia grafik oraz skrócenie czasu opracowywania ujęć z jednoczesnym zachowaniem wysokiej jakości i dopasowania. Nowy model Stability AI pozwala generatorom na wykonanie zadania w 10 sekund, zamiast 22 sekund, które na ten moment wymagane jest przez Stable Diffusion XL.