Apple (źródło: Pixabay)
Apple (źródło: Pixabay)

Sztuczna inteligencja Apple edytuje zdjęcia po otrzymaniu polecenia w języku naturalnym

Marka Apple opracowała własny, multimodalny model sztucznej inteligencji, którego zadaniem jest edytowanie zdjęć. Użytkownik może wprowadzać zmiany w obrazach już na poziomie pojedynczych pikseli za pomocą poleceń przekazywanych w języku naturalnym.

Wyścig gigantów o narzędzia AI

Sztuczna inteligencja intensywnie się rozwija, a najwięksi technologiczni giganci, tacy jak Microsoft czy Google, usiłują wyprzedzać się swoimi pomysłami. Wydawać by się mogło, że ten szalony wyścig odpuściła marka Apple, jednak nic bardziej mylnego. Również to przedsiębiorstwo prowadzi prace, których wynikiem mają być zaawansowane narzędzia AI.

Jedną z propozycji jest „MGIE”, czyli najnowszy model sztucznej inteligencji, który został udostępniony w trybie open source na GitHub. Jego zadaniem jest wprowadzanie zmian na obrazach w oparciu o instrukcje wydawane przez użytkownika. Nie są one jednak typowymi podpowiedziami, przesyłanymi w postaci tekstu, a poleceniami wydawanymi w języku naturalnym.

Metoda działania "MGIE" (źródło: GitHub/Apple)
Metoda działania „MGIE” (źródło: GitHub/Apple)

„MGIE” czy też MLLM-Guided Image Editing, powstały dzięki współpracy Apple oraz Uniwersytetu Kalifornijskiego, umożliwia edytowanie zdjęć nawet na poziomie pojedynczych pikseli. Model ten wprowadza modyfikacje zarówno globalnie, jak i lokalnie.

Funkcjonalność modelu od Apple

Język naturalny pozwala wyrazić zdecydowanie więcej niż krótkie prompty i polecenia. Instrukcje przekazywane przez użytkownika są wyraźniejsze i bardziej zrozumiałe. Przekazanie MGIE hasła „spraw, aby niebo było bardziej błękitne” może powodować, iż model generuje polecenie „zwiększ nasycenie obszaru nieba o 20%”.

Metoda działania "MGIE" (źródło: GitHub/Apple)
Metoda działania „MGIE” (źródło: GitHub/Apple)

Zmiany w kolorystyce to nie jedyna możliwość najnowszej propozycji Apple. Wśród jego funkcji znalazło się również manipulowanie konkretnymi obiektami, obecnymi na obrazach. Poza tym MGIE jest w stanie przycinać, zmieniać rozmiar czy obracać zdjęcia, a także dodawać filtry, wprowadzać modyfikacje tła czy usuwać bądź dodawać obiekty. Wspomniany model może też dodawać artystycznego charakteru, przetwarzać obrazy w szkice oraz ingerować w jasność, kontrast, ostrość oraz balans barw. Wśród opcji można znaleźć również zmiany kształtu obiektów, ich tekstur czy kolorów.