SIMA (źródło: deepmind.google)
SIMA (źródło: deepmind.google)

Google pracuje nad inteligentnym partnerem do grania w gry wideo

Czy zastanawiałeś się kiedyś, jak to jest nauczyć komputer grać w gry wideo? Nie chodzi tu o byle jakie granie, ale o zrozumienie i wykonywanie zadań. Okazuje się, że to nie tylko świetna zabawa, ale też idealne miejsce do testowania nowych pomysłów na sztuczną inteligencję. Dzięki nim, badacze mogą sprawdzić, jak AI radzi sobie w dynamicznych i zmiennych środowiskach, które są trochę jak miniwersje naszego rzeczywistego świata.

Co to jest SIMA i dlaczego jest ważna?

Najnowszy projekt naukowców Google, Scalable Instructable Multiworld Agent (SIMA), to spory krok naprzód w świecie SI. Wyobraź sobie sztuczną inteligencję, która nie tylko gra w gry, ale też rozumie polecenia podawane prostym językiem i wykonuje je w różnych formach rozrywki wideo. Tak, dokładnie. SIMA może zrobić coś więcej niż tylko zdobywać punkty w grze — może na przykład znaleźć potrzebne zasoby lub zbudować obóz, jeśli tego chcesz. To jak mieć superinteligentnego pomocnika w wirtualnym świecie.

SIMA wyszkolono na dziewięciu różnych grach wideo (źródło: deepmind.google)

Badacze nie rzucili programu na głęboką wodę bez przygotowania. Współpracowali z ośmioma studiami gier, aby szkolić i testować go na dziewięciu różnych produkcjach wideo, takich jak No Man’s Sky od Hello Games i Teardown produkcji Tuxedo Labs. Od eksploracji kosmosu po strategiczne burzenie budynków. SIMA uczyła się, jak wykonywać różne zadania — wszystko to, interpretując obrazy z ekranu i wykonując instrukcje w języku, którym na co dzień posługujemy się my, ludzie. Bez dostępu do kodu źródłowego, jednak ze wskazówkami, bo gdy ich zabraknie, pomocnik AI staje się praktycznie bezwartościowy.

SIMA (źródło: deepmind.google)
SIMA to wstępnie wytrenowane modele wizyjne oraz model główny, który zawiera pamięć i wyprowadza działania klawiatury i myszy (źródło: deepmind.google)

Aktualna wersja została wytrenowana na 600 podstawowych zadaniach, na których wykonanie gracz potrzebuje około 10 sekund. Mowa tu m.in. o nawigacji, interakcji z obiektami czy korzystaniu z menu. Testy wykazały, że modele uczące się w ten sposób, były zdecydowanie skuteczniejsze niż agenci dedykowani do pojedynczych gier.

SIMA szkolona na podstawie 600 zadań (źródło: deepmind.google)

Co dalej ?

Sztuczna inteligencja DeepMind pokazuje, że możemy tworzyć systemy AI, które rozumieją nasz język i potrafią działać w różnorodnych środowiskach — nie tylko w grach. Oznacza to krok w kierunku tworzenia inteligentniejszych i bardziej pomocnych asystentów, którzy mogą znaleźć zastosowanie w realnym świecie i wykonać jeszcze bardziej złożone zadania, dzięki długoterminowemu myśleniu strategicznemu.