W świecie robotyki dokonał się przełom. Dzięki zespołowi naukowców z Japonii, powstał humanoidalny robot, napędzany przez GPT-4 – najnowszy model sztucznej inteligencji, opracowany przez OpenAI. Zaprezentowano nie tylko technologiczną nowość, ale także nowe horyzonty w interakcji człowieka z maszyną.
Niezwykłe możliwości Alter3
W ciągu ostatniego roku technologia stojąca za ChatGPT była wykorzystywana do generowania wszelakich treści, od mniej poważnych dowcipów po materiały wykorzystywane do pracy. Teraz, GPT-4 rozszerza swoje możliwości na rozumienie wideo, audio, obrazów, a nawet – ruchu.
Do tej pory, kontrola ruchu robotów, taka jak poruszanie się, wykraczała poza zakres dużych modeli językowych, ponieważ była zależna od sprzętu i nie była uwzględniona w danych szkoleniowych. Zespół z Uniwersytetu Tokijskiego znalazł sposób na przekształcenie wyrazu ludzkiego ruchu na kod, który robot mógł zrozumieć.
Dzięki współpracy z GPT-4, maszyna zdolna jest do przyjmowania różnych pozycji, takich jak na przykład pozowanie do selfie czy udawanie ducha, a to wszystko dzieje się niemalże spontanicznie. Bez wcześniejszego wgrywania danych. Maszyna ma jednak mały mankament – brak robotycznych nóg, gdyż dolna część jego korpusu jest przymocowana do stojaka.
Jak działa robot wpierany przez ChatGPT?
Robot może generować sekwencje działań w czasie, bez konieczności programowania każdej części ciała przez deweloperów. Uczy się poruszać podobnie jak małe dziecko, od pełzania po chodzenie. Użytkownicy mogą również dostosowywać pozycję robota, pomagając mu zrozumieć różnicę między gestami.
Co ciekawe, Alter3 potrafi odpowiedzieć na polecenia człowieka. Przykładowo, gdy ten poprosi go o zrobienie sobie selfie, wtedy robot wykona serię wywołań do ChatGPT-4, w tym zapyta sztuczną inteligencję, na czym dokładnie polega ta czynność. Bot następnie zamieni to na kod Pythona, który robot będzie mógł zrozumieć i wykorzystać do wykonania niezbędnych ruchów w związku z tym poleceniem.
Co Dalej z Alter3?
Zespół, odpowiedzialny odkrycie w zakresie konwersji tekstu na ruch, planuje udostępnić swoje wyniki do wykorzystania w innych humanoidalnych robotach. Według nich, jest to znaczący postęp w rozwoju robotów. Integracja modeli językowych z możliwościami fizycznymi robotów, otwiera drogę do bardziej zaawansowanych, autonomicznych systemów zdolnych do interakcji z ludźmi w sposób, który do tej pory wydawał się należeć wyłącznie do świata fantazji.
A to zapewne zaledwie początek nowej ery w rozwoju robotyki, gdzie granice możliwości są stale przesuwane.