W świecie technologii, szczególnie w dziedzinie robotyki, dokonuje się ciągły postęp. Najnowsze badania przeprowadzone przez Google DeepMind rzucają światło na przyszłość robotyki, prezentując zaawansowane systemy: AutoRT, SARA-RT i RT-Trajectory. Te innowacje są krokiem naprzód w dążeniu do stworzenia bardziej zdolnych i wszechstronnych robotów.
Samodzielne zbieranie danych
Pierwszy z nowatorskich systemów, AutoRT, umożliwia grupom robotów samodzielne gromadzenie danych szkoleniowych w nieznanych środowiskach. Łączy on w sobie model języka wizualnego (VLM) z dużym modelem językowym (LLM), dzięki czemu maszyny mogą rozpoznawać otoczenie i wykonywać różnorodne zadania, które najpierw są filtrowane, w celu odrzucenia tych niebezpiecznych lub niewykonalnych. W praktyce, AutoRT kierował około 20 robotami jednocześnie, zbierając ponad 77000 sesji obejmujących 6650 unikalnych zadań.
Natomiast SARA-RT to system przekształcający modele, takie jak miliardowy parametr RT-2, w szybsze i równie skuteczne wersje. Wykorzystuje nową metodę „up-training” do zmiany mechanizmów uwagi o złożoności kwadratowej na liniowe, co znacznie redukuje obciążenie obliczeniowe. Wykorzystanie go zwiększyło dokładność RT-2 o 10,6% i przyspieszyło podejmowanie decyzji o 14%.
RT-Trajectory dodaje do danych szkoleniowych „szkice trajektorii” – uproszczone do 2D kontury ruchów robota. Dzięki temu mogą interpretować instrukcje w kontekście otoczenia i skuteczniej generalizować umiejętności. W testach, podwoił on o 63% wskaźnik sukcesu istniejących metod w przypadku niewidocznych zadań.
Kierunek przyszłości
Chociaż przedstawione systemy są jeszcze prototypami badawczymi, to wskazują na zintegrowane podejście Google DeepMind do tworzenia bardziej zdolnych maszyn. Integracja wieloetapowego zbierania danych przez AutoRT, efektywności SARA-RT i generalizacji ruchów RT-Trajectory obiecuje przyszłość, w której będą one w stanie samodzielnie zbierać informacje, szybko je przetwarzać i dopasowywać umiejętności do nowych sytuacji.
Zbliżają nas do momentu, w którym będą integralną częścią naszego życia codziennego, oferując wsparcie w obowiązkach. Opisane badania wnoszą znaczący wkład w tę rewolucję, otwierając nowe możliwości i perspektywy dla przyszłych pokoleń robotów.