Google DeepMind Robotics (źródło: Google DeepMind)
Google DeepMind Robotics (źródło: Google DeepMind)

Google uczy roboty, jak samodzielnie zbierać informacje i na nie reagować

W świecie technologii, szczególnie w dziedzinie robotyki, dokonuje się ciągły postęp. Najnowsze badania przeprowadzone przez Google DeepMind rzucają światło na przyszłość robotyki, prezentując zaawansowane systemy: AutoRT, SARA-RT i RT-Trajectory. Te innowacje są krokiem naprzód w dążeniu do stworzenia bardziej zdolnych i wszechstronnych robotów.

Samodzielne zbieranie danych

Pierwszy z nowatorskich systemów, AutoRT, umożliwia grupom robotów samodzielne gromadzenie danych szkoleniowych w nieznanych środowiskach. Łączy on w sobie model języka wizualnego (VLM) z dużym modelem językowym (LLM), dzięki czemu maszyny mogą rozpoznawać otoczenie i wykonywać różnorodne zadania, które najpierw są filtrowane, w celu odrzucenia tych niebezpiecznych lub niewykonalnych. W praktyce, AutoRT kierował około 20 robotami jednocześnie, zbierając ponad 77000 sesji obejmujących 6650 unikalnych zadań.

System AutoRT (źródło: auto-rt.github.io)
System AutoRT (źródło: auto-rt.github.io)

Natomiast SARA-RT to system przekształcający modele, takie jak miliardowy parametr RT-2, w szybsze i równie skuteczne wersje. Wykorzystuje nową metodę „up-training” do zmiany mechanizmów uwagi o złożoności kwadratowej na liniowe, co znacznie redukuje obciążenie obliczeniowe. Wykorzystanie go zwiększyło dokładność RT-2 o 10,6% i przyspieszyło podejmowanie decyzji o 14%.

System SARA-RT (źródło: https://arxiv.org/pdf/2312.01990.pdf)
System SARA-RT (źródło: arxiv.org)

RT-Trajectory dodaje do danych szkoleniowych „szkice trajektorii” – uproszczone do 2D kontury ruchów robota. Dzięki temu mogą interpretować instrukcje w kontekście otoczenia i skuteczniej generalizować umiejętności. W testach, podwoił on o 63% wskaźnik sukcesu istniejących metod w przypadku niewidocznych zadań.

System RT-Trajectory (źródło: rt-trajectory.github.io)
System RT-Trajectory (źródło: rt-trajectory.github.io)

Kierunek przyszłości

Chociaż przedstawione systemy są jeszcze prototypami badawczymi, to wskazują na zintegrowane podejście Google DeepMind do tworzenia bardziej zdolnych maszyn. Integracja wieloetapowego zbierania danych przez AutoRT, efektywności SARA-RT i generalizacji ruchów RT-Trajectory obiecuje przyszłość, w której będą one w stanie samodzielnie zbierać informacje, szybko je przetwarzać i dopasowywać umiejętności do nowych sytuacji.

Zbliżają nas do momentu, w którym będą integralną częścią naszego życia codziennego, oferując wsparcie w obowiązkach. Opisane badania wnoszą znaczący wkład w tę rewolucję, otwierając nowe możliwości i perspektywy dla przyszłych pokoleń robotów.