Współczesna robotyka rozwija się w szybkim tempie, a jednym z jej głównych wyzwań jest nauczanie robotów różnych umiejętności, które pozwolą im być użytecznymi w realnym świecie. Toyota postanowiła stawić czoła temu wyzwaniu, wykorzystując innowacyjną metodę opartą na sztucznej inteligencji, która przyspiesza ten proces. Dlaczego firma motoryzacyjna inwestuje w „przedszkole dla robotów” i jakie to ma znaczenie dla przyszłości robotyki?
Toyota i roboty – nowa era nauczania
Firma, znana głównie z produkcji samochodów, nie jest tylko liderem w dziedzinie motoryzacji. Toyota Research Institute (TRI) pracuje nad rozwijaniem robotów zdolnych do wykonywania różnych zadań, takich jak krojenie warzyw czy przygotowywanie posiłków. Co więcej, używa nowej metody opartej na AI w celu przyśpieszenia tego zadania.
TRI ogłosiło, według siebie, „przełomową” metodę uczenia robotów nowych umiejętności zręcznych, wymagających precyzyjnego dotyku, takich jak nalewanie płynów czy posługiwanie się miękkimi przedmiotami. Twierdzą, że wykorzystali już ją do szybkiego nauczenia maszyn ponad 60 umiejętności, w tym obsługi miksera ręcznego, odwracania naleśników i umieszczania naczyń na suszarce. Ich cel to osiągnięcie 200 umiejętności do końca 2023 r. i 1000 do końca 2024 r.
Nowa metoda skupia się na „haptic demonstrations”, czyli nauczaniu za pomocą manipulacji sensorycznej. Proces ten polega na ręcznym sterowaniu robotem przez człowieka za pomocą specjalnie opracowanego interfejsu teleoperacyjnego. Dostarcza on informacje zwrotne operatorowi, co oznacza, że czuje kontakt maszyny z otoczeniem.
Osoba sterująca zazwyczaj wielokrotnie demonstruje nowe zadanie przez godzinę lub dwie, powtarzając je od kilkudziesięciu do kilkuset razy, podczas gdy kamery i sensory hapticzne (dotykalne) rejestrują cały proces. Następnie dane są przekazywane do modelu sztucznej inteligencji TRI, który uczy się za pomocą polityki dyfuzji, czyli podejścia opracowanego przez badaczy z Uniwersytetu Columbia.
Ta technika jest już stosowna w niektórych sztucznych inteligencjach tekstowo-graficznych, takich jak Stable Diffusion i DALL-E 2. Jednak w tym przypadku AI generuje konkretne akcje fizyczne dla robota na podstawie danych sensorycznych.
Nasza zwykła procedura polega na nauczaniu robota po południu, pozwalając mu uczyć się przez noc, a następnego ranka jest w stanie wykonywać nowe zadanie.
Ben Burchfiel
Dlaczego szybkie nauczanie robotów to priorytet?
Otóż wiele z firm ma ambitny cel, aby stworzyć ogólnego robota, który może wejść do naszych miejsc pracy lub domów i szybko nauczyć się wykonywać nowe zadania. Jednak aby to osiągnąć, potrzebujemy szybkiej i efektywnej metody szkolenia, która skutecznie napędzi te maszyny.
Istnieje wiele obiecujących technik, takich jak pokazywanie sztucznej inteligencji demonstracji wideo czy nagradzanie jej „smakołykami” np. dodatkowymi algorytmami czy danymi, tak jak przy szkoleniu psa.
Póki co jednak nie znaleziono złotej metody, która będzie w 100% spełniała swoje zadania.