Trzy metody nawigacji (blog.ml.cmu.edu)
Trzy metody nawigacji (blog.ml.cmu.edu)

Jak roboty znajdują drogi w naszych domach?

Zastanawiałeś się, jak roboty mogą poruszać się po Twoim domu? Czy mogą nauczyć się, gdzie są schody, jak unikać stołu i jak znaleźć łazienkę? To właśnie pytania, na które starają się odpowiedzieć badacze, rozwijając technologię semantycznej nawigacji, która jest niezbędna do wdrożenia mobilnych robotów w niekontrolowanych środowiskach, takich jak nasze domy, szkoły czy szpitale.

Nawigowanie do obiektów w świecie rzeczywistym

Badanie naukowców dotyczyło głównie nawigowania do celu. Robot rozpoczynał swoje działanie w zupełnie nieznanych mu okolicznościach i musiał znaleźć określony obiekt, na przykład toaletę. W przypadku maszyn jest to wyjątkowo trudne. Wymaga nie tylko zrozumienia przestrzeni, ale także zrozumienia semantycznego sceny, co oznacza identyfikację obiektów, oraz uczenie się priorytetów eksploracji.

Nawigacja robotów przy różnych obiektach (źródło: blog.ml.cmu.edu)
Nawigacja robotów przy różnych obiektach (źródło: blog.ml.cmu.edu)


Aby wypracować skuteczne metody nawigacji, porównano trzy podejścia. Pierwsze z nich, klasyczne, polega na tworzeniu geometrycznej mapy za pomocą czujników przestrzennych. Drugie, end-to-end, przewiduje działania bezpośrednio z surowych obserwacji poprzez sieci neuronowe. Trzecie, modularne, buduje mapę przez rzutowanie przewidywanej segmentacji semantycznej za pomocą głębi.

Robot poznaje niewidoczne środowisko, aby znaleźć obiekt zainteresowania (źródło: blog.ml.cmu.edu)
Robot poznaje niewidoczne środowisko, aby znaleźć obiekt zainteresowania (źródło: blog.ml.cmu.edu)

Analiza otrzymanych wyników

Dlaczego podczas opcji pierwszej maszyna radzi sobie tak dobrze, podczas gdy end-to-end nie? Odpowiedź tkwi w przepaści domenowej między symulacją a rzeczywistością. Mapa semantyczna, na której bazuje podejście modularne, jest wtedy niezmienna, podczas gdy przestrzeń obrazu ma duże różnice domenowe. Dzięki temu transferuje się znacznie lepiej, co widać na wynikach, gdyż roboty korzystające z niej w 90% przypadków odnalazły poszukiwany obiekt.

Robot musi odróżniać wolną przestrzeń od przeszkód (źródło: blog.ml.cmu.edu)
Robot musi odróżniać wolną przestrzeń od przeszkód (źródło: blog.ml.cmu.edu)
Przypadki niepowodzeń nawigacji (źródło: blog.ml.cmu.edu)
Przypadki niepowodzeń nawigacji (źródło: blog.ml.cmu.edu)

Na podstawie przeprowadzonych analiz można zauważyć, że rozbieżności w skuteczności poszczególnych metod wynikają z różnicy pomiędzy tym, co roboty widzą w symulacjach, a tym, co obserwują w rzeczywistości. Metoda modularna zdaje się lepiej radzić sobie z tym rozdźwiękiem.

Nawigacja obiektowa to wciąż rozwijający się obszar badań, jednak już teraz możliwe jest stwierdzenie, że dzięki naukowym odkryciom, roboty będą coraz lepiej radziły sobie z poruszaniem w nieznanym środowisku.