AI
AI, sieć, źródło: Pixabay

LookHere – nowy system uczenia maszynowego z Tokio

Uczenie maszynowe, czyli ML, to proces polegający na samodzielnej nauce maszyn, która pozwoli na stworzenie zaawansowanego obszaru sztucznej inteligencji. Często jest to pracochłonne i trudne. Naukowcy z Uniwersytetu w Tokio znaleźli sposób na uproszczenie uczenia maszyn – zobaczcie jak!

Trudności w ML, którym miałoby sprostać LookHere

Odpowiednie „nauczenie” urządzeń, działających w oparciu o sztuczną inteligencję (AI), niejednokrotnie jest trudne i pracochłonne, nawet dla doświadczonych naukowców i badaczy. Często pojawiającym się problemem w nauczaniu maszyn jest problem z wyizolowaniem danego obiektu, który powinien bardziej „zainteresować” urządzenie i wyróżnić je spośród otoczenia. Dlatego też nauka urządzenia wydłuża się, gdyż obiekty znajdujące się w tle niejako „rozpraszają” maszynę.

Naukowcy z Tokio postanowili znaleźć metodę, która umożliwi urządzeniom samodzielne oddzielenie tła od obiektów, będące najważniejszym przedmiotem badania. Nowy system został nazwany LookHere i ma pokonać problemy związane z mało efektywnym uczeniem się, poprzez skrócenie czasu i pokonanie ograniczeń związanych z niedoborem wiedzy technicznej.

Na czym polega LookHere?

System LookHere opiera się o gesty rąk różnych użytkowników, które zostały zaprezentowane do kamery, tak, aby obraz mógł zostać przetworzony, a znaczenie danego przedmiotu było dla maszyny uwydatnione i podkreślone. To przetworzenie obrazu, nim zostanie dołączony do utworzonego przez maszynę modelu, nazywane jest HuTics.

„W typowym scenariuszu uczenia obiektów ludzie mogą trzymać obiekt przed kamerą i poruszać nim, aby komputer mógł go przeanalizować pod każdym kątem, aby zbudować model.”

doktorant Zhongyi Zhou
Model tworzony przez system HuTic i LookHeres
Model tworzony przez system HuTic i LookHere, źródło: Uniwersytet w Tokio

„Pomysł jest dość prosty, ale wdrożenie było bardzo trudne. Każdy jest inny i nie ma standardowego zestawu gestów rąk. Dlatego najpierw zebraliśmy 2040 przykładowych filmów ze 170 osobami prezentującymi obiekty do kamery w HuTics. Zasoby te zostały opatrzone adnotacjami, aby zaznaczyć, co było częścią obiektu i jakie części obraz były tylko rękami osoby.”

doktorant Zhongyi Zhou

LookHere pozwala na budowę modeli aż 14 razy szybciej w porównaniu do innych, już istniejących systemów. Na ten moment LookHere wykorzystywany jest do zbierania danych dotyczących przedmiotów fizycznych, jednak jedynie w formie danych wizualnych.

Naukowcy jednak sugerują, że poszerzenie technologii jest możliwe.