język

Jak AI uczy się języka bez pomocy człowieka

Niezależne grono naukowców pracujących nad projektami AI stworzyło dwujęzyczną sztuczną inteligencję, która może nauczyć się nowego języka bez korzystania ze słownika, a nawet całkowicie bez interwencji człowieka. To niezwykłe osiągnięcie.

Niemożliwe stało się możliwe

Wyobraź sobie, że dajesz komuś kilka różnych książek po chińsku i arabsku, a następnie prosisz o ich przetłumaczenie z jednego języka na drugi. Dla człowieka jest to niemożliwe, nieprawdaż? Komputer jednak może to zrobić.

Te słowa wypowiedział Mikel Artetxe, inżynier na Uniwersytecie Kraju Basków w San Sebastiàn w Hiszpanii. Jest współautorem artykułu naukowego opublikowanego na arXiv, który opisuje model nienadzorowanego uczenia maszynowego, zdolny do tłumaczenia bez użycia słownika. System ten działa również bez tekstu równoległego w innym języku.

Jak AI uczy się języka bez pomocy człowieka
Jak działa ten model AI / fot. arXiv

Inny artykuł naukowy, całkowicie niezależny, lecz wykorzystujący tę samą technikę, jest dziełem Guillaume’a Lample’a, francuskiego inżyniera pracującego w dziale sztucznej inteligencji Facebooka. W obu przypadkach badacze wykazują, że model AI może nauczyć się tłumaczenia w danym języku bez „zaglądania” do słownika.

W ostatnich latach osiągnęliśmy ogromny postęp w tłumaczeniu maszynowym dzięki sieciom neuronowym. Jednak ten rodzaj sztucznej inteligencji wymaga dużej ilości danych do trenowania. Tłumaczenie było dotychczas wynikiem nadzorowanego uczenia się, podczas którego maszyna przyjmuje jakieś założenie, a następnie otrzymuje prawidłową odpowiedź od człowieka, co pozwala jej odpowiednio dostosować sposób przetwarzania danych.

Ta metoda jest skuteczna w przypadku powszechnie używanych języków, na przykład angielskiego lub francuskiego, dla których dostępnych jest wiele równoległych (referencyjnych) dokumentów. Działa jednak znacznie gorzej w przypadku niepopularnych języków, które nie oferują takiego zasobu.

Nauka języka jak nauka geografii

W przypadku nowych metod eksperci użyli nienadzorowanego uczenia maszynowego. W tym celu oparli się na stałych relacjach między słowami, niezależnych od języka. Na przykład, słowo stół jest często używane razem ze słowem krzesło. Następnie urządzenie mapuje te połączenia dla każdego języka, podobnie jak w atlasie drogowym, w którym słowa zastąpiłyby nazwy miast. W ten sposób uzyskuje dwujęzyczny słownik od zera.

Jak AI uczy się języka bez pomocy człowieka
Przykładowe tłumaczenia z tekstem równoległym (referencyjnym) / fot. arXiv

Oba systemy AI są w stanie tłumaczyć nie tylko pojedyncze słowa, ale także pełne zdania. Aby to zrobić, stosuje się dwie techniki treningowe. Pierwsza, zwana back translation (tłumaczenie zwrotne), polega na tłumaczeniu zdania z jednego języka na inny, a następnie tłumaczeniu go ponownie na język oryginalny. Jeśli tłumaczenie zwrotne nie jest identyczne z oryginałem, sieć neuronowa odpowiednio zmienia swoje parametry, aby uzyskać dokładniejszy wynik.

Druga technika, zwana denoising (można ją przetłumaczyć jako „redukcja szumu”), jest zasadniczo podobna do translacji zwrotnej. Polega na dodaniu lub usunięciu słów ze zdania, a następnie przetłumaczeniu go. W ten sposób buduje się zdanie od początku.

Dzięki połączeniu tych dwóch technik naukowcy uzyskali najlepsze wyniki. W sercu obydwu systemów, Mikela Artetxe i Guillaume’a Lample’a, znajduje się etap, który tworzy bardziej abstrakcyjną reprezentację zdania przed przetłumaczeniem go na inny język. Ta zdolność do abstrakcyjnego (ludzkiego) myślenia jest kluczowym elementem. Zapytani o taką możliwość,  dwaj badacze potwierdzili, że, integrując wyżej wymienione warianty swoich technik, mogliby doprowadzić do rewolucji sposobu działania sztucznej inteligencji.

Nienadzorowane uczenie maszynowe przyszłością AI

Oba systemy porównano w testach tłumaczeń angielsko-francuskich, sporządzonych na podstawie bazy 30 milionów zdań. Każdy z nich uzyskał 15 punktów w jednym kierunku (angielski-francuski) i drugim (francuski-angielski). W tym samym czasie Tłumacz Google uzyskał 40, lecz usługa ta korzysta z uczenia nadzorowanego. Ludzcy tłumacze przewodzą z wynikiem 50 punktów. Przedstawiona metoda bez nadzoru wciąż odbiega od tych poziomów dokładności, ale okazuje się, że jest o wiele lepsza niż tłumaczenie słowo w słowo, a może rozwijać się sama.

Chociaż system ten jest jeszcze w powijakach, to z pewnością będziemy o nim jeszcze wiele słyszeli. A sam fakt, że maszyna może nauczyć się tłumaczenia bez interwencji człowieka, jest już ogromnym krokiem do przodu. Czyżby Tłumacz Google musiał zejść z tronu?