Meta AI NLLB-200 tłumaczenie maszynowe
fot. Meta

Sztuczna inteligencja nauczyła się 200 języków. I to nie tylko tych najpopularniejszych

Meta chwali się pierwszymi osiągnięciami swojego nowego AI, które potrafi tłumaczyć treści w ponad 200 językach w czasie rzeczywistym. Najciekawszy jest w tym wszystkim fakt, że firma nie skupia się wyłącznie na tych najpopularniejszych, z którymi bez problemu radzą sobie inne dostępne narzędzia.

Meta stworzyła AI dla mało popularnych języków

Kilka miesięcy temu Meta informowała, że pracuje nad sztuczną inteligencją, która będzie w stanie zapobiec cyfrowemu wykluczeniu osób i społeczności mówiących w mało popularnych językach. Podano wówczas, że dotychczasowe translatory nie obejmują specyficznych odłamów języków, które są rzadziej wykorzystywane lub nie wykorzystują pisma i są nauczane wyłącznie ustnie.

Uwzględnienie każdego z nich w swoim oprogramowaniu nie jest proste, lecz Meta małymi kroczkami zmierza do celu. Projekt No Language Left Behind, który wystartował pół roku temu, przyniósł już pierwsze efekty. Twórcom Facebooka udało się stworzyć model sztucznej inteligencji, nazwany NLLB-200, który umożliwia tłumaczenie treści w czasie rzeczywistym.

Jak sugeruje nazwa, sztuczną inteligencję nauczono aż 200 języków, pośród których znalazły się zarówno te największe – np. angielski, hiszpański, rosyjski czy chiński – jak również mało popularne języki i dialekty. Firma skupiła się na dostosowaniu modelu AI do tłumaczenia maszynowego lokalnych języków wykorzystywanych w Azji i Afryce, w rezultacie osiągając dość dokładne wyniki. Tworząc sztuczną inteligencję zadbano o ominięcie przetwarzania treści na angielski, a dopiero następnie na język docelowy – wszystkie tłumaczenia są wykonywane bezpośrednio, co zwiększa ich poprawność.

Wysoka dokładność i ambitne plany

Meta chwali się, że NLLB-200 potrafi tłumaczyć 55 afrykańskich języków (w tym np. kamba i kikuju, używane w Kenii), a jego dokładność była średnio o 44% wyższa, niż w przypadku innych rozwiązań dostępnych na rynku. W niektórych dialektach wykorzystywanych w krajach afrykańskich oraz w Indiach nowe AI było o 70% dokładniejsze w tłumaczeniu od konkurencyjnych narzędzi.

Jest to naprawdę obiecujący wynik, a dodanie obsługi kolejnych języków może stanowić spory kamień milowy technologii tłumaczenia maszynowego. 200 języków to sporo, lecz na całej planecie mówi się w ponad 7000 języków – i to nie licząc dialektów oraz etnolektów! Meta ma przed sobą długą drogę, lecz z pewnością warto wyczekiwać rezultatów.

Firma udostępniła model NLLB-200 w formie otwartego źródła oraz ogłosiła, że twórcy najlepszych rozwiązań wykorzystujących to AI powalczą o łączne nagrody w wysokości 200 tysięcy dolarów. Meta, rzecz jasna, pragnie by technologie te były wdrożone przede wszystkim w  jej własnych rozwiązaniach, takich jak Instagram czy kanał aktualności na Facebooku.

Równocześnie firma nawiązała współpracę z Wikimedia Foundation, pragnąc rozszerzyć dostępność treści w niektórych językach, wykorzystując tłumaczenie maszynowe. Firma zaznacza, że na Wikipedii w języku lingala, którym posługuje się około 45 milionów osób, jest około 3260 artykułów, natomiast szwedzka wersja encyklopedii zawiera ponad 2,5 miliona artykułów, choć szwedzkim posługuje się „zaledwie” 10 milionów osób.

Dzięki NLLB-200 Wikipedia w ponad 20 mało popularnych językach ma zyskać tłumaczenie maszynowe artykułów. Wśród nich znalazło się 10 języków, które nie były obsługiwane przez dotychczasowe narzędzia wykorzystywane w tłumaczeniu stron.

Jeśli chcecie sprawdzić, jak AI radzi sobie z tłumaczeniem maszynowym, możecie udać się na stronę pokazową, gdzie udostępniono kilka historyjek dla dzieci, napisanych w rzadko używanych językach. W chwili obecnej można je przetłumaczyć na 15 wybranych języków, wśród których nie ma polskiego, lecz niebawem pojawi się ich znacznie więcej.