Meta ogłosiła wprowadzenie pierwszego, multimodalnego i wielojęzycznego tłumacza sztucznej inteligencji. Dzięki SeamlessM4T możliwe jest bezproblemowe komunikowanie się, zarówno poprzez tekst, jak i mowę, pomiędzy ludźmi dotkniętymi barierą językową.
Multimodalny i wielojęzyczny tłumacz AI
Uniwersalny tłumacz AI firmy Meta pozwala na przetworzenie mowy na tekst, mowy na mowę, a także tekstu na mowę i tekstu wprost na tekst. W większości przypadków proces ten obejmuje prawie sto języków, ograniczenia pojawiają się tylko w przypadku tłumaczenia tekstu na mowę, gdzie wśród wyjściowych języków można wymienić ich 36.
SeamlessM4T został udostępniony jako licencja badawcza, dzięki czemu naukowcy i programiści mogą w prosty sposób wykorzystać zebrane w SeamlessAlign metadane. Baza ta stanowi ogromny zbiór danych obejmujących tłumaczenia multimodalne, ulokowane w 270 tysiącach godzin nagrań.
Uniwersalny tłumacz, który pokona bariery językowe
Naukowcy Meta wierzą, że opracowany system multimodalny pozwoli na ulepszenie porozumiewania się i pokonanie barier językowych pomiędzy ludźmi. Pomimo ogromnego kroku w przód, firma ma jednak świadomość, iż ogłoszony system obejmuje zaledwie niewielką liczbę języków z całego świata.
Jak twierdzi przedsiębiorstwo, stworzony uniwersalny tłumacz jest kontynuacją zeszłorocznego modelu tłumaczenia maszynowego tekstu na tekst, który znany jest pod nazwą No Language Left Behind (NLLB). Dzięki niemu możliwe jest przeprowadzenie interpretacji w ponad 200 językach, a jego możliwości zostały już zintegrowane z jedną z największych encyklopedii internetowych o nazwie Wikipedia. Narzędziem wspomagającym tworzenie SeamlessM4T była także usługa Massively Multilingual Speech, dzięki której możliwe jest identyfikowanie języka, a także rozpoznawanie oraz syntetyzowanie mowy.