Sztuczna Inteligencja ma nieskończenie wiele zastosowań. Od (teoretycznie) prostych systemów podrzucających nam rekomendacje filmów, czy seriali, po zaawansowane algorytmy potrafiące udawać człowieka w sposób praktycznie perfekcyjny. Microsoft wykorzystuje AI w całkowicie inny sposób. Oparty na Azure AI syntezator mowy pozwala na nagranie realistycznie brzmiących wypowiedzi, bez udziału człowieka.
Królik Bugs i Duolingo
Opisywany syntezator mowy od Microsoftu nie jest technologią nową w świecie Sztucznej Inteligencji. Custom Neural Voice, bo tak nazywa się ta usługa, wykorzystywana jest już przez wiele firm, do wielu różnych celów. Nagrania stworzone przez ten algorytm usłyszeć mogą klienci sieci AT&T, w której to aplikacji przemówi do nich dobrze znany Królik Bugs.
Wypowiedzi tego sympatycznego długoucha generowane są na bieżąco przez Sztuczną Inteligencję, która z wykorzystaniem ponad 2000 nagranych wcześniej kwestii jest w stanie dopasować jego głos do każdego wprowadzonego w system tekstu. Microsoft Custom Neural Voice trafił również do popularnego serwisu Duolingo, gdzie głosem AI przemówić mogą do nas specjalne postacie, mające ułatwić i zachęcić nas do dalszej nauki.
Microsoft otwiera się na innych
Jak wypowiadają się przedstawiciele Microsoft, Custom Neural Voice (będący częścią usługi Azure AI Speech) jest technologią przełomową i znacznie lepszą od tych oferowanych przez konkurencję. Wykorzystanie AI do stworzenia syntezatora mowy pozwala na uzyskanie bardzo zadowalających i realistycznie brzmiących efektów, z praktycznie każdego wybranego przez siebie głosu. Jedynym wymogiem jest dostarczenie wystarczającej ilości próbek, na podstawie których stworzyć można odpowiedni model.
Po przetestowaniu w bojach swojej technologii, Microsoft zdecydował o udostępnieniu usługi Custom Neural Voice (prawie) wszystkim chętnym. Dlaczego prawie? Jest bowiem jeden haczyk – na ten moment zainteresowani mogą jedynie poprosić o dostęp Microsoft, który sam podejmie decyzję. Jak można się domyślić, tak potężna i wiarygodnie brzmiąca usługa mogłaby wywołać bardzo duże szkody w rękach ludzi, chcących wykorzystać ją do nieodpowiednich celów. Podszywanie się pod innych poprzez rozmowy telefoniczne byłoby czymś prostym i bardzo niebezpiecznym.