Amazon Alexa to jeden z najpopularniejszych dostępnych asystentów głosowych, dzięki którym wiele czynności, które dotychczas wymagały skorzystania z klawiatury komputera czy smartfona, można wykonać przy pomocy interakcji głosowych. Ze względu na specyfikę języka mówionego, interpretacja ludzkich wypowiedzi jest dość trudna i dość silnie błędogenna. Do ograniczenia pomyłek postanowiono zaprzęgnąć sztuczną inteligencję, która będzie nadawać zapisanym pytaniom formę bardziej przyjazną w interpretacji przez komputer.
Jak zrozumieć mowę milionów ludzi?
O tym, jak trudnym zadaniem jest poprawne zaprogramowanie asystenta głosowego niech świadczy to, jak wiele niedopowiedzeń i niezrozumiałych wypowiedzi powstaje nawet wtedy, gdy rozmawiają ze sobą dwie osoby posługujące się tym samym językiem. Szczególnie dobitnie widać to na przykładzie języka polskiego, który z racji różnych uwarunkowań historycznych i geopolitycznych potrafi się od siebie mocno różnić w zależności od tego, z kim akurat rozmawiamy. O ile z biegiem czasu jesteśmy w stanie przyzwyczaić się do sposobu mówienia drugiej osoby, o tyle komputer, sam z siebie, nie jest w stanie tego zrobić. To właśnie dlatego technologia Amazona została poddana lekcji rozumienia wypowiedzi, bardzo intensywnej lekcji.
30 milionów zapytań
W ramach treningu sztucznej inteligencji ta musiała poprawnie przepisać 30 milionów wypowiedzi, podzielonych na 11 milionów sesji treningowych. Po takim teście przyszła pora na drugi etap, w którym wykorzystano 2,2 miliony par pytanie – odpowiedź. Ostatnim krokiem było porównanie dotychczas funkcjonującego rozwiązania z opracowanym w wyniku treningu poprzez porównanie odpowiedzi na 16 000 zadanych pytań. Według posiadanych informacji, wyniki miały zostać uznane za zadowalające.
Czy naturalna rozmowa z komputerem będzie możliwa już niedługo?
Podejmowane przez poszczególnych producentów próby zmierzają do tego, by z asystentami głosowymi porozumiewać się tak naturalnie, jak to tylko możliwe. Cały czas jednak mówimy o sztucznym tworze, który, choćby był najdoskonalszy, nigdy nie zostanie wyposażony w naturę człowieka. Koegzystencja w tym samym świecie to coś, co zbliża ludzi do siebie i pomaga we wzajemnym zrozumieniu, dodatkowo w dalszym ciągu unikalne zdolności ludzkiego mózgu pozwalają mu znacznie łatwiej adoptować się do nowych okoliczności niż w przypadku komputera. Cóż, do w pełni naturalnej rozmowy jeszcze bardzo daleka droga.
Źródło: Venture Beat