Czy asystenci głosowi mogą spełniać swoje zadania jeszcze lepiej? Według Google – jak najbardziej. Firma zamierza wdrożyć do swojego asystenta głosowego zaawansowane funkcje rozpoznawania mowy, dzięki którym Asystent Google nauczy się dokładniej wychwytywać wypowiadane przez użytkowników frazy.
Lepsze rozpoznawanie w Asystencie
Systemy rozpoznawania mowy Asystenta Google mogą zyskać bardzo ważną funkcję, jaką jest Spersonalizowane rozpoznawanie mowy (w oryginale – „Personalized speech recognition”). Zalążki tej opcji odkryto w kodzie aplikacji Wyszukiwarki Google dla systemu Android.
Według opisu, który się tam znalazł, ma to być nowa zakładka w ustawieniach Asystenta, z poziomu której użytkownicy będą mogli włączyć na swoim urządzeniu lepszy system rozpoznawania mowy. Bazować ma on na uczeniu maszynowym, wykorzystującym zapisywane w pamięci urządzenia nagrania audio. Dzięki nowej funkcji ma się zwiększyć skuteczność transkrybowania poleceń, co skróci czas potrzebny na uzyskanie odpowiedzi.
Analiza modelu głosu użytkownika ma przebiegać w pełni lokalnie, na urządzeniu. Na serwery producenta nie będą przesyłane żadne nagrania, a jedynie dane podsumowujące zmiany modelu głosu. Te następnie mają być agregowane i przetwarzane zbiorczo w celu udoskonalenia rozpoznawania u wszystkich użytkowników.
Dzięki temu użytkownicy będą mogli skorzystać z lepszego działania mowy dostosowanego do ich głosu, dykcji i innych czynników, równocześnie zachowując wysoki poziom prywatności swoich wrażliwych danych. Równocześnie jednak Asystent Google będzie nieustannie ulepszany na poziomie globalnym, co pomoże producentowi na tworzenie jeszcze bardziej inkluzywnego produktu dostosowanego do wszystkich.
Jak podaje 9to5Google, spersonalizowane rozpoznawanie mowy ma być opcjonalne, a po jego wyłączeniu zostaną usunięte wszelkie zapisane nagrania. Mimo wszystko, Asystent Google stanie się wtedy mniej dokładny w rozpoznawaniu powtarzalnych fraz, takich jak imiona kontaktów, hasło „Hey Google” czy najczęściej wykorzystywane polecenia.
To nie koniec nowości
Całkiem niedawno producent zapowiedział, że Asystent Google pozwoli zrezygnować z komend „Hey Google” oraz „OK Google” o zacznie bazować na fizycznej obecności użytkownika przed ekranem. Ponadto trwają prace nad stworzeniem rozpoznawania naturalnego sposobu wypowiedzi, gdzie ignorowane są pauzy czy przerywniki w wypowiedziach. Spersonalizowane rozpoznawanie mowy może nieco pomóc w tworzeniu tego rozwiązania.
Na ten moment nie wiemy kiedy najnowsza funkcja trafi do użytkowników i czy będzie dostępna we wszystkich językach. Ciężko ocenić również rzeczywistą przydatność nowej funkcji, lecz miejmy nadzieję, że przełoże się ona na jeszcze lepsze doświadczenia podczas korzystania z Asystenta.