Niektóre funkcje asystentów głosowych lub innych projektów wykorzystujących sztuczną inteligencję wywołują ciarki. W przypadku jednej z nowości, która ma zawitać do Alexy, ciężko jest mi jednak znaleźć słowa, które określą, w jak wielkim szoku jestem.
Alexa zabrzmi, jak zmarła babcia
Sztuczna inteligencja pojawia się w coraz większej liczbie wykorzystywanych przez nas usług. Amazon zaprezentował podczas swojej ostatniej konferencji re:MARS 2022 szereg nowości związanych z wykorzystaniem nowoczesnych technologii, takich jak właśnie AI oraz asystenci głosowi. Największe zdziwienie wywołała jedna z nowości przeznaczonych dla asystentki głosowej.
Podczas drugiego dnia wydarzenia na scenie pojawił się Rohit Prasad, główny naukowiec Amazonu w sprawie AI Alexy, które zaprezentował funkcję zmiany głosu asystentki i naśladowanie dowolnej osoby. W fragmencie nagrania zaprezentowanym na konferencji była to prośba dziecka o przeczytanie bajki na dobranoc… głosem jego zmarłej babci. Brzmi jak żywcem wyjęte z horroru, lecz to w rzeczywistości prawdziwa funkcja, nad którą pracuje gigant.
Prasad wyjaśnia, że dzięki dodaniu do asystentki głosowej Alexa kilku „ludzkich cech” będzie ona w stanie lepiej trafić do użytkowników zmagających się z pewnymi trudnościami. Pracownik firmy dodał, że w czasie pandemii, przez którą wiele osób straciło swoich bliskich, jest to bardzo ważne. I choć AI nie jest w stanie cofnąć tych tragicznych wydarzeń, z pewnością może pomóc niektórym podtrzymać wspomnienia i przeżyć je jeszcze raz.
Do skorzystania z funkcji ma wystarczyć nawet minutowe nagranie głosu osoby, którą chcemy naśladować. Oznacza to, że wystarczy nam stary filmik lub krótka rozmowa przez telefon by skonfigurować asystentkę do pracy z nową funkcją.
To wcale nie jest nic nowego
Choć opisywana nowość wydaje się niesamowicie przerażająca i niecodzienna, a wielu internautów podziela moje zdanie w tej sprawie, tak naprawdę Amazon nie odkrył koła na nowo. Alexa co prawda trafi do szerokiego grona odbiorców i zaoferuje naśladowanie głosu przeciętnemu Kowalskiemu, lecz branża technologiczna wykorzystuje takie techniki już od pewnego czasu.
Tworzenie tzw. deepfake’ów audio stało się popularne wśród twórców filmów, seriali czy gier. Przykładowo, w dokumencie „W drodze. Film o Anthonym Bourdainie”, opowiadającym o życiu zmarłego w 2018 roku szefa kuchni, wykorzystano sztuczną inteligencję do odwzorowania jego głosu. Pozwoliło to reżyserowi na wprowadzenie dodatkowej warstwy klimatu, sprawiając wrażenie jakoby cytaty z korespondencji były czytane przez samego Bourdaina.
Fani, rzecz jasna, zareagowani na ten zabieg bardzo negatywnie. I prawdopodobnie w taki sam sposób zareagują właściciele głośników z asystentką głosową Amazon Alexa, kiedy nowa funkcja do nich trafi. Na ten moment nie wiemy, kiedy ma to nastąpić.