sztuczna inteligencja
fot. Unsplash.com

Sztuczna inteligencja YouTube’a poprawi dźwięk w wideo

Sztuczna inteligencja w serwisie YouTube weźmie się za poprawkę dźwięku w Stories umieszczanych we wspomnianej usłudze. Google pochwaliło się nową funkcjonalnością oznaczoną jako „Looking to Listen”. Oprócz poprawy dźwięku, rozwiązanie pozwala także na wychwycenie wokalu w tłumie.

Google prezentuje nowe rozwiązania z zakresu sztucznej inteligencji, które trafią do serwisu YouTube. W tym przypadku chodzi konkretniej o funkcję „Looking to Listen” wykorzystującą algorytmy, aby poprawić jakość dźwięku. Podczas rozwoju swojego modelu, Google wzięło pod uwagę takie dane, jak między innymi ruchy ust oraz mimika twarzy. Sztuczna inteligencja była uczona przy wykorzystaniu wielu materiałów wideo dostępnych online.

Sztuczna inteligencja YouTube’a zadba o dźwięk

Sztuczna inteligencja stojąca za nową funkcjonalnością nie powstała jednak z dnia na dzień. Całość jest tylko częścią większego projektu, który jest rozwijany przez Google od wielu lat. Co ciekawe, Google pochwaliło się, że algorytmy mogą wykonać wszystkie operacje bezpośrednio na urządzeniu – gigant nie potrzebuje przesyłania danych bezpośrednio na serwer oraz ponownie do użytkownika. Tego typu ulepszenia sprawiły, iż ilość przesyłanych danych zmniejszyła się w niektórych przypadkach ze 120 do nawet zaledwie 6 MB.

Sztuczna inteligencja sprawi, iż przetworzenie filmu w Story zajmującego około 15 sekund zajmie przeciętnemu iPhone’owi zaledwie kilka sekund.

Sztuczna inteligencja sprawi, iż przetworzenie filmu w Story zajmującego około 15 sekund zajmie przeciętnemu iPhone’owi zaledwie kilka sekund.

Google ma wiele danych do analizy

Google twierdzi, iż przeanalizowało takie dane, jak ruch ust, mimika, ale wzięło także pod uwagę inne czynniki. Wśród nich znalazły się między innymi wiek mówcy, tonacja głosu, odcień skóry, widoczność twarzy, pozycja głowy, zarost, obecność okularów i poziom hałasu w tle. To bardzo dużo informacji, które sztuczna inteligencja może wykorzystać do szkolenia swoich algorytmów.

Aby aktywować nową funkcję w YouTube, użytkownicy muszą włączyć opcję oznaczoną jako „Ulepszaj mowę”, która znajduje się w sterowaniu głośnością.

Trzeba przyznać, że wyniki pracy AI są naprawdę imponujące.