Gracz (źródło: Pixabay)
Gracz (źródło: Pixabay)

Postacie z gier mogą przemówić naszym głosem. Electronic Arts opracowuje nowy patent

Granie w gry wideo to już od dawna nie tylko pasywna rozrywka. Teraz dzięki patentowi wydanemu przez Electronic Arts, gracze zyskają szansę nadania swoim postaciom w grach własnego, unikatowego głosu, który stanie się integralną częścią doświadczenia.

Jak działa technologia przechwytywania głosu?

Generowanie mowy w głosie gracza w grze wideo to patent, który został zgłoszony w październiku 2020 roku, a upubliczniony na początku tego miesiąca. W jego sercu znajduje się moduł syntezatora, który przetwarza dane mówione na cechy akustyczne. Następnie, przy użyciu konwertera, te cechy są łączone z „osadzeniem mówiącego” skojarzonym z graczem, co pozwala na replikację jego głosu do postaci w grze. Ciekawostką jest, że system ten może również uchwycić niewerbalne elementy mowy, takie jak ton, emocje i akcent.

Kolejną zaletą jest to, że informacje wejściowe dla tego systemu mogą przybierać formę tekstu. Gracze mogą wpisywać dialogi, które ich postacie mają wygłosić. To sprawia, że system jest bardziej praktyczny i wszechstronny niż tradycyjne metody, które wymagały obszernych danych nagraniowych mowy.

Przykładowa metoda generowania dźwięku mowy w grze wideo przy użyciu konwertera (źródło: image-ppubs.uspto.gov)
Przykładowa metoda generowania dźwięku mowy w grze wideo przy użyciu konwertera (źródło: image-ppubs.uspto.gov)

Zmiany w tworzeniu postaci

Tradycyjnie, aby nadać postaciom w grach konkretny ton mowy, potrzebne były rozległe nagrania dźwiękowe. Nowa technologia EA pozwala na stworzenie mówiących postaci bez konieczności gromadzenia tak dużych zbiorów danych. To oznacza, że gracze mogą nadać swoim postaciom w grach wyjątkowy, osobisty charakter bez większego wysiłku.

Przykładowa metoda uczenia kodera głośników (źródło: image-ppubs.uspto.gov)
Przykładowa metoda uczenia kodera głośników (źródło: image-ppubs.uspto.gov)

Proces rozpoczyna się od modułu syntezatora, który pobiera dane wejściowe reprezentujące treść mowy. Następnie generuje on źródłowe cechy akustyczne, które przechwytują pożądany głos lub styl z głośnika źródłowego, którym może być inna postać lub aktor.

Diagram blokowy ilustrujący przykładową metodę generowania dźwięku mowy w grze wideo (źródło: image-ppubs.uspto.gov)
Diagram blokowy ilustrujący przykładową metodę generowania dźwięku mowy w grze wideo (źródło: image-ppubs.uspto.gov)

Potencjalne zastosowania tej technologii są ogromne. Osoby grające, będą mogły interaktywnie uczestniczyć w dialogach ze swoimi postaciami, nadając im dźwięk swojej własnej mowy. To może otworzyć zupełnie nowe ścieżki dla rozgrywek opartych na narracji, gdzie postać gracza staje się przedłużeniem samego siebie.

Warto zaznaczyć, że na razie technologia ta jest tylko zastrzeżonym konceptem. Czy i kiedy Electronic Arts wdroży ten system w swoich istniejących lub przyszłych grach, pozostaje wciąż kwestią otwartą.