Inteligentna laska dla niewidomych NextGuide (Źródło:youtube)
Inteligentna laska dla niewidomych NextGuide (Źródło: youtube)

Prezentacje Google oraz PowerPoint będą mogli „oglądać” niewidomi

Naukowcy z Waszyngtonu opracowali nowe rozszerzenie oprogramowania zintegrowane z narzędziami takimi, jak Prezentacje Google czy Microsoft PowerPoint. Jego zadaniem jest wspomaganie niewidomych w odczytywaniu oraz tworzeniu prezentacji. Jak to działa?

Problematyka odczytu prezentacji przez niewidomych

Czytniki ekranu to programy komputerowe dedykowane dla osób niewidomych, które w pewnym sensie pokonują problemy związane z brakiem widzenia. Ich zadaniem jest rozpoznanie oraz przeprowadzenie interpretacji tekstu, który pojawia się na ekranie komputera, a następnie przekazanie zebranych informacji w sposób głosowy lub za pomocą urządzenia brajlowskiego.

O ile ten rodzaj oprogramowania może na co dzień się sprawdzać, pomagając zrozumieć przede wszystkim lity tekst, o tyle w prezentacjach jest często zawodny. Programy takie, jak Prezentacje Google czy Microsoft PowerPoint w sporej części przypadków do pracy wykorzystują tzw. porządek Z, czyli sposób ułożenia obiektów na slajdzie. Gdy czytnik realizuje odczyt porusza się jednak linia po linii, przez co nie jest w stanie przekazać niewidomemu użytkownikowi odpowiedniej kolejności kształtów, a nawet tekstu. Dlatego też naukowcy z Uniwersytetu Waszyngtońskiego postanowili sprostać temu wyzwaniu.

Prezentacje Google z rozszerzeniem A11yBoard dla niewidomych (źródło: Uniwersytet Waszyngtoński)
Prezentacje Google z rozszerzeniem A11yBoard dla niewidomych (źródło: Uniwersytet Waszyngtoński)

Rozwiązaniem badaczy było opracowanie rozszerzenia programu w postaci przeglądarki lub aplikacji na urządzenia mobilne, które pozwoli osobom niewidzącym swobodniej i sprawniej poruszać się po poszczególnych slajdach oraz ich układach.

Prezentacje Google łatwiejsze w użytku dla niewidzących

Stworzone rozszerzenie zostało nazwane A11yBoard i pozwala na wprowadzenie osoby niewidomej w interakcję z prezentacją. Oznacza to, że użytkownik może klikać w poszczególne części ekranu, aby dowiedzieć się, w którym miejscu ulokowano dany obiekt oraz tekst. Czytnik natomiast, poza przekazaniem treści tekstowych, udzieli także informacji na temat kształtu czy koloru poszczególnych części układów, zawartych na slajdzie. Dzięki nowemu rozszerzeniu niewidomi zyskają też dostęp do obszaru roboczego, co sprawi, że będą mogli także stać się zaawansowanymi autorami slajdów.

Prace nad prototypem A11Board rozpoczęły się już w kwietniu br., jednak naukowcy rozwijali narzędzie w taki sposób, aby mogło zostać zintegrowane z jednym z najbardziej popularnych programów do tworzenia slajdów, a więc z programem Prezentacje Google.

Wynalazek został już przetestowany, ale nie jest jeszcze jednak dostępny publicznie. Badacze mają zamiar zintegrować stworzone oprogramowanie również z dużym modelem językowym sztucznej inteligencji, takim, jak GPT.