sztuczna inteligencja AI (źródło: Pixabay)
Sztuczna inteligencja AI (źródło: Pixabay)

Sztuczna inteligencja pomaga zbierać dane w Data Commons

Google ulepsza zbiór publicznie dostępnych danych sukcesywnie gromadzonych w bibliotece Data Commons. Sztuczna inteligencja wspomoże wyszukiwanie, m. in. dzięki szerokim możliwościom wprowadzania zapytań w języku naturalnym.

Rozwój danych otwartego zbioru Data Commons

Zbiory generowanych danych przez państwa z całego świata, dotyczących różnorodnej tematyki, są nieustannie powiększane, jednak – choć uznawane są często za publiczne – odnalezienie ich w internecie jest trudne. Wśród gromadzonych danych można znaleźć parametry klimatyczne, epidemie, choroby i mnóstwo innych wskaźników, które mimo wszystko są trudno dostępne.

Dlatego też Google stworzył inicjatywę w postaci Data Commons, aby ułatwić odnalezienie i korzystanie z licznych, publicznych danych. Jest to możliwe dzięki wspólnym działaniom wielu instytucji państwowych oraz zasobom gromadzonym przez wiele państw, jednak w wewnętrznych bibliotekach, w różnych formatach i czasach.

Teraz technologiczny gigant ma zamiar ulepszyć stworzony system, który zbierze i uporządkuje ogromną ilość danych publicznych w jednym miejscu, ułatwić ich wykorzystanie, podobnie jak dotychczas działa wyszukiwarka Google czy Mapy.

Sztuczna inteligencja w Data Commons (źródło: Google)
Sztuczna inteligencja w Data Commons (źródło: Google)

Sztuczna inteligencja ulepsza język naturalny

Użyteczność Data Commons rośnie z każdym rokiem, dzięki wykorzystaniu publicznych danych, udostępnianych przez wiarygodne źródła. Biblioteka ta korzysta również z dużych modeli językowych LLM, które pozwoliły na opracowanie interfejsu, działającego w języku naturalnym.

Oznacza to, że sztuczna inteligencja pozwala użytkownikowi na zadawanie pytań w prosty dla danego języka sposób. Wyniki wyszukiwane są wraz z oryginalnym źródłem, jednak ich treść nie jest generowana. Data Commons nie jest właścicielem żadnych danych, a Google nadal zachęca instytucje publiczne, aby zaangażowały się i dołączyły do prac związanych z biblioteką otwartego źródła, by zakres informacji mógł zostać powiększony.