Sztuczna inteligencja przechodzi swój prężny rozwój, a technologie wkraczają w wiele aspektów pracy i codziennego korzystania z Internetu. Jedną z marek, która od niemalże ośmiu lat angażuje się w prace nad modelami AI jest Google. Technologiczny gigant z Mountain View pochwalił się kolejnym krokiem w poszerzaniu horyzontów w świecie sztucznej inteligencji i utworzeniem Gemini 1.0.
Innowacyjna technologia dla sztucznej inteligencji
Nowy, multimodalny model językowy był budowany tak, aby z czasem był w stanie rozumieć, tworzyć i łączyć w całość różnego rodzaju informacje. Innowacyjna technologia ma stać się źródłem do generowania treści tekstowych, obrazów, dźwięków, filmów oraz kodu programistycznego.
Opracowany przez Google model może realizować prace na dowolnie wybranym przez użytkownika urządzeniu, od mobilnego, aż po ogromne centra danych. Gemini 1.0 zostało podzielone na trzy części w zależności od zadań, za które są odpowiedzialne. Wariant Ultra jest przeznaczony do realizacji złożonych problemów, Pro najlepiej sprawdzi się w skalowaniu, a Nano dedykowany jest dla sprzętów mobilnych.
Prace Google nad multimodalnym modelem
Gemini 1.0 zostało solidnie przetestowane na wielu płaszczyznach oraz sprawdzone i porównane z osiągnięciami popularnego modelu wykorzystywanego przez produkt Open AI, czyli ChatGPT. Wariant Ultra przewyższa obecnie stosowane duże modele językowe (LLM), a także masowe wielozadaniowe rozumienie języka (MMLU), mając wiedzę w 57 dziedzinach.
Jak twierdzą twórcy nowego modelu, Gemini 1.0 jest w stanie zrozumieć przesyłane dane wejściowe, takie jak tekst czy obrazy, a następnie wyciągnąć właściwe wnioski. Technologia ta może wyodrębnić poszukiwane informacje z ogromnych zasobów, zgromadzonych w setkach tysięcy dokumentów. Pracownicy Google zaznaczają, że nowa propozycja może stać się pomocnikiem w poszukiwaniu odkryć w wielu dziedzinach, od nauki, aż po finanse.
Model Gemini 1.0 wspomoże uczniów w poszukiwaniu rozwiązań trudnych i zaawansowanych prac domowych, a także wyjaśni aspekty z dziedziny matematyki czy fizyki. Co więcej, nowa technologia wesprze w generowaniu, rozumieniu czy wyjaśnianiu programistycznych kodów, tworzonych w językach, takich jak Python, Java, C++ czy Go. Poza tym, model zajmie się też kompleksowym przetwarzaniem i rozumieniem surowego sygnału audio. Gemini 1.0 ma zasilić Barda w przyszłym roku.