Google nie zwalnia nawet na moment i płynnie, po przeobrażeniu Barda w Gemini, prezentuje jeszcze nowszy model sztucznej inteligencji niż był dotychczas dostępny. Technologiczny gigant chyba ma zamiar stanowczo i bezwzględnie przebić konkurencję. Zaprezentowany Gemini 1.5 wyróżnia się zwiększoną wydajnością oraz przełomowym rozumieniem długich kontekstów.
Możliwości najnowszego modelu Google
Od wprowadzenia modelu Gemini 1.0 minęły nieco ponad dwa miesiące, teraz Google zdecydował się pokazać nowszą wersję swojej sztucznej inteligencji. Wersja 1.5 zyskała dostęp do ulepszonej, zwiększonej wydajności, a jest to możliwe dzięki zastosowaniu nowej architektury MoE (Mixture-of-Experts). Jego możliwości mają być zbliżone do udostępnionego niedawno Gemini 1.0 Ultra, który jest płatną wersją modelu.
Nowa technologia jest uznawana jako średniej wielkości multimodalny model, który jednak sprawdzi się w przypadku skalowania obszernych zadań. Gemini 1.5 Pro ma obsługiwać funkcję eksperymentalną, pozwalającą sztucznej inteligencji zrozumieć długi kontekst. Model ma okno kontekstowe o standardowym rozmiarze, mieszczące 128 tysięcy tokenów.
W formie testowej udostępniono także wersję wyposażoną w okno, które zmieści milion tokenów. Technologia początkowo skierowana jest jednak do pewnej grupy programistów oraz klientów korporacyjnych. Oznacza to, że sztuczna inteligencja Google może przetworzyć 700 tysięcy słów, 30 tysięcy linii kodu programistycznej, 11 godzin nagrań audio lub też 1 godzinę filmu wideo.
Gemini 1.5 Pro i jego funkcje
Wśród możliwości modelu w wersji 1.5 Pro technologiczny gigant wspomina m.in. o zdolności do analizowania, klasyfikowania czy też podsumowywania dużych ilości danych tekstowych. Jako jeden z przykładów zastosowania technologii Google zaprezentował streszczenie transkrypcji pochodzących z misji kosmicznej Apollo 11, podczas której człowiek po raz pierwszy wylądował na powierzchni Księżyca. ++
Gemini 1.5 Pro był w stanie streścić 402 strony notatek i wyciągnąć wnioski dotyczące rozmów, obrazów czy wydarzeń, jakie sztuczna inteligencja znalazła w obszernym dokumencie. Nowy model może również przeanalizować i podsumować przesłany do niego film.
Gigant z Mountain View wprowadził także przedpremierową wersję eksperymentalnej funkcji rozumienia obszernego tekstu. Została udostępniona w ramach usługi AI Studio oraz platformy Vertex AI. Opcja ta skierowana jest do programistów i może wspomagać w tworzeniu licznych aplikacji, w tym wyszukiwarek czy chatbotów.
Gemini 1.5 Pro dostępne jest wyłącznie w fazie testów i nie wiadomo, kiedy trafi w ręce szerszej publiczności.