Gemini
Googleov novi AI model čak je 700 puta moćniji nego OpenAI GPT-4
Tekst članka se nastavlja ispod banera
Nema tome puno više od dva mjeseca kako smo na stranicama Buga pisali o tome kako je Google lansirao Gemini, svoj dosad najmoćniji AI model.
Pročitajte još
Prije otprilike tjedan dana kompanija je lansirala i svoj najsnažniji model Gemini 1.0 Ultra, da bi sad predstavio i nasljednika: Gemini 1.5.
Nova generacija njihovog AI modela, hvali se Google, brža je, pametnija i svestranija nego ikad prije.
Unos milijun tokena
Gemini 1.5 rezultat je inovacija u obradi prirodnog jezika (NLP), grani umjetne inteligencije koja se bavi razumijevanjem i generiranjem ljudskog jezika. Google tvrdi da Gemini 1.5 može obraditi do milijun tokena unosa, što je ekvivalentno oko 4 milijuna znakova ili 800.000 riječi. To je 700 puta više od prethodnog rekordera, OpenAI-jevog GPT-4, koji može obraditi 128.000 tokena, javlja Bug.
To znači da Gemini 1.5 može razumjeti i proizvesti duže i složenije tekstove, kao što su romani, eseji ili govori, zadržavajući pritom koherentnost i kvalitetu.
To također znači da Gemini 1.5 može rukovati multimodalnim ulazima poput teksta, slika, zvuka i videa te generirati izlaze u bilo kojem od ovih formata.
Na primjer, Gemini 1.5 može odgovarati na pitanja na temelju video isječka ili stvoriti pjesmu na temelju tekstualnog upita.
Mixture-of-Experts
Gemini 1.5 je zapravo obitelj modela - Ultra, Pro i Nano - koji zadovoljavaju različite potrebe i primjene. Najopćenitiji model Gemini 1.5 Pro performansama je usporediv s Gemini 1.0 Ultra, ali koristi mnogo manje računalne snage.
To ga čini učinkovitijim i skalabilnijim za korištenje u stvarnom svijetu. Ovaj model koristi novu tehniku nazvanu Mixture-of-Experts (MoE) koja mu omogućava dinamički odabir najrelevantnijih dijelova za pojedini upit umjesto da se svaki put pokreće cijeli model.
MoE omogućava integraciju različitih vrsta podataka od samog početka umjesto da ih kasnije kombinira. "Na ovaj način Gemini 1.5 Pro može učiti iz teksta, slika i zvuka istovremeno i iskoristiti njihovu sinergiju", objašnjava Demis Hassabis, izvršni direktor Google DeepMinda.
Učenje u kontekstu
Gemini 1.5 Pro pokazuje izvanredne sposobnosti "učenja u kontekstu", što znači da može steći novu vještinu obradom informacija u dugotrajnom odzivu, bez potrebe za daljnjim prilagodbama.
Kako bi testirao ovu sposobnost, Google je upotrijebio referentnu vrijednost strojnog prijevoda iz jedne knjige (MTOB) koja procjenjuje koliko dobro model može učiti iz nepoznatih podataka. Kada mu je predstavljen gramatički priručnik za kalamang, jezik kojim se služi manje od 200 govornika diljem svijeta, model je naučio prevoditi engleski na kalamang na način na koji to čine i ljudi.
Glavni aduti
Google tvrdi da će Gemini 1.5 pokretati mnoge proizvode i usluge, kao što su Google Assistant, Google Translate i Google Photos, a njegovu konverzacijsku AI platformu Gemini Advanced učiniti sposobnijom i konkurentnijom.
Gemini Advanced zamišljen je kao konkurencija trenutno vodećem chatbotu na tržištu, OpenAI-jevom ChatGPT Plusu. Glavni su mu aduti, kažu, multimodalni ulazi i izlazi te više značajki i bolja funkcionalnost, dok se ChatGPT Plus temelji samo na tekstu.
Dakako Google nije jedini konkurent OpenAI-u. Tvrtke poput Anthropica, Facebooka i Microsofta također rade na svojim AI modelima koji bi uskoro mogli nadmašiti Googleove rezultate s modelom Gemini 1.5.