Google ha lanciato Gemini-Exp-1114, nuova versione sperimentale di Gemini AI, l’Intelligenza Artificiale (IA) di Google. Ha ottenuto il primo posto nella classifica di Chatbot Arena, piattaforma per confrontare e valutare Modelli di Linguaggio (LLM), spodestando i modelli di OpenAI.
Concorrenza per OpenAI
Ha guadagnato 6000 voti in una settimana e condivide il primo posto con ChatGPT-4o-latest, ultimo modello di OpenAI. Ha superato però i modelli o1-preview e o1-mini, che si trovano rispettivamente al terzo e al quarto posto.
Attualmente ha raggiunto un punteggio di 1344, superiore rispetto a quello di 1301 del precedente modello Gemini (Gemini 1.5 Pro), ora in quarta posizione.
Nuove capacità
Il nuovo modello primeggia in diverse categorie, ad esempio la matematica e la scrittura creativa. Inoltre, eccelle nella risposta a richieste più lunghe, nel seguire le istruzioni date, nel multi-turn (conversazioni in più turni) e nei prompt complessi.
Ha anche ottenuto il terzo posto nel coding e nei prompt complessi con controllo dello stile, categorie predominate da o1-preview di OpenAI.
Google sostiene che, rispetto a Gemini 1.5, le risposte della nuova versione sono più utili perché più precise, concise e brevi del 5-20% circa.
Se messo a confronto con altri modelli IA, le nuove abilità permettono a Gemini-Exp-1114 di vincere al 50% contro GPT-4o-latest, al 56% contro o1-preview e al 62% contro Claude-3.5-Sonnet, modello IA di Anthropic.
Accessibilità
Gemini-Exp-1114 è già disponibile per gli sviluppatori su Google AI Studio, un Ambiente di Sviluppo Integrato (IDE) su browser per la prototipazione con modelli IA generativi.
Sarà anche presto disponibile tramite API (Interfaccia di Programmazione delle Applicazioni), un insieme di definizioni e protocolli per creare e integrare software.
Articolo di F.R.