OpenAI o1-preview, il nuovo modello IA per problemi scientifici

Un’Intelligenza Artificiale (IA) pensante sembra essere il futuro di questa tecnologia per OpenAI. Dopo l’indiscrezione di Strawberry IA, la casa produttrice di ChatGPT annuncia un modello che aiuterà il lato più scientifico del lavoro umano

Si chiama OpenAI o1 ed è stato allenato per pensare come un umano prima di rispondere, per risolvere il problema posto come input. Si specializza su problemi molto più complessi, di natura matematica, scientifica e di codifica

Un’IA strategica

Anche se inizialmente la preview di OpenAI o1 non sarà allo stesso livello di conoscenze di ChatGPT, gli sviluppatori affermano che “per compiti di ragionamento complessi si tratta di un progresso significativo e rappresenta un nuovo livello di capacità di Intelligenza Artificiale”. Per questo motivo, OpenAI ha deciso di “resettare” le denominazioni e iniziare un nuovo capitolo di modelli di IA, chiamando la serie “OpenAI o1”.

Nei test effettuati, il modello performa come se fosse uno studente di dottorato di fisica, chimica, biologia, matematica e codifica. Per esempio, in una prova con l’esame di qualificazione per la International Mathematics Olympiad (IMO), le differenze tra GPT-4o e OpenAI o1 risultano immediate. Il classico GPT-4o ha risolto correttamente il 13% dei problemi sottoposti, mentre il nuovo sistema è stato capace di dare l’83% delle risposte esatte. 

OpenAI o1 è infatti costantemente aggiornato per migliorare sempre di più ad ogni performance. Gli sviluppatori affermano che potrà essere uno strumento fondamentale per i ricercatori sanitari e per i fisici per organizzare e visualizzare intricate formule matematiche e dati tecnici. 

Sicurezza

Come sempre, la sicurezza è una parte fondamentale di ogni strumento e nuovo modello messo in circolazione. Nel “jailbreaker test”, ossia una prova di resistenza a tentativi esterni di fare breccia nel sistema, la nuova IA ha resistito arrivando a un punteggio di 84 su 100, contro il 22 su 100 di GPT-4o. 

Stesse capacità sembra avere anche OpenAI o1-mini, il fratello più leggero, economico e veloce della preview specializzato nel coding. Con gli stessi livelli di sicurezza ma con una capacità di browsing minore nel vasto universo di internet, OpenAI offre questo modello come una valida ed economica soluzione per le aziende più piccole che hanno bisogno di una IA efficiente per la codifica.

I nuovi modelli saranno disponibili a partire dal 9 dicembre di quest’anno ma modelli addizionali saranno in futuro aggiunti alla serie di OpenAI o1. Gli user di ChatGPT Plus e Team potranno avere già da oggi accesso a questi sistemi ma con un limite di 30 messaggi per o1-preview e 50 per o1-mini. 

Articolo di T.S.