
Fino a questo momento ChatGPT-4o poteva solo interagire, produrre e modificare testi, ma con il nuovo aggiornamento da parte di OpenAI, l’ultimo modello riuscirà a generare immagini non solo realistiche ma anche mantenendo standard di sicurezza.
“La generazione di immagini GPT‑4o eccelle nel rendering accurato del testo, nel seguire precisamente i prompt e nello sfruttare la conoscenza base intrinseca di 4o e il contesto della chat, inclusa la trasformazione delle immagini caricate o il loro utilizzo come ispirazione visiva”. Così la società tecnologica di Sam Altman annuncia il nuovo aggiornamento del suo modello di Intelligenza Artificiale (IA) sul blog ufficiale.
Immagini pressoché reali…
Non solo immagini, dunque, ma anche comprensione perfetta del testo e capacità evolute di conversione tra formati diversi o in immagine. L’aggiornamento si impernia sul perfezionamento della relazione più intima tra parole e immagini, sul perseguimento di una coerenza con il contesto, con le richieste e con l’utente.
La generazione ora si può definire quindi “nativa” e proprio per questo più facilmente modificabile. Con una conversazione naturale nella chat, l’utente può istruire l’IA per aggiungere o togliere elementi nell’immagine prodotta. Il modello aggiornato di OpenAI sarà in grado di apprendere non solo dalle modifiche, ma anche dagli esperimenti caricati da altri utenti, creando una rete di informazioni in tempo reale per fornire prodotti sempre più precisi e realistici.
…ma la sicurezza rimane
Questo aggiornamento sembra supportare la libertà creativa di ogni utente, tuttavia rimangono imprescindibili alcuni standard.
Le immagini prodotte saranno riconoscibili poichè i metadati saranno di provenienza C2PA, ossia identificativi tramite un protocollo crittografato. In questo modo OpenAI intende garantire trasparenza e riconoscibilità per un prodotto generato da IA. Inoltre, in GPT-4o sarà presente uno strumento di verifica per le immagini: aiuterà a stabilire se il contenuto proviene dall’IA di OpenAI o se da altri sistemi.
Ogni richiesta che potrebbe violare la privacy e le policy sui contenuti stabilite da IA sono automaticamente bloccate per evitare la diffusione di deepfake e violenza. Il linguaggio di ChatGPT-4o è stato deliberatamente addestrato per riconoscere le ambiguità, identificarle e limitarle, sia che siano in forma scritta o figurativa.
La nuova funzione è disponibile per ora solo per gli abbonati al piano Pro, ma OpenAI promette anche di estenderla a breve al piano Plus. In seguito, si prevede di renderla accessibili anche agli utenti gratuiti e agli sviluppatori che usano il servizio API. Utilizzabile su Sora e su ChatGPT, la nuova produzione di immagini manda in pensione prematuramente DALL-E 3, che diventa già abbastanza obsoleto, lento e poco dettagliato.
Articolo di T.S.