La funzione Live Video di ChatGPT nella modalità Advanced Voice, assistente vocale basata sull’Intelligenza Artificiale (IA) di OpenAI, potrebbe essere pronta per la fase beta, ossia il rilascio a un gruppo selezionato di utenti per essere testata.
Con questo nuovo strumento, è possibile utilizzare la fotocamera dello smartphone per riprendere l’ambiente circostante, fare domande a riguardo e ricevere risposte in tempo reale.
Tempistiche e accessibilità
L’annuncio, a maggio 2024, dell’Advanced Voice Mode di GPT-4o comprendeva anche una funzione basata sulla capacità di visione, tuttavia ancora in fase di sviluppo.
Adesso, le stringhe di codice della build beta di ChatGPT v1.2024.317 rivelano che la nuova funzione, probabilmente chiamata Live Camera, potrebbe essere distribuita a un numero maggiore di utenti.
OpenAI non ha dato informazioni specifiche sul lancio o sull’accessibilità. Tuttavia, potrebbe essere inizialmente disponibile solo per ChatGPT Plus e per altri piani a pagamento dell’assistente IA.
Come un essere umano
Già nella fase alfa, Live Video aveva ottenuto risultati positivi, dimostrando notevoli capacità di risposta, anche senza essere in possesso di grandi informazioni da parte dell’utente.
Infatti, se ripreso un soggetto attraverso la fotocamera dello smartphone, l’IA era stata in grado di riconoscerlo e di ricordare il suo nome, facendo anche collegamenti e associazioni coerenti.
Pertanto, alcuni utenti che hanno partecipato al test alfa sono rimasti colpiti e hanno descritto l’esperienza alla pari di una videochiamata “con un amico molto competente”.
Articolo di F.R.