Web e Innovazione

OpenAI, speech-to-text Whisper integrato in app e servizi

La società creatrice di ChatGPT, OpenAI, ha annunciato le API (Application Programming Interface) per il suo modello speech-to-text Whisper.

Cos’è Whisper

Whisper è una rete neurale artificiale, ossia un modello computazionale composto di “neuroni” artificiali che simulano il ragionamento umano. Ispirato alla rete neurale biologica, Whisper apprende automaticamente e il suo compito è la speech recognition (riconoscimento vocale automatico).

Whisper è anche capace di trascrivere un audio in qualsiasi lingua grazie alle oltre 680.000 ore di dati di addestramento. Può tradurre da 57 lingue solo in inglese (per il momento).

Il modello è supportato in ben 98 lingue, ma diminuiscono se si calcolano solo quelle che hanno una percentuale di errore inferiore al 50%. Il file audio o testo prodotto può essere salvato in diversi formati (mp3, mp4, mpeg, m4a, wav, webm) e ha una capacità massima di 25 Mb.

Le API di Whisper

Con la fornitura di API a Whisper, si avrà la possibilità di integrare il riconoscimento vocale e la funzione speech-to-text in app, servizi e prodotti.

OpenAI ha già reso disponibile l’utilizzo delle API e ha pubblicato una lista di app che ne fanno uso.

Gli sviluppatori che vorranno usufruire delle API di Whisper per accedere al modello large-V2 (modello pre-addestrato su lingua inglese che usa la modellazione linguistica mascherata, MLM) dovranno pagare 0,006 dollari al minuto. È anche disponibile l’accesso gratuito, ma le prestazioni sono sensibilmente inferiori.

Articolo di T. S.

uspi

Recent Posts

Berrettini-Sinner trascinano Italia in semifinale di Davis

MALAGA (SPAGNA) (ITALPRESS) - Un doppio inedito trascina l'Italia in semifinale a Malaga. Una coppia…

22 Novembre 2024

Matilde Gioli per campagna Regione Lombardia contro violenza sulle donne

MILANO (ITALPRESS) - Al via la campagna digital "Nonseisola" lanciata da Regione Lombardia che ha…

21 Novembre 2024

Da Iren un ecosistema di servizi dedicati alle PA

TORINO (ITALPRESS) - Le partnership tra pubblico e privato sono sempre più importanti nello sviluppo…

21 Novembre 2024

Google potrebbe vendere il suo browser Chrome

Google potrebbe vendere il suo browser Chrome, su richiesta del Dipartimento di Giustizia americano: sarebbe…

21 Novembre 2024

Inaugurato “Il Poldi Pezzoli in Humanitas”, arte e capolavori in corsia

MILANO (ITALPRESS) - Botticelli, Canaletto, Hayez, Pollaiolo, Sassoferrato entrano in ospedale. Humanitas San Pio X…

21 Novembre 2024

TopNetwork ad “Ambiente Lavoro” con nuove soluzioni per la sicurezza

BOLOGNA (ITALPRESS) - La sicurezza sul lavoro è un tema fondamentale e la tecnologia sta…

21 Novembre 2024