Fugatto: nuovo modello IA che produce suoni inediti

NVIDIA, azienda tecnologica che produce processori grafici per il mercato videoludico e professionale, ha presentato il Foundational Generative Audio Transformer Opus 1, in breve Fugatto.

È un nuovo modello di Intelligenza Artificiale (IA) in grado di generare suoni e di modificare voci.

Produzione e capacità

Questo nuovo modello è stato addestrato con i sistemi avanzati NVIDIA DGX, ossia una serie di server appositi per migliorare le applicazioni di deep learning. 

Inoltre, si basa sull’assemblamento di un dataset contenente milioni di campioni audio e, grazie alla creazione di una serie di istruzioni, le attività e le funzionalità eseguibili sono aumentate, così come l’accuratezza.

Ciò lo distingue dagli altri modelli IA in ambito sonoro, dimostrando maggiore efficienza e creatività. Il suo punto di forza è che non ha bisogno di essere prima addestrato sugli input testuali e audio forniti dall’utente. Questo gli permette di creare ciò che si vuole, anche basandosi sui prompt più bizzarri.

Infatti, partendo da qualsiasi prompt testuale, Fugatto è capace di produrre da zero effetti sonori, musica e parlato, o di modificare prompt audio già esistenti, anche combinandoli.

Ad esempio, partendo da una voce umana, è in grado di conferirle – a seconda della richiesta – un tono o un accento diversi da quelli di partenza, o anche aumentarne il volume, sia nel parlato che nelle performance vocali.

Inoltre, il sistema ha anche funzioni di editing musicale. Ad esempio, può modificare una melodia di una canzone, isolarne le parti vocali o aggiungere strumenti.

Rafael Valle, Responsabile della Ricerca applicata sull’Audio presso NVIDIA e uno dei creatori di Fugatto, ha spiegato che il nuovo modello IA può comprendere e produrre suoni in modo analogo agli esseri umani, e anche rispondere a richieste più complesse.

A chi è destinato?

Le sue abilità rendono Fugatto applicabile in un’ampia gamma di settori, nonostante sia stato pensato principalmente per la produzione di film e videogiochi.

Per esempio, può essere utilizzato dai produttori musicali per sperimentare rapidamente stili e strumentazioni diversi per una canzone.

Rischi e tempistiche

Nonostante Fugatto sia stato ufficialmente presentato, NVIDIA non ha fornito né una data né una modalità di rilascio.

Sembrerebbe che l’azienda voglia prima trovare delle soluzioni ai possibili rischi che questo strumento potrebbe comportare se utilizzato scorrettamente.

Articolo di F.R.