No, non siamo in una puntata di Star Trek, né stiamo parlando dell’assistente virtuale di Iron Man. Jarvis è il nuovo progetto presentato da Nvidia, si tratta di un vero e proprio traduttore universale proprio come quelli dei film di fantascienza!
Nvidia Jarvis è un nuovo software supportato da Intelligenza Artificiale in grado di riconoscere la voce e tradurre immediatamente il tutto in un’altra lingua, senza commettere errori.
Il software creato da Nvidia è in grado di riconoscere e tradurre una frase quasi istantaneamente. Infatti gli basta meno di un decimo di secondo per realizzare la traduzione più appropriata di quanto detto. E se questo non fosse sufficiente è anche in grado di analizzare le frasi e pronunciarle con un’enfasi maggiore rispetto a quelle di una voce robotica.
Per ottenere questo risultato, Nvidia ha dato in pasto a Jarvis un miliardo di pagine di testo e oltre 60.000 ore di conversazioni, in differenti lingue. Ma la natura delle IA è tale che si potrà continuare ad addestrarla con ulteriore testo e conversazioni.
Al momento Jarvis supporta cinque differenti lingue: inglese, giapponese, tedesco, francese e russo con ulteriori lingue in arrivo. La società ha inoltre stretto una partnership con T-Mobile e Mozzilla per ampliare ulteriormente il database testuale e audio con cui migliorare ulteriormente l’algoritmo.
Il CEO di Nvidia Jensen Huang ci ha anche mostrato un esempio di come funziona Jarvis. Il primo step è quello che riguarda il riconoscimento vocale, il sistema oltre a riconoscere il linguaggio di uso comune è in grado di riconoscere anche numerosi gerghi tecnici come il linguaggio medico.
In pochi istanti il testo dettato viene correttamente riconosciuto e contemporaneamente tradotto in una delle cinque lingue disponibili.
Il secondo passo è quello di riuscire a vocalizzare un testo scritto. Di base una voce artificiale pronuncerebbe tutte le parole di una frase con la stessa intonazione, risultando piuttosto robotica. Ma grazie alle capacità di deep learning dell’IA è possibile enfatizzare la voce che in tal modo diventerà decisamente più naturale.
L’obiettivo finale è quello di creare un software in grado di essere inserito in altri software di comunicazione per offrire a milioni e milioni di persone in tutto il mondo un valido supporto per connettersi e interagire più facilmente. La rete ogni giorno è invasa da miliardi di ore di conversazioni, meeting e streaming.
Fonte: Nvidia