Meta dimostra ancora una volta il suo impegno nella creazione di un traduttore universale e ha recentemente presentato il nuovo modello di sintesi vocale chiamato SeamlessM4T. Questo nuovo strumento è già in grado di tradurre da voce a testo e viceversa in numerose lingue. Sorprendentemente, può riconoscere ben 100 idiomi, che possono essere automaticamente convertiti in un massimo di 35 lingue diverse.
SeamlessM4T si avvicina all’idea del mitico “Babel Fish” dell’universo di Guida Galattica per Autostoppisti, anche se c’è ancora molto lavoro da fare. Anche se i modelli di traduzione testuale più recenti di Meta sono più avanzati, offrendo traduzioni automatiche in oltre 200 lingue, quando si tratta di traduzione “parlata” siamo ancora in una fase iniziale. Tuttavia, SeamlessM4T sembra avere un vantaggio, grazie a oltre un milione di ore di dati audio che sono stati utilizzati per svilupparlo, filtrando parole offensive e discorsi di incitamento all’odio. È importante notare che Meta ha reso questo modello disponibile sotto licenza Creative Commons CC BY-NC 4.0, evidenziando il suo impegno nella collaborazione con sviluppatori esterni interessati a contribuire ai progressi del progetto.
Secondo Meta, SeamlessM4T rappresenta un “passo avanti significativo” poiché esegue l’intero processo di traduzione in un’unica fase, a differenza dei modelli tradizionali che suddividono la traduzione in diversi sottosistemi progressivi, con conseguenze sulle prestazioni finali. Una delle caratteristiche uniche di SeamlessM4T è la sua capacità di riconoscere i cambiamenti di lingua durante un discorso, anche quando avvengono ripetutamente da una frase all’altra.
L’importanza della traduzione linguistica è innegabile, soprattutto per aziende come Meta, che deve moderare contenuti su piattaforme social in molteplici lingue. Spesso, le lingue meno diffuse dipendono da sistemi di moderazione automatica, ma la precisione di tali sistemi è limitata. Con l’accesso a grandi quantità di dati, l’intelligenza artificiale potrebbe rivoluzionare questo settore. Meta sta investendo molto nell’IA e sta sviluppando una serie di strumenti, come Segment Anything, un sistema di rilevamento oggetti senza addestramento, e ImageBind, un’IA generativa multisensoriale. In collaborazione con Microsoft, sta anche lavorando a Llama 2, un modello linguistico IA open source che sarà disponibile gratuitamente e per scopi commerciali.