19.1 C
Hidalgo
miércoles, enero 15, 2025

Meta desarrolla un sistema de IA que traduce instantáneamente de voz a voz en 36 idiomas

Más Leídas

Un modelo de Inteligencia Artificial (IA) desarrollado por Meta es capaz de traducir voz y texto en 101 idiomas y de hacer traducciones directas de voz a voz en 36 lenguas. El modelo, que supera a los existentes, puede allanar el camino hacia las traducciones universales rápidas.

Meta ya presentó una primera versión del modelo en agosto de 2023, aunque ahora, en un artículo publicado este miércoles en la revista Nature, la compañía incorpora varias innovaciones.

Denominado SEAMLESSM4T, el modelo tiene recursos «que se pondrán a disposición del público -para uso no comercial- para ayudar a seguir investigando» las tecnologías de traducción de voz inclusivas, avanzan los autores en Nature.

Realizar traducciones universales instantáneas es algo que, por ahora, solo ha logrado la ciencia ficción, como ‘El pez de Babel’, un pequeño pez amarillo incluido en la ‘Guía del autoestopista galáctico’, de Douglas Adams, que se insertaba en una oreja y traducía simultáneamente de manera telepática de una lengua hablada a otra.

Tener algo así sería muy útil para facilitar la comunicación en un panorama global interconectado, pero hoy por hoy la mayoría de los sistemas de traducción por aprendizaje automático están orientados al texto o requieren varios pasos: reconocer la voz, traducir el texto y convertirlo de texto a voz en otro idioma.

Además, la cobertura lingüística de los modelos actuales de conversión de voz a voz es menor que la de los modelos de traducción de texto a texto y suele estar sesgada hacia la traducción de un idioma de origen al inglés.

El modelo desarrollado por Seamless Communication de Meta, sin embargo, admite múltiples modos de traducción hasta en 101 idiomas.

SEAMLESSM4T facilita la traducción de voz a voz (reconoce 101 idiomas y traduce a 36 idiomas), la traducción de voz a texto (101 a 96 idiomas), la traducción de texto a voz (96 a 36 idiomas), la traducción de texto a texto (96 idiomas) y el reconocimiento automático de voz (96 idiomas).

En el caso de la traducción de voz a voz, SEAMLESSM4T traduce textos con hasta un 23% más de precisión que los sistemas existentes.

Además, el modelo de inteligencia artificial puede filtrar el ruido de fondo y adaptarse a las variaciones del hablante, detalla el artículo de Nature.

Por todo ello, los autores aseguran que, aunque todavía hay que mejorarlo, SEAMLESSM4T puede suponer un paso adelante en la mejora de la comunicación más allá de las barreras lingüísticas.

Autor