Meta presenta SeamlessM4T: Nuevo modelo de IA para traducción multilingüe
Tecnología. A 27 de Agosto, 2023. ✍️ Sunashi Rivera
Meta, la gigante tecnológica detrás de plataformas como Facebook, ha revelado su último avance en inteligencia artificial: el modelo SeamlessM4T. Esta innovación de IA, multimodal y multilingüe, destaca por su capacidad para traducir cerca de 100 idiomas y por su habilidad para reconocer el uso de dos o más idiomas en una misma oración.
SeamlessM4T, desarrollado por Meta, es una respuesta significativa al desafío de la traducción multilingüe y multidimensional. Este modelo es capaz de interpretar desde voz a texto y de texto a texto en aproximadamente 100 idiomas. Además, para interpretaciones de voz a voz y de texto a voz, el sistema es compatible con cerca de 100 lenguajes de entrada y 35 de salida.
A diferencia de los enfoques tradicionales que dividen el proceso de interpretación en diferentes canales, SeamlessM4T consolida las tareas de traducción a través de una sola plataforma. Esto lo hace especialmente prometedor en el ámbito de la comunicación global y la interacción entre lenguas diversas.
Para lograr este hito, los ingenieros de Meta rediseñaron el kit de secuencias ‘Fairseq’ para crear sistemas más eficientes pero capaces de manejar información en diversos formatos simultáneamente. El modelo fue entrenado con una amplia cantidad de datos, incluyendo «decenas de miles de millones» de oraciones de texto disponibles públicamente y 4 millones de fragmentos de voz extraídos de la web.
La fortaleza de SeamlessM4T se refleja en su capacidad para lidiar con ruido de fondo y variaciones en el habla, superando en promedio en un 37% y 48%, respectivamente, a los modelos anteriores de Meta. Además, el modelo es consciente de la mezcla de idiomas en una oración, lo que le permite realizar traducciones parciales o generales de manera automática. También puede reconocer el sesgo de género en los idiomas y cuenta con mecanismos para detectar posibles discursos tóxicos o incitantes.
Aunque Meta ha estado liberando modelos de IA de código abierto en los últimos meses, SeamlessM4T se diferencia por ser publicado bajo la licencia Creative Commons CC BY-NC 4.0. Esta licencia permite su replicación, redistribución y transformación con el debido crédito a Meta, pero no para fines comerciales.
La estrategia de Meta en torno a la IA se evidencia en esta distinción, ya que el modelo refleja la evolución de sus estrategias comerciales. Con este paso, Meta busca mejorar sus herramientas de traducción, personalizar la experiencia de usuario y fortalecer la moderación de contenidos en sus productos, alineándose con su objetivo de ofrecer servicios de calidad a nivel global.
Fuente: Wired.