Este modelo multimodal y multilingüe puede reconocer el discurso en cerca de 100 idiomas, traducir de voz a texto en casi cien idiomas de entrada y salida, traducir de voz a voz en casi cien idiomas de entrada y 36 de salida.
Mark Zuckerberg anunció que Meta está lanzando para sus productos el traductor hecho con Inteligencia Artificial, SeamlessM4T, que trabaja con más de 100 idiomas, y permite no solo la traducción, sino que además transformación en audio y transcripción.
SeamlessM4T sigue un enfoque de sistema único para reducir los errores y los retrasos en los procesos de traducción, y aprovecha los avances hechos en otros modelos de la compañía, como No Language Left Behind, el traductor universal de voz y los modelos de voz multilingüe masivos.
A diferencia de modelos de traducción anteriores, que dividían el proceso de traducción entre sistemas variados, SeamlessM4T realiza la tarea completa de traducción en un solo paso, lo que representa un avance en la eficiencia y precisión en el entendimiento automático y en tiempo rea
El CEO de Meta explicó que la intención de la compañía es integrar estas capacidades en sus plataformas principales, como Facebook, Instagram, WhatsApp, Messenger y la nueva Threads. Esto mejoraría sin duda alguna las interacciones lingüísticas y permitiría a las personas comunicarse sin problemas.
Disponible en código abierto junto con SeamlessAlign, un nuevo conjunto de datos de traducción, Meta afirma que SeamlessM4T representa un «avance significativo» en el campo de la conversión de voz a voz y voz a texto impulsadas por IA.