Pues bien, Meta, la empresa detrás de Facebook e Instagram, ha dado un paso gigantesco hacia esa realidad con SEAMLESSM4T, un nuevo modelo de Inteligencia Artificial. Este no es un simple traductor; es un sistema que va más allá de lo que hemos visto hasta ahora.
Si bien se presentó una versión inicial en agosto de 2023, la publicación de este miércoles en la revista Nature detalla innovaciones cruciales. El sistema traduce instantáneamente voz a voz en 36 idiomas, superando con creces a sus predecesores. Pero la capacidad de SEAMLESSM4T se extiende más allá:
- Traducción de voz a texto en 101 idiomas.
- Traducción de texto a voz en 96 idiomas.
- Traducción de texto a texto en 96 idiomas.
- Reconocimiento automático de voz en 96 idiomas.
La precisión es asombrosa: en traducciones de voz a voz, SEAMLESSM4T supera a los sistemas existentes en un 23%. Además, es capaz de filtrar ruidos de fondo y adaptarse a diferentes acentos. Todo esto gracias a su capacidad de procesamiento de datos del mundo real.
Expertos como Tanel Alumäe de TalTech, Estonia, lo califican como "impresionante", destacando no solo la tecnología en sí, sino la decisión de Meta de liberar el código fuente (para uso no comercial), promoviendo la investigación abierta.
Allison Koenecke, de la Universidad de Cornell, aporta una perspectiva crucial al advertir sobre la importancia de mitigar sesgos y garantizar un rendimiento equitativo en todos los grupos demográficos. También resalta la necesidad de informar a los usuarios sobre las limitaciones y potenciales riesgos.
Aunque la tarea de traducir las miles de lenguas del mundo aún está lejos de completarse, SEAMLESSM4T representa un avance significativo hacia una comunicación global más fluida e inclusiva. La tecnología abre nuevas posibilidades para la comunicación, la investigación y el desarrollo futuro.