El Traductor de Google incorporó más de 110 idiomas de todo el mundo, incluyendo dialectos y lenguas de Latinoamérica, como: el K’iche’ y el Ta Yol Mam (Guatemala y México); el Náhuatl o Nahua, Maya, y el Zapoteco (México); el Q’eqchi (México y Bélice); y el Hunsrik (Brasil).
El traductor de Google ha incorporado más de 110 idiomas de todo el mundo, incluyendo dialectos y lenguas de Latinoamérica como el K’iche’ y el Ta Yol Mam (Guatemala y México); el Náhuatl o Nahua, Maya y Zapoteco (México); el Q’eqchi (México y Belice); y el Hunsrik (Brasil).
Con PaLM 2, su modelo de lenguaje de gran tamaño (o, LLM, por sus siglas en inglés), Google está utilizando inteligencia artificial (IA) para ampliar la variedad de idiomas que Google Traductor soporta. Esta incorporación de 111 nuevos idiomas representa la mayor expansión hasta la fecha.
Este es un ejemplo de como la IA puede contribuir a la preservación y promoción de la diversidad lingüística y cultural en un mundo cada vez más globalizado. Al incluir idiomas y dialectos menos conocidos o en peligro de extinción, Google ayuda a asegurar que estas lenguas no se pierdan y que sus hablantes tengan acceso a herramientas tecnológicas que les permitan comunicarse y compartir su cultura con el resto del mundo. Solo por mencionar un ejemplo, en México, no sólo hablamos español, sino 68 lenguas más. De acuerdo con el Instituto Nacional de Lenguas Indígenas, casi seis millones de mexicanos hablan alguna de las 364 variantes lingüísticas asociadas a 68 lenguas, que a su vez pertenecen a 11 familias lingüísticas distintas. El náhuatl, el chol, el totonaca, el mazateco, el zapoteco, el otomí, el tzotzil, el tzeltal, el maya y el mixteco son las más habladas.
En Brasil se hablan más de 150 idiomas. Sin embargo, solo se considera al portugués como idioma oficial. Cinco de las más de 150 lenguas indígenas habladas en Brasil tienen más de 10 000 hablantes, según datos del Censo del Instituto Brasileño de Geografía y Estadística (IBGE).
Esta herramienta también podría facilitar la comunicación en idiomas locales permite una mayor participación en procesos cívicos y políticos. Por ejemplo, las comunidades pueden involucrarse más efectivamente en debates y decisiones que afectan sus vidas, fortaleciendo la democracia y la representación inclusiva.
Desde 2022, el Traductor de Google utiliza la traducción automática Zero-Shot, un modelo de aprendizaje automático que permite a la plataforma aprender a realizar traducciones a un idioma sin haber visto nunca antes un ejemplo. Esta tecnología facilita y agiliza el proceso de incorporación de nuevos lenguajes para llegar a cada vez más comunidades.
“Los idiomas tienen una enorme cantidad de variaciones: variedades regionales, dialectos y diferentes reglas de ortografía. De hecho, muchos idiomas no tienen una norma única, por lo que es imposible elegir una variedad “correcta”. Nuestro enfoque ha sido priorizar las variedades más utilizadas de cada idioma”, dijo Google en un comunicado. “Por ejemplo, el romaní es un idioma con muchos dialectos en toda Europa. Nuestros modelos generan texto lo más parecido posible al romaní vacalo (o vlax) del sur, una variedad comúnmente utilizada en Internet. Sin embargo, también mezcla elementos de otros, como el romaní valaco del norte y el romaní balcánico. Gracias a nuestras alianzas con lingüistas expertos y hablantes nativos, seguimos logrando un gran progreso en este campo. A medida que la tecnología avance, continuaremos brindando soporte a cada vez más variedades gramaticales y reglas ortográficas”, explicó la tecnológica.