La inteligencia artificial, ¿herramienta o riesgo para las lenguas indígenas?
En lugares como Islandia, Cataluña o Irlanda se ha incorporado un peculiar componente en su agenda política: las lenguas. Hay diferentes motivos, entre ellos el aspecto identitario. En los Países Bajos, frente a la popularidad del inglés, se están tomando medidas para promover cursos en el idioma neerlandés en sus universidades. Muchos defensores de la diversidad lingüística proponen que cada idioma, al estar conectado con una cultura y modos de vida, ofrece saberes y prácticas que tienen el potencial de enriquecer el conocimiento y la innovación, además de celebrar la diversidad cultural del mundo. Por tanto, para varios países o regiones en el planeta, proteger su lengua es también asegurar relevancia global.
El espacio digital es uno de los canales principales de transmisión y generación de información, en especial entre los jóvenes, por ello para esta preservación lingüística se han puesto en marcha varias iniciativas digitales. Activistas del catalán, con ayuda de instituciones culturales, se han organizado para que esta se convierta en una de las lenguas más usadas en X (Twitter). De un modo similar, el gobierno islandés tiene una oficina para crear vocabulario tecnológico en su propio idioma y que no sean sólo adaptaciones del inglés.
En el caso de la región andina (incluyendo la Amazonía), en las últimas décadas han aparecido esfuerzos de activistas y educadores para generar plataformas digitales en que se usen lenguas como el quechua, el aymara o el shipibo-konibo: videojuegos, diccionarios digitales, e incluso bots para Twitter. Además, en tiempos en que se habla de la inteligencia artificial, ¿qué espacio pueden ocupar las lenguas indígenas?
En el año 2022, Google incorporó a su herramienta de traducción (Google Translate) las lenguas quechua sureño, aymara y guaraní. A diferencia de lenguas con mayor presencia virtual, esto representaba un nuevo reto. Ya Google usualmente recolectaba data en internet (por ejemplo, del francés) y comparaba esa información para generar patrones de traducción. Con respecto a muchas lenguas indígenas, eso no es posible dada su poca presencia en internet.
Para la nueva incorporación, Google hizo que el sistema (es decir, el algoritmo) ‘aprenda’ a hablar quechua. Este proceso se conoce como machine learning. Hasta aquí, todo suena muy bien, ¿verdad? Hay unas cuantas preguntas a considerar: durante todo este proceso Google es dueña de la data generada en quechua, y además no se sabe de la existencia de previos procesos de consulta con comunidades quechuahablantes.
Según la Declaración de Derechos de los Pueblos Indígenas de la ONU, es importante reconocer los conocimientos y lenguas indígenas y dar créditos a sus comunidades de hablantes, dada la larga historia de colonización y extracción de saberes. No hay un marco legal que prohíba el estudio del quechua por externos, pero cada vez hay más llamados a consideraciones éticas sobre la propiedad intelectual de comunidades indígenas, en especial cuando se trata de gigantes tecnológicos que manejan miles de millones de dólares. En Estados Unidos y Canadá hay regulaciones un poco más específicas sobre el patrimonio inmaterial indígena, y hasta el momento no parece haber ninguna lengua indígena de esos países disponibles en la plataforma de Google Translate (navajo o cheroqui, por ejemplo).
Al igual que Google Translate, la plataforma ChatGPT, la cual trabaja con inteligencia artificial (IA) generativa, también permite un uso básico del quechua y aymara. Con su uso más extendido, el sistema de Chat GPT irá ‘aprendiendo’ de forma más detallada la sintaxis de ambas lenguas. Esto puede facilitar usos bastante prácticos y educativos como la traducción o la enseñanza. En la actualidad, estudiantes de inglés o alemán pueden usar ChatGPT como un simulador y practicar diálogos con un hablante nativo en la lengua seleccionada. En el futuro, algo similar podría también ocurrir para quienes deseen practicar o estudiar quechua o aymara.
Por otro lado, la privacidad de datos de los usuarios es algo que preocupa dada su posible venta y usos no autorizados. A ello se le suman los posibles efectos del IA que aún no sabemos con certeza. En este contexto es importante tener más transparencia en el uso de la data, pero, sobre todo, de quienes la controlan para asegurar que todos estos avances tecnológicos beneficien principalmente a las personas y comunidades.
¡Suscríbete a Jugo y espía EN VIVO cómo se tramó este artículo!
Nuestros suscriptores por 6 meses pueden entrar por Zoom a nuestras nutritivas —y divertidas— reuniones editoriales. Suscríbete haciendo clic en el botón de abajo.