fbpx

Hay solo 2% de los datos para entrenar la Inteligencia Artificial en español: OCDE

De acuerdo con la OCDE, solo 2% de los datos para entrenar la Inteligencia Artificial están en español, ya que el 57% de los «datasets» se encuentran en inglés; este fenómeno amplía la brecha digital tecnológica en países como México

La lengua que domina los conjuntos de datos que se usan para entrenar los modelos de Inteligencia Artificial (IA) es el inglés, tal como se puede observar al utilizar ChatGPT, OpenAI y Gemini, de Google. Esto, es un fenómeno amplía la brecha digital entre los países anglófonos y no anglófonos, de acuerdo con cifras de la Organización para la Cooperación y el Desarrollo Económicos (OCDE).

Luego del inglés, en el que se encuentran 57 por ciento de los «datasets», el chino es la segunda lengua con una mayor cantidad de estos conjuntos, con 6 por ciento. Le siguen el ruso y el francés, ambos con 3 por ciento, y, al igual que en el caso del coreano, el alemán y el japonés, solo 2 por ciento de los sets para entrenar modelos de Inteligencia Artificial está en español.

Según una oficial de la OCDE, una de las preocupaciones de los países miembros de la organización es que la Inteligencia Artificial no sea adoptada de forma equitativa, lo que se ve impulsado por el hecho de que la mayoría de los modelos de IA sean entrenados con datos en inglés.

“Si los modelos fundacionales no están disponibles en otras lenguas, el desarrollo de la Inteligencia Artificial en los países que hablan esas lenguas será mucho más lento y eso hará que los beneficios en mejoras a la productividad y en la solución de otros problemas se vean rezagados en esos países”, dijo en conferencia de prensa.

Posibles soluciones

Entre las soluciones a este problema, una es que varios países miembro de la OCDE tienen iniciativas para desarrollar repositorios de datos abiertos y disponibles para que los desarrolladores puedan entrenar modelos fundacionales en lenguas distintas al inglés.

Además, de acuerdo con la oficial de la OCDE, se suman la inversión en investigación y desarrollo, así como el entrenamiento de pequeñas y medianas empresas (pymes) en la adopción de estas tecnologías.

Cabe señalar que el mercado mexicano de Inteligencia Artificial alcanzará un valor de 3 mil 700 millones de dólares en 2024, un incremento de 30 por ciento con respecto al año previo, cuando su valor fue de 2 mil 820 millones de dólares, según datos de Statista Market Insights.

Con información de: El Economista

Desarrolladores de aplicaciones en México obtienen 28% de sus ingresos con Google Play

NOTICIAS RELACIONADAS

MÁS NOTICIAS

Más leído