Historias 30 septiembre, 2024

Orai: «Nuestro modelo neuronal para la inteligencia artificial es el más avanzado en euskera para entornos escalables»

El centro de inteligencia artificial de Elhuyar ha desarrollado Llama-eus-8B, un nuevo modelo fundacional (el tipo que se utiliza como base de la inteligencia artificial generativa) ​para desarrollar sistemas ​que requiere​n​ la comprensión y generación del euskera escrito.
-

Mientras las soluciones y herramientas de inteligencia artificial siguen proliferando rápidamente, algunos obstáculos parecen permanecer. Es el caso del procesamiento del lenguaje natural para las lenguas con pocos recursos, como el euskera, aunque el centro de investigación Orai ya está aplicando nuevas estrategias con buenos resultados: ha desarrollado Llama-eus-8B, un nuevo modelo de lenguaje neuronal (LLM, Large Language Model) diseñado para facilitar el desarrollo de sistemas de inteligencia artificial que requieren la comprensión y generación del euskera escrito. 

Orai es el centro de Elhuyar especializado en inteligencia artificial aplicada al procesamiento del lenguaje humano. Nació en 2022 de la mano del departamento de I+D de Elhuyar, que ya contaba con una trayectoria de 20 años en el ámbito del procesamiento del lenguaje natural (NLP, según sus siglas en inglés). “La consolidación del departamento en el área del Procesamiento del Lenguaje Natural, junto con las crecientes necesidades del mercado y la sociedad del País Vasco de contar con un agente especializado en la inteligencia artificial aplicada al lenguaje, impulsaron a Elhuyar a crear Orai, con actividades orientadas a la investigación y el desarrollo”, explica Xabier Saralegi, responsable de Tecnologías NLP.  

Ahora, Orai ha desarrollado Llama-eus-8B, un modelo fundacional adaptado a las características lingüísticas del euskera y su entorno cultural. Se trata de un modelo neuronal con capacidades lingüísticas formales y funcionales, es decir, es capaz de comprender y generar euskera en contextos reales. “Esto lo convierte en una base de gran valor para el desarrollo de una amplia variedad de sistemas, como traductores automáticos, sistemas de diálogo, motores de búsqueda, correctores, generadores de contenido o sistemas de minería de textos donde sea necesario procesar el euskera”, afirma Saralegi.  

Este tipo de tecnologías, según el responsable, son transversales y aplicables en diversos ámbitos, como la industria de contenidos, el sector sanitario, la industria, el ámbito legal, la comunicación o la enseñanza. “La principal oportunidad es la posibilidad de desarrollar tecnologías del lenguaje que ofrezcan resultados muy competitivos y escalables en el tratamiento del euskera”.  

Actualmente, Orai está utilizando Llama-eus-8B en prototipos de traductores automáticos, generación de material didáctico y correctores, “con resultados muy prometedores que esperamos llevar pronto a plataformas y soluciones. Estamos plenamente convencidos de que otros agentes o empresas también lo irán integrando en sus soluciones, ya que, no debemos olvidar, se trata de un modelo de uso libre”, recuerda Saralegi. 

Sin embargo, aún falta tiempo para el desarrollo de estos productos o soluciones: no será inmediato, ya que el proceso de adaptación de este modelo base a casos de uso reales aún requiere trabajo de desarrollo e investigación aplicada. A su vez, el centro mantiene el objetivo de seguir creciendo y convertirse en «en un referente tanto en el País Vasco como en España, además de participar en el mercado internacional”. 

Aun así, las perspectivas para Llama-eus-8B son buenas: “En los test de laboratorio para evaluar las capacidades lingüísticas formales y funcionales en euskera (razonamiento, conocimiento del mundo, sentido común), ha demostrado ser el modelo fundacional con los mejores resultados entre los modelos de menos de 20.000 millones de parámetros. Sin embargo, aún ofrece resultados inferiores a los obtenidos en inglés, por lo que nuestro objetivo es seguir mejorando continuamente las capacidades del modelo y publicar versiones más avanzadas de manera progresiva”.   

El Grupo SPRI impulsa la I+D de las empresas vascas con herramientas, activos, ayudas, grupos de trabajo y alianzas con el fin de potenciar la investigación y generar nuevas tecnologías. Consulta los programas de ayuda a la I+D como Elkartek, Emaitek o Hazitek.   

Noticias relacionadas

Ikusmen, más de 25 años de experiencia en el desarrollo de soluciones de visión artificial
10/06/2025 I+D+i

Ikusmen, más de 25 años de experiencia en el desarrollo de soluciones de visión artificial

Los equipos que fabrica la compañía vizcaína son capaces de automatizar procesos como la inspección de defectos y el reconocimiento de objetos. En los últimos años, ha ampliado su presencia en el sector alimentario.

El proyecto UNLOCK convierte plumas de pollo en productos agrícolas sostenibles
06/06/2025 I+D+i

El proyecto UNLOCK convierte plumas de pollo en productos agrícolas sostenibles

Tras cuatro años de investigación, el proyecto europeo liderado por Cidetec Surface Engineering prueba que las plumas de pollo pueden convertirse en materia prima sostenible para la agricultura.

ATE Informática impulsa la digitalización mediante inteligencia artificial en la pyme vasca
29/05/2025 I+D+i

ATE Informática impulsa la digitalización mediante inteligencia artificial en la pyme vasca

La compañía guipuzcoana se ha consolidado como un socio tecnológico de referencia para las empresas que apuestan por evolucionar en un entorno cada vez más digital.

KA-IA, inteligencia artificial para la fabricación de vehículos eléctricos más eficientes y flexibles
29/05/2025 I+D+i

KA-IA, inteligencia artificial para la fabricación de vehículos eléctricos más eficientes y flexibles

Este proyecto Hazitek estratégico, desarrollado entre 2021 y 2023, fue liderado por Gestamp y alcanzó sus objetivos en cuatro ámbitos de actuación: el diseño de producto, el diseño y valoración de proceso, la gestión de la producción y el control de calidad.

FIDEGAS, más de 40 años diseñando y fabricando sistemas de detección de gases
26/05/2025 I+D+i

FIDEGAS, más de 40 años diseñando y fabricando sistemas de detección de gases

La empresa donostiarra forma parte de dos proyectos que apuestan por la sostenibilidad a través del hidrógeno: HIMUGI y H2Sarea, los cuales han recibido la subvención Hazitek de SPRI.

Hemoline desarrolla un sistema portátil multitest que obtiene un diagnóstico rápido y preciso de la hemostasia
19/05/2025 I+D+i

Hemoline desarrolla un sistema portátil multitest que obtiene un diagnóstico rápido y preciso de la hemostasia

El proyecto liderado por iLine Microsystems avanza en un dispositivo para el sector médico donde se manejan pacientes anticoagulados. Ha contado con el apoyo del Programa de Ayudas Hazitek de Grupo SPRI.

El proyecto EGOKIA obtiene una plataforma pionera cibersegura de aprendizaje automático colaborativo
16/05/2025 I+D+i

El proyecto EGOKIA obtiene una plataforma pionera cibersegura de aprendizaje automático colaborativo

Este proyecto Hazitek fue desarrollado por una decena de empresas y centros de investigación vascos, liderados por Mondragon Assembly.

El proyecto Aracel desarrolla nuevas soluciones para reducir la dependencia energética en la construcción
09/05/2025 I+D+i

El proyecto Aracel desarrolla nuevas soluciones para reducir la dependencia energética en la construcción

Liderado por Belako Lanak, diseña un mortero de baja huella de carbono y eco-paneles de aislamiento para integrarlos en un sistema SATE. Ha contado con el apoyo del programa de ayudas Hazitek de Grupo SPRI.

El proyecto HIMUGI busca lograr un sistema de propulsión de hidrógeno con aplicaciones en movilidad y transporte
23/04/2025 I+D+i

El proyecto HIMUGI busca lograr un sistema de propulsión de hidrógeno con aplicaciones en movilidad y transporte

Cuenta con una amplia participación y colaboración entre entidades vascas y ha recibido la ayuda económica del programa Hazitek de SPRI.

El centro tecnológico Ceit ha promovido 20 spin-offs que generan más de 300 empleos y han traído una inversión cercana a los 30 M€
16/04/2025 I+D+i

El centro tecnológico Ceit ha promovido 20 spin-offs que generan más de 300 empleos y han traído una inversión cercana a los 30 M€

El consejero Mikel Jauregi visita Ceit, centro tecnológico de referencia en investigación aplicada y transferencia de tecnología a la empresa

Ir al blog

Síguenos

Canales especializados y actualidad diaria en nuestras redes.