Historias 30 septiembre, 2024

Orai: «Nuestro modelo neuronal para la inteligencia artificial es el más avanzado en euskera para entornos escalables»

El centro de inteligencia artificial de Elhuyar ha desarrollado Llama-eus-8B, un nuevo modelo fundacional (el tipo que se utiliza como base de la inteligencia artificial generativa) ​para desarrollar sistemas ​que requiere​n​ la comprensión y generación del euskera escrito.
-

Mientras las soluciones y herramientas de inteligencia artificial siguen proliferando rápidamente, algunos obstáculos parecen permanecer. Es el caso del procesamiento del lenguaje natural para las lenguas con pocos recursos, como el euskera, aunque el centro de investigación Orai ya está aplicando nuevas estrategias con buenos resultados: ha desarrollado Llama-eus-8B, un nuevo modelo de lenguaje neuronal (LLM, Large Language Model) diseñado para facilitar el desarrollo de sistemas de inteligencia artificial que requieren la comprensión y generación del euskera escrito. 

Orai es el centro de Elhuyar especializado en inteligencia artificial aplicada al procesamiento del lenguaje humano. Nació en 2022 de la mano del departamento de I+D de Elhuyar, que ya contaba con una trayectoria de 20 años en el ámbito del procesamiento del lenguaje natural (NLP, según sus siglas en inglés). “La consolidación del departamento en el área del Procesamiento del Lenguaje Natural, junto con las crecientes necesidades del mercado y la sociedad del País Vasco de contar con un agente especializado en la inteligencia artificial aplicada al lenguaje, impulsaron a Elhuyar a crear Orai, con actividades orientadas a la investigación y el desarrollo”, explica Xabier Saralegi, responsable de Tecnologías NLP.  

Ahora, Orai ha desarrollado Llama-eus-8B, un modelo fundacional adaptado a las características lingüísticas del euskera y su entorno cultural. Se trata de un modelo neuronal con capacidades lingüísticas formales y funcionales, es decir, es capaz de comprender y generar euskera en contextos reales. “Esto lo convierte en una base de gran valor para el desarrollo de una amplia variedad de sistemas, como traductores automáticos, sistemas de diálogo, motores de búsqueda, correctores, generadores de contenido o sistemas de minería de textos donde sea necesario procesar el euskera”, afirma Saralegi.  

Este tipo de tecnologías, según el responsable, son transversales y aplicables en diversos ámbitos, como la industria de contenidos, el sector sanitario, la industria, el ámbito legal, la comunicación o la enseñanza. “La principal oportunidad es la posibilidad de desarrollar tecnologías del lenguaje que ofrezcan resultados muy competitivos y escalables en el tratamiento del euskera”.  

Actualmente, Orai está utilizando Llama-eus-8B en prototipos de traductores automáticos, generación de material didáctico y correctores, “con resultados muy prometedores que esperamos llevar pronto a plataformas y soluciones. Estamos plenamente convencidos de que otros agentes o empresas también lo irán integrando en sus soluciones, ya que, no debemos olvidar, se trata de un modelo de uso libre”, recuerda Saralegi. 

Sin embargo, aún falta tiempo para el desarrollo de estos productos o soluciones: no será inmediato, ya que el proceso de adaptación de este modelo base a casos de uso reales aún requiere trabajo de desarrollo e investigación aplicada. A su vez, el centro mantiene el objetivo de seguir creciendo y convertirse en «en un referente tanto en el País Vasco como en España, además de participar en el mercado internacional”. 

Aun así, las perspectivas para Llama-eus-8B son buenas: “En los test de laboratorio para evaluar las capacidades lingüísticas formales y funcionales en euskera (razonamiento, conocimiento del mundo, sentido común), ha demostrado ser el modelo fundacional con los mejores resultados entre los modelos de menos de 20.000 millones de parámetros. Sin embargo, aún ofrece resultados inferiores a los obtenidos en inglés, por lo que nuestro objetivo es seguir mejorando continuamente las capacidades del modelo y publicar versiones más avanzadas de manera progresiva”.   

El Grupo SPRI impulsa la I+D de las empresas vascas con herramientas, activos, ayudas, grupos de trabajo y alianzas con el fin de potenciar la investigación y generar nuevas tecnologías. Consulta los programas de ayuda a la I+D como Elkartek, Emaitek o Hazitek.   

Noticias relacionadas

Ayesa Digital lidera un proyecto para incorporar la ciberseguridad poscuántica en la industria
12/05/2026 I+D+i

Ayesa Digital lidera un proyecto para incorporar la ciberseguridad poscuántica en la industria

La empresa, uno de los principales proveedores de servicios digitales en España y Latinoamérica, participa en el proyecto BAQURA, financiado por el programa Hazitek.

CIMICO ofrece tecnologías novedosas para el tratamiento de aguas residuales

CIMICO ofrece tecnologías novedosas para el tratamiento de aguas residuales

La empresa de San Sebastián aúna la ingeniería, biología y digitalización en sus aplicaciones

El proyecto EXFAN mejora la eficiencia de la propulsión en la aviación
08/05/2026 I+D+i

El proyecto EXFAN mejora la eficiencia de la propulsión en la aviación

La compañía guipuzcoana Egile forma parte de EXFAN, una iniciativa orientada a convertir el calor sobrante de las pilas de combustible en energía útil para la propulsión.

Ormola, el mayor fabricante europeo de moldes de inyección para alumbrado exterior
07/05/2026 I+D+i

Ormola, el mayor fabricante europeo de moldes de inyección para alumbrado exterior

La empresa de Azpeitia, que ha recibido una ayuda del Grupo SPRI del programa de ciberseguridad industrial, prevé aumentar su negocio en un 15%

Leire Balzategui: “Uno de los retos de Robotekin es incorporar la robótica y automatización a más empresas, especialmente a las pymes”
05/05/2026 I+D+i

Leire Balzategui: “Uno de los retos de Robotekin es incorporar la robótica y automatización a más empresas, especialmente a las pymes”

La nueva directora general de la Asociación Vasca de Robótica y Automatización apuesta por activar el ecosistema del sector, reforzar la colaboración entre agentes y acercar estas tecnologías al tejido empresarial.

iSenseDNA: nanosensores para detectar en tiempo real los cambios moleculares tras enfermedades neurodegenerativas
04/05/2026 I+D+i

iSenseDNA: nanosensores para detectar en tiempo real los cambios moleculares tras enfermedades neurodegenerativas

CIC biomaGUNE participa en este proyecto europeo financiado por el programa European Innovation Council (EIC) Pathfinder Open, destinado a impulsar tecnologías disruptivas con potencial para abrir nuevos mercados en el continente.

Gallardo Ingeniería, la líder en máquinas de embotellado de altas prestaciones
30/04/2026 I+D+i

Gallardo Ingeniería, la líder en máquinas de embotellado de altas prestaciones

La empresa de Irún fabrica cada año una veintena de instalaciones para una decena de productos alimentarios, desde el vino hasta la miel

Graphenea consolida su liderazgo internacional en grafeno desde Euskadi
27/04/2026 I+D+i

Graphenea consolida su liderazgo internacional en grafeno desde Euskadi

La compañía guipuzcoana avanza en aplicaciones reales en electrónica, biomedicina e industria, tras más de una década de desarrollo tecnológico

Genelek Sistemas impulsa la eficiencia energética y la automatización industrial desde Euskadi
27/04/2026 I+D+i

Genelek Sistemas impulsa la eficiencia energética y la automatización industrial desde Euskadi

La compañía diseña sistemas que permiten mejorar la eficiencia, reducir fallos y avanzar en la integración de energías renovables.

El proyecto Sirom facilita la reparación y el ensamblaje de satélites y sistemas espaciales de forma remota
24/04/2026 I+D+i

El proyecto Sirom facilita la reparación y el ensamblaje de satélites y sistemas espaciales de forma remota

Esta iniciativa, liderada por Sener, desarrolla una interfaz robótica estándar que reduce costes, simplifica las misiones y habilita nuevas capacidades como el servicio en órbita.

Ir al blog

Síguenos

Canales especializados y actualidad diaria en nuestras redes.