Innovación
Noticias 16 octubre, 2019

El euskera es el idioma que tiene un mayor número de significados en Wikidata

Se encuentra en el sexto lugar en cuanto al número de lexemas
-

Se encuentra en el sexto lugar en cuanto al número de lexemas
Ocupa el segundo puesto en cuanto al número de formas de las palabras
Es el principal idioma en cuanto al número de significados

Gracias a la colaboración entre Euskal Wikilarien Kultur elkartea y Elhuyar, de entre todas las lenguas incluidas en Wikidata el euskera se encuentra en el sexto lugar en cuanto al número de lexemas, ocupa el segundo puesto en cuanto al número de formas de las palabras (teniendo en cuenta todas las formas que se crean al declinar cada lexema) y es el principal idioma en cuanto al número de significados, por delante del inglés, el castellano y el francés, entre otros.
Wikidata es una enorme base de datos que se edita de forma colaborativa. Lo gestiona la Fundación Wikimedia, con el fin de utilizarlo en sus proyectos; por ejemplo, en Wikipedia.

 

Se puso en marcha en 2012, y hemos ido alimentándolo progresivamente. Hace dos años, por ejemplo, incluimos alrededor de 6.500 conceptos provenientes del Diccionario Enciclopédico de la Ciencia y la Tecnología, así como varios vídeos de nuestro programa de televisión, Teknopolis.

 

A lo largo de estos últimos años, Wikidata ha comenzado a guardar nuevos tipos de datos, correspondientes a varios idiomas, en una estructura similar al de los diccionarios. Toda esta información se guarda clasificada en tres grupos: raíces de palabras (entradas de diccionario o lexemas), formas (las formas que puede tomar cada palabra en función del caso de declinación) y significados o definiciones.

 

Gracias a la colaboración entre Euskal Wikilariak Kultur Elkartea y Elhuyar, hemos podido incluir en Wikidata un gran número de palabras o lexemas (de la categoría de los sustantivos) de nuestro Ikaslearen Hiztegia, diccionario dirigido especialmente al alumnado. En total, se han añadido 10.000 lexemas, 65 formas de cada uno de estos lexemas (de todos los casos de declinación, en singular, plural e indeterminado) y sus definiciones.

 

Gracias a este trabajo, ahora resulta más fácil identificar las palabras en euskera, por ejemplo, en los textos de Wikipedia, y en un corto plazo se podrán desarrollar nuevas tecnologías a partir de estas bases de datos.

 

El código de programación desarrollado por el grupo de trabajo I+D de Elhuyar para este proyecto está disponible en GitHub.

Noticias relacionadas

Tubacex supera los 100 millones de euros en pedidos de tubos umbilicales en 2026 y refuerza su posición en el mercado subsea
24/06/2026 Innovación

Tubacex supera los 100 millones de euros en pedidos de tubos umbilicales en 2026 y refuerza su posición en el mercado subsea

La compañía ha obtenido nuevos pedidos por más de 80 millones de euros en tubos umbilicales para uno de los principales operadores subsea a nivel mundial, con destino a proyectos offshore en Guyana, Angola y el Mar del Norte.

Euskadi pone en marcha la Autopista Regulatoria para reducir hasta en un 75% los plazos administrativos para proyectos de interés público
18/06/2026 Innovación

Euskadi pone en marcha la Autopista Regulatoria para reducir hasta en un 75% los plazos administrativos para proyectos de interés público

Ante la urgencia de acelerar la transformación digital, la transición energética y la autonomía estratégica europea, Euskadi lanza el Proyecto Transformador para liderar la simplificación y  agilización de los procesos administrativos e impulsar la competitividad de la industria y de la actividad económica sostenible.  

El Parque Tecnológico de Euskadi sigue creciendo y ya reúne en sus campus a 692 empresas, que facturaron conjuntamente 9.257 millones de euros en 2025, un 12,3% más que el año anterior
17/06/2026 Innovación

El Parque Tecnológico de Euskadi sigue creciendo y ya reúne en sus campus a 692 empresas, que facturaron conjuntamente 9.257 millones de euros en 2025, un 12,3% más que el año anterior

Los datos anuales aportados por las empresas Parke reflejan el destacado peso de sectores como el Aeroespacial (2.787 millones de euros), las Biociencias (505 millones de euros), las Soluciones Digitales Avanzadas (1.380 millones de euros) o la Energía (1.152 millones de euros), todos ellos considerados como estratégicos en el Plan...

Las nuevas ISO 9001 e ISO 14001 marcan el camino: ISO Training Spain forma a las empresas para adaptarse a tiempo

Las nuevas ISO 9001 e ISO 14001 marcan el camino: ISO Training Spain forma a las empresas para adaptarse a tiempo

Ante los cambios previstos en los estándares de calidad y gestión ambiental, la compañía ofrece formación técnica y práctica para acompañar a organizaciones y profesionales en su adaptación a los nuevos requisitos normativos.

Innobasque lanza la séptima edición de casos prácticos de innovación en Euskadi
08/06/2026 Innovación

Innobasque lanza la séptima edición de casos prácticos de innovación en Euskadi

La convocatoria pondrá el foco en casos vinculados a la transferencia de conocimiento, la aplicación de la inteligencia artificial en la innovación, la diversificación hacia nuevos sectores científico-tecnológicos y el papel de la administración pública como motor de innovación

La VII “Leaders in Tech Conference” abordará las últimas tendencias tecnológicas y de innovación
01/06/2026 Innovación

La VII “Leaders in Tech Conference” abordará las últimas tendencias tecnológicas y de innovación

El evento se celebra el 12 de junio en la Torre Iberdrola en Bilbao

Agaleus pone en marcha una nueva instalación para valorizar envases industriales de plástico

Agaleus pone en marcha una nueva instalación para valorizar envases industriales de plástico

La instalación cuenta con una capacidad de entrada de hasta 1.500 kg/h de envases

ONTZI presenta una herramienta digital para evaluar la reciclabilidad de los envases alimentarios
28/05/2026 Innovación

ONTZI presenta una herramienta digital para evaluar la reciclabilidad de los envases alimentarios

Esta presentación ha tenido lugar en el marco de Food 4 Future, dentro de una sesión dedicada a innovación, normativa y colaboración en envases sostenibles.

Las agencias de desarrollo regional reclaman mayor participación en la gobernanza de los fondos de financiación europeos
14/05/2026 Innovación

Las agencias de desarrollo regional reclaman mayor participación en la gobernanza de los fondos de financiación europeos

El director del Grupo SPRI, Jon Ansoleaga, señala, en la celebración del Foro ADR en Bilbao, que, además de gestionar programas, deben “alinear políticas e instrumentos entre territorios”

NAIDER: inteligencia aplicada para la transformación económica, territorial y climática

NAIDER: inteligencia aplicada para la transformación económica, territorial y climática

El trabajo de NAIDER se estructura en torno a tres grandes ámbitos: el análisis económico y la competitividad territorial, la transición ecológica y energética, y la regeneración urbana y territorial.

Ir al blog

Síguenos

Canales especializados y actualidad diaria en nuestras redes.