Innovación
Noticias 16 octubre, 2019

El euskera es el idioma que tiene un mayor número de significados en Wikidata

Se encuentra en el sexto lugar en cuanto al número de lexemas
-

Se encuentra en el sexto lugar en cuanto al número de lexemas
Ocupa el segundo puesto en cuanto al número de formas de las palabras
Es el principal idioma en cuanto al número de significados

Gracias a la colaboración entre Euskal Wikilarien Kultur elkartea y Elhuyar, de entre todas las lenguas incluidas en Wikidata el euskera se encuentra en el sexto lugar en cuanto al número de lexemas, ocupa el segundo puesto en cuanto al número de formas de las palabras (teniendo en cuenta todas las formas que se crean al declinar cada lexema) y es el principal idioma en cuanto al número de significados, por delante del inglés, el castellano y el francés, entre otros.
Wikidata es una enorme base de datos que se edita de forma colaborativa. Lo gestiona la Fundación Wikimedia, con el fin de utilizarlo en sus proyectos; por ejemplo, en Wikipedia.

 

Se puso en marcha en 2012, y hemos ido alimentándolo progresivamente. Hace dos años, por ejemplo, incluimos alrededor de 6.500 conceptos provenientes del Diccionario Enciclopédico de la Ciencia y la Tecnología, así como varios vídeos de nuestro programa de televisión, Teknopolis.

 

A lo largo de estos últimos años, Wikidata ha comenzado a guardar nuevos tipos de datos, correspondientes a varios idiomas, en una estructura similar al de los diccionarios. Toda esta información se guarda clasificada en tres grupos: raíces de palabras (entradas de diccionario o lexemas), formas (las formas que puede tomar cada palabra en función del caso de declinación) y significados o definiciones.

 

Gracias a la colaboración entre Euskal Wikilariak Kultur Elkartea y Elhuyar, hemos podido incluir en Wikidata un gran número de palabras o lexemas (de la categoría de los sustantivos) de nuestro Ikaslearen Hiztegia, diccionario dirigido especialmente al alumnado. En total, se han añadido 10.000 lexemas, 65 formas de cada uno de estos lexemas (de todos los casos de declinación, en singular, plural e indeterminado) y sus definiciones.

 

Gracias a este trabajo, ahora resulta más fácil identificar las palabras en euskera, por ejemplo, en los textos de Wikipedia, y en un corto plazo se podrán desarrollar nuevas tecnologías a partir de estas bases de datos.

 

El código de programación desarrollado por el grupo de trabajo I+D de Elhuyar para este proyecto está disponible en GitHub.

Noticias relacionadas

NAIDER: inteligencia aplicada para la transformación económica, territorial y climática

NAIDER: inteligencia aplicada para la transformación económica, territorial y climática

El trabajo de NAIDER se estructura en torno a tres grandes ámbitos: el análisis económico y la competitividad territorial, la transición ecológica y energética, y la regeneración urbana y territorial.

La Máquina-Herramienta cierra 2025 con desigual comportamiento por subsectores

La Máquina-Herramienta cierra 2025 con desigual comportamiento por subsectores

El Sector afronta un 2026 afectado por la convulsa situación geopolítica

Spri consigue el reconocimiento Bidean del premio Euskadi Agenda 2030
30/04/2026 Innovación

Spri consigue el reconocimiento Bidean del premio Euskadi Agenda 2030

Siete organizaciones han sido reconocidas con el distintivo más alto Aurreratua, 16 con el reconocimiento Bidean y 64 organizaciones con el nivel Konpromisoa

Kelias se consolida con sistemas de señalización inteligente que refuerzan la seguridad vial
15/04/2026 Innovación

Kelias se consolida con sistemas de señalización inteligente que refuerzan la seguridad vial

Sus sistemas conectados evitan accidentes en retenciones de tráfico, pasos de peatones y por presencia de fauna salvaje

El Gobierno Vasco amplía el presupuesto hasta los 20 millones de euros para impulsar la innovación en las pymes

El Gobierno Vasco amplía el presupuesto hasta los 20 millones de euros para impulsar la innovación en las pymes

Tras la reunión del Grupo de Defensa para la Industria, el Departamento de la Industria amplía el programa Fast Track Innobideak en 6,5 millones de presupuesto con el objetivo de transformar y diversificar las pymes dentro del Plan de Industria – Euskadi 2030

Tecnipesa presenta Brave, el nuevo arco RFID que revoluciona la trazabilidad logística
07/04/2026 Innovación

Tecnipesa presenta Brave, el nuevo arco RFID que revoluciona la trazabilidad logística

Tecnipesa lanza Brave, su arco RFID desarrollado con el impulso del programa Barnekintzaile. La empresa mostrará esta solución en funcionamiento el 23 de abril durante Brave On Road San Sebastián.

MIM obtiene el Diploma a la Gestión Avanzada de Euskalit tras más de cuatro décadas de trayectoria industrial
30/03/2026 Innovación

MIM obtiene el Diploma a la Gestión Avanzada de Euskalit tras más de cuatro décadas de trayectoria industrial

La obtención del Diploma a la Gestión Avanzada de Euskalit se suma a su certificación ISO 9001:2015, reforzando la profesionalidad e implicación de todo su equipo

El Lehendakari sitúa a Euskadi como actor clave en la reindustrialización y la autonomía estratégica de Europa
24/03/2026 Innovación

El Lehendakari sitúa a Euskadi como actor clave en la reindustrialización y la autonomía estratégica de Europa

Pradales subraya la necesidad de actuar ante un contexto global “adverso e inestable” y defiende la estrategia vasca de “Defensa, Arraigo y Crecimiento”

VCG incorpora nuevo centro de mecanizado de cinco ejes
22/03/2026 Innovación

VCG incorpora nuevo centro de mecanizado de cinco ejes

Se trata del segundo equipo de estas características, reforzando así su especialización en mecanizado de precisión

El Gobierno Vasco activa el escudo industrial con 1.047 millones de euros para hacer frente al impacto del conflicto de Oriente Medio

El Gobierno Vasco activa el escudo industrial con 1.047 millones de euros para hacer frente al impacto del conflicto de Oriente Medio

Las ayudas para la transformación y diversificación de las pymes se incrementan en un 51,4%, hasta los 277 millones de euros

Ir al blog

Síguenos

Canales especializados y actualidad diaria en nuestras redes.