Innovación
Noticias 16 octubre, 2019

El euskera es el idioma que tiene un mayor número de significados en Wikidata

Se encuentra en el sexto lugar en cuanto al número de lexemas
-

Se encuentra en el sexto lugar en cuanto al número de lexemas
Ocupa el segundo puesto en cuanto al número de formas de las palabras
Es el principal idioma en cuanto al número de significados

Gracias a la colaboración entre Euskal Wikilarien Kultur elkartea y Elhuyar, de entre todas las lenguas incluidas en Wikidata el euskera se encuentra en el sexto lugar en cuanto al número de lexemas, ocupa el segundo puesto en cuanto al número de formas de las palabras (teniendo en cuenta todas las formas que se crean al declinar cada lexema) y es el principal idioma en cuanto al número de significados, por delante del inglés, el castellano y el francés, entre otros.
Wikidata es una enorme base de datos que se edita de forma colaborativa. Lo gestiona la Fundación Wikimedia, con el fin de utilizarlo en sus proyectos; por ejemplo, en Wikipedia.

 

Se puso en marcha en 2012, y hemos ido alimentándolo progresivamente. Hace dos años, por ejemplo, incluimos alrededor de 6.500 conceptos provenientes del Diccionario Enciclopédico de la Ciencia y la Tecnología, así como varios vídeos de nuestro programa de televisión, Teknopolis.

 

A lo largo de estos últimos años, Wikidata ha comenzado a guardar nuevos tipos de datos, correspondientes a varios idiomas, en una estructura similar al de los diccionarios. Toda esta información se guarda clasificada en tres grupos: raíces de palabras (entradas de diccionario o lexemas), formas (las formas que puede tomar cada palabra en función del caso de declinación) y significados o definiciones.

 

Gracias a la colaboración entre Euskal Wikilariak Kultur Elkartea y Elhuyar, hemos podido incluir en Wikidata un gran número de palabras o lexemas (de la categoría de los sustantivos) de nuestro Ikaslearen Hiztegia, diccionario dirigido especialmente al alumnado. En total, se han añadido 10.000 lexemas, 65 formas de cada uno de estos lexemas (de todos los casos de declinación, en singular, plural e indeterminado) y sus definiciones.

 

Gracias a este trabajo, ahora resulta más fácil identificar las palabras en euskera, por ejemplo, en los textos de Wikipedia, y en un corto plazo se podrán desarrollar nuevas tecnologías a partir de estas bases de datos.

 

El código de programación desarrollado por el grupo de trabajo I+D de Elhuyar para este proyecto está disponible en GitHub.

Noticias relacionadas

El Gobierno Vasco amplía el presupuesto hasta los 20 millones de euros para impulsar la innovación en las pymes

El Gobierno Vasco amplía el presupuesto hasta los 20 millones de euros para impulsar la innovación en las pymes

Tras la reunión del Grupo de Defensa para la Industria, el Departamento de la Industria amplía el programa Fast Track Innobideak en 6,5 millones de presupuesto con el objetivo de transformar y diversificar las pymes dentro del Plan de Industria – Euskadi 2030

Tecnipesa presenta Brave, el nuevo arco RFID que revoluciona la trazabilidad logística
07/04/2026 Innovación

Tecnipesa presenta Brave, el nuevo arco RFID que revoluciona la trazabilidad logística

Tecnipesa lanza Brave, su arco RFID desarrollado con el impulso del programa Barnekintzaile. La empresa mostrará esta solución en funcionamiento el 23 de abril durante Brave On Road San Sebastián.

MIM obtiene el Diploma a la Gestión Avanzada de Euskalit tras más de cuatro décadas de trayectoria industrial
30/03/2026 Innovación

MIM obtiene el Diploma a la Gestión Avanzada de Euskalit tras más de cuatro décadas de trayectoria industrial

La obtención del Diploma a la Gestión Avanzada de Euskalit se suma a su certificación ISO 9001:2015, reforzando la profesionalidad e implicación de todo su equipo

El Lehendakari sitúa a Euskadi como actor clave en la reindustrialización y la autonomía estratégica de Europa
24/03/2026 Innovación

El Lehendakari sitúa a Euskadi como actor clave en la reindustrialización y la autonomía estratégica de Europa

Pradales subraya la necesidad de actuar ante un contexto global “adverso e inestable” y defiende la estrategia vasca de “Defensa, Arraigo y Crecimiento”

VCG incorpora nuevo centro de mecanizado de cinco ejes
22/03/2026 Innovación

VCG incorpora nuevo centro de mecanizado de cinco ejes

Se trata del segundo equipo de estas características, reforzando así su especialización en mecanizado de precisión

El Gobierno Vasco activa el escudo industrial con 1.047 millones de euros para hacer frente al impacto del conflicto de Oriente Medio

El Gobierno Vasco activa el escudo industrial con 1.047 millones de euros para hacer frente al impacto del conflicto de Oriente Medio

Las ayudas para la transformación y diversificación de las pymes se incrementan en un 51,4%, hasta los 277 millones de euros

Worthington Creyssensac lanza SMART SAVINGS: La revolución en eficiencia energética para la industria del aire comprimido
12/03/2026 Innovación

Worthington Creyssensac lanza SMART SAVINGS: La revolución en eficiencia energética para la industria del aire comprimido

"No es solo una solución, es un enfoque inteligente para que el negocio siga innovando sin que la factura energética sea un freno"

Dinalan lanza CIVITRA para la gestión del alumbrado y activos urbanos

Dinalan lanza CIVITRA para la gestión del alumbrado y activos urbanos

La firma se diversifica con un GMAO que digitaliza la gestión de luminarias, semáforos, fuentes, mobiliario urbano, etc. para alcanzar mayor eficiencia y sostenibilidad

‘Europea de Trabajos Forestales’ redefine la protección acústica en Bizkaia con el éxito de la nueva pantalla vegetal en La Avanzada (Leioa)
09/03/2026 Innovación

‘Europea de Trabajos Forestales’ redefine la protección acústica en Bizkaia con el éxito de la nueva pantalla vegetal en La Avanzada (Leioa)

La Solución Vegetal de ETF vs. Pantallas Metálicas: Eficiencia sin duplicar costes

Euskadi presenta las últimas innovaciones tecnológicas de sus startups en 4YFN
03/03/2026 Emprendimiento

Euskadi presenta las últimas innovaciones tecnológicas de sus startups en 4YFN

12 startups vascas presentan sus soluciones en ámbitos como la salud, la inteligencia artificial, la industria inteligente y la ciberseguridad, con el apoyo del Gobierno Vasco y las tres Diputaciones

Ir al blog

Síguenos

Canales especializados y actualidad diaria en nuestras redes.