Innovación
Noticias 16 octubre, 2019

El euskera es el idioma que tiene un mayor número de significados en Wikidata

Se encuentra en el sexto lugar en cuanto al número de lexemas
-

Se encuentra en el sexto lugar en cuanto al número de lexemas
Ocupa el segundo puesto en cuanto al número de formas de las palabras
Es el principal idioma en cuanto al número de significados

Gracias a la colaboración entre Euskal Wikilarien Kultur elkartea y Elhuyar, de entre todas las lenguas incluidas en Wikidata el euskera se encuentra en el sexto lugar en cuanto al número de lexemas, ocupa el segundo puesto en cuanto al número de formas de las palabras (teniendo en cuenta todas las formas que se crean al declinar cada lexema) y es el principal idioma en cuanto al número de significados, por delante del inglés, el castellano y el francés, entre otros.
Wikidata es una enorme base de datos que se edita de forma colaborativa. Lo gestiona la Fundación Wikimedia, con el fin de utilizarlo en sus proyectos; por ejemplo, en Wikipedia.

 

Se puso en marcha en 2012, y hemos ido alimentándolo progresivamente. Hace dos años, por ejemplo, incluimos alrededor de 6.500 conceptos provenientes del Diccionario Enciclopédico de la Ciencia y la Tecnología, así como varios vídeos de nuestro programa de televisión, Teknopolis.

 

A lo largo de estos últimos años, Wikidata ha comenzado a guardar nuevos tipos de datos, correspondientes a varios idiomas, en una estructura similar al de los diccionarios. Toda esta información se guarda clasificada en tres grupos: raíces de palabras (entradas de diccionario o lexemas), formas (las formas que puede tomar cada palabra en función del caso de declinación) y significados o definiciones.

 

Gracias a la colaboración entre Euskal Wikilariak Kultur Elkartea y Elhuyar, hemos podido incluir en Wikidata un gran número de palabras o lexemas (de la categoría de los sustantivos) de nuestro Ikaslearen Hiztegia, diccionario dirigido especialmente al alumnado. En total, se han añadido 10.000 lexemas, 65 formas de cada uno de estos lexemas (de todos los casos de declinación, en singular, plural e indeterminado) y sus definiciones.

 

Gracias a este trabajo, ahora resulta más fácil identificar las palabras en euskera, por ejemplo, en los textos de Wikipedia, y en un corto plazo se podrán desarrollar nuevas tecnologías a partir de estas bases de datos.

 

El código de programación desarrollado por el grupo de trabajo I+D de Elhuyar para este proyecto está disponible en GitHub.

Noticias relacionadas

Trelec: Innovación y excelencia en la fabricación de circuitos electrónicos

Trelec: Innovación y excelencia en la fabricación de circuitos electrónicos

La planificación inteligente, la clave de un producto fiable.

QUBIZ.team lidera la vanguardia de la sensórica cuántica europea para Agua, Energía, Industria y Salud


QUBIZ.team lidera la vanguardia de la sensórica cuántica europea para Agua, Energía, Industria y Salud


La ‘deep tech’ vasca, reconocida con el EIC Accelerator Seal of Excellence 2025, desarrolla soluciones de ultraprecisión capaces de detectar una única molécula tóxica en el equivalente a una piscina olímpica

Bilbao, elegida sede del Congreso Nacional de Industria el 4 y 5 de febrero, que visitará cinco empresas del Parque Tecnológico
05/01/2026 Innovación

Bilbao, elegida sede del Congreso Nacional de Industria el 4 y 5 de febrero, que visitará cinco empresas del Parque Tecnológico

El consejero Mikel Jauregi participará en la inauguración y en el campus de Bizkaia se mostrará como ejemplos a BIC Bizkaia, Biolan, Cocoon, ITP y Syngoi.

LUZNOR: Innovación y fiabilidad para los sectores más exigentes
08/12/2025 Innovación

LUZNOR: Innovación y fiabilidad para los sectores más exigentes

Una empresa con historia y raíces en Vitoria-Gasteiz

SPRI participa en el evento “El futuro de los materiales avanzados en Europa”
28/11/2025 I+D+i

SPRI participa en el evento “El futuro de los materiales avanzados en Europa”

Celebrado en Aveiro y Oporto los días 27 y 28 de noviembre. En Euskadi, los materiales avanzados son clave para muchos de nuestros sectores industriales y han sido calificados como tecnología transversal clave en el Plan de Industria Euskadi 2030

Forotech 2025 busca fomentar la vocación tecnológica en las mujeres
25/11/2025 Innovación

Forotech 2025 busca fomentar la vocación tecnológica en las mujeres

La Facultad de Ingeniería de Deusto ha celebrado la XIII edición de este foro de encuentro entre universidad, empresa y ciudadanía, patrocinado por el Grupo SPRI

Ekongreso: 10 Economías de Impacto compartirán retos y oportunidades en Laukariz Ekosistema

Ekongreso: 10 Economías de Impacto compartirán retos y oportunidades en Laukariz Ekosistema

27, 28, 29 y 30 de noviembre: empresas responsables, B-Corps, organizaciones, proyectos profesionales, sociales y emprendedores, se dan nuevamente cita en Ekongreso 2025.

El ‘brokerage event’ de la Enterprise Europe Network, comparte oportunidades en el Foro ‘ENLIT 2025’
19/11/2025 Innovación

El ‘brokerage event’ de la Enterprise Europe Network, comparte oportunidades en el Foro ‘ENLIT 2025’

El sistema ha facilitado una eficaz conexión entre profesionales y proyectos integrados en toda la cadena de valor de la transición energética

ENLIT 2025 – Matchmaking Event – 19 de noviembre en Bilbao
14/11/2025 Innovación

ENLIT 2025 – Matchmaking Event – 19 de noviembre en Bilbao

Oportunidades para las empresas vascas. Euskadi refuerza su papel en la transición energética europea.

El Grupo Elay celebra el 25 aniversario de su fábrica en México
10/11/2025 Innovación

El Grupo Elay celebra el 25 aniversario de su fábrica en México

Fue la primera implantación productiva en el extranjero de la empresa ubicada en Antzuola

Ir al blog

Síguenos

Canales especializados y actualidad diaria en nuestras redes.