Innovación
Noticias 16 octubre, 2019

El euskera es el idioma que tiene un mayor número de significados en Wikidata

Se encuentra en el sexto lugar en cuanto al número de lexemas
-

Se encuentra en el sexto lugar en cuanto al número de lexemas
Ocupa el segundo puesto en cuanto al número de formas de las palabras
Es el principal idioma en cuanto al número de significados

Gracias a la colaboración entre Euskal Wikilarien Kultur elkartea y Elhuyar, de entre todas las lenguas incluidas en Wikidata el euskera se encuentra en el sexto lugar en cuanto al número de lexemas, ocupa el segundo puesto en cuanto al número de formas de las palabras (teniendo en cuenta todas las formas que se crean al declinar cada lexema) y es el principal idioma en cuanto al número de significados, por delante del inglés, el castellano y el francés, entre otros.
Wikidata es una enorme base de datos que se edita de forma colaborativa. Lo gestiona la Fundación Wikimedia, con el fin de utilizarlo en sus proyectos; por ejemplo, en Wikipedia.

 

Se puso en marcha en 2012, y hemos ido alimentándolo progresivamente. Hace dos años, por ejemplo, incluimos alrededor de 6.500 conceptos provenientes del Diccionario Enciclopédico de la Ciencia y la Tecnología, así como varios vídeos de nuestro programa de televisión, Teknopolis.

 

A lo largo de estos últimos años, Wikidata ha comenzado a guardar nuevos tipos de datos, correspondientes a varios idiomas, en una estructura similar al de los diccionarios. Toda esta información se guarda clasificada en tres grupos: raíces de palabras (entradas de diccionario o lexemas), formas (las formas que puede tomar cada palabra en función del caso de declinación) y significados o definiciones.

 

Gracias a la colaboración entre Euskal Wikilariak Kultur Elkartea y Elhuyar, hemos podido incluir en Wikidata un gran número de palabras o lexemas (de la categoría de los sustantivos) de nuestro Ikaslearen Hiztegia, diccionario dirigido especialmente al alumnado. En total, se han añadido 10.000 lexemas, 65 formas de cada uno de estos lexemas (de todos los casos de declinación, en singular, plural e indeterminado) y sus definiciones.

 

Gracias a este trabajo, ahora resulta más fácil identificar las palabras en euskera, por ejemplo, en los textos de Wikipedia, y en un corto plazo se podrán desarrollar nuevas tecnologías a partir de estas bases de datos.

 

El código de programación desarrollado por el grupo de trabajo I+D de Elhuyar para este proyecto está disponible en GitHub.

Noticias relacionadas

LUZNOR: Innovación y fiabilidad para los sectores más exigentes
08/12/2025 Innovación

LUZNOR: Innovación y fiabilidad para los sectores más exigentes

Una empresa con historia y raíces en Vitoria-Gasteiz

SPRI participa en el evento “El futuro de los materiales avanzados en Europa”
28/11/2025 I+D+i

SPRI participa en el evento “El futuro de los materiales avanzados en Europa”

Celebrado en Aveiro y Oporto los días 27 y 28 de noviembre. En Euskadi, los materiales avanzados son clave para muchos de nuestros sectores industriales y han sido calificados como tecnología transversal clave en el Plan de Industria Euskadi 2030

Forotech 2025 busca fomentar la vocación tecnológica en las mujeres
25/11/2025 Innovación

Forotech 2025 busca fomentar la vocación tecnológica en las mujeres

La Facultad de Ingeniería de Deusto ha celebrado la XIII edición de este foro de encuentro entre universidad, empresa y ciudadanía, patrocinado por el Grupo SPRI

Ekongreso: 10 Economías de Impacto compartirán retos y oportunidades en Laukariz Ekosistema

Ekongreso: 10 Economías de Impacto compartirán retos y oportunidades en Laukariz Ekosistema

27, 28, 29 y 30 de noviembre: empresas responsables, B-Corps, organizaciones, proyectos profesionales, sociales y emprendedores, se dan nuevamente cita en Ekongreso 2025.

El ‘brokerage event’ de la Enterprise Europe Network, comparte oportunidades en el Foro ‘ENLIT 2025’
19/11/2025 Innovación

El ‘brokerage event’ de la Enterprise Europe Network, comparte oportunidades en el Foro ‘ENLIT 2025’

El sistema ha facilitado una eficaz conexión entre profesionales y proyectos integrados en toda la cadena de valor de la transición energética

ENLIT 2025 – Matchmaking Event – 19 de noviembre en Bilbao
14/11/2025 Innovación

ENLIT 2025 – Matchmaking Event – 19 de noviembre en Bilbao

Oportunidades para las empresas vascas. Euskadi refuerza su papel en la transición energética europea.

El Grupo Elay celebra el 25 aniversario de su fábrica en México
10/11/2025 Innovación

El Grupo Elay celebra el 25 aniversario de su fábrica en México

Fue la primera implantación productiva en el extranjero de la empresa ubicada en Antzuola

Abierta la 19ª edición de los Premios EmprendeXXI para las startups vascas con mayor potencial
03/11/2025 Emprendimiento

Abierta la 19ª edición de los Premios EmprendeXXI para las startups vascas con mayor potencial

Plazo para presentación de candidaturas, hasta el próximo 4 de diciembre

“Leaders in Tech Conference” reúne a grandes voces de la innovación tecnológica
22/10/2025 Innovación

“Leaders in Tech Conference” reúne a grandes voces de la innovación tecnológica

El Grupo SPRI participa en la conferencia que reúne a 20 ponentes

5 casos prácticos seleccionados para el Global Innovation Day reflejan cómo Euskadi transforma la ciencia en innovación
22/10/2025 Innovación

5 casos prácticos seleccionados para el Global Innovation Day reflejan cómo Euskadi transforma la ciencia en innovación

La gran cita de la innovación vasca ha recibido 59 propuestas para la convocatoria de su decimocuarta edición, de las cuales cerca del 60% ha sido impulsado por entidades socias de la Agencia Vasca de la Innovación, Innobasque

Ir al blog

Síguenos

Canales especializados y actualidad diaria en nuestras redes.