Innovación
Noticias 16 octubre, 2019

El euskera es el idioma que tiene un mayor número de significados en Wikidata

Se encuentra en el sexto lugar en cuanto al número de lexemas
-

Se encuentra en el sexto lugar en cuanto al número de lexemas
Ocupa el segundo puesto en cuanto al número de formas de las palabras
Es el principal idioma en cuanto al número de significados

Gracias a la colaboración entre Euskal Wikilarien Kultur elkartea y Elhuyar, de entre todas las lenguas incluidas en Wikidata el euskera se encuentra en el sexto lugar en cuanto al número de lexemas, ocupa el segundo puesto en cuanto al número de formas de las palabras (teniendo en cuenta todas las formas que se crean al declinar cada lexema) y es el principal idioma en cuanto al número de significados, por delante del inglés, el castellano y el francés, entre otros.
Wikidata es una enorme base de datos que se edita de forma colaborativa. Lo gestiona la Fundación Wikimedia, con el fin de utilizarlo en sus proyectos; por ejemplo, en Wikipedia.

 

Se puso en marcha en 2012, y hemos ido alimentándolo progresivamente. Hace dos años, por ejemplo, incluimos alrededor de 6.500 conceptos provenientes del Diccionario Enciclopédico de la Ciencia y la Tecnología, así como varios vídeos de nuestro programa de televisión, Teknopolis.

 

A lo largo de estos últimos años, Wikidata ha comenzado a guardar nuevos tipos de datos, correspondientes a varios idiomas, en una estructura similar al de los diccionarios. Toda esta información se guarda clasificada en tres grupos: raíces de palabras (entradas de diccionario o lexemas), formas (las formas que puede tomar cada palabra en función del caso de declinación) y significados o definiciones.

 

Gracias a la colaboración entre Euskal Wikilariak Kultur Elkartea y Elhuyar, hemos podido incluir en Wikidata un gran número de palabras o lexemas (de la categoría de los sustantivos) de nuestro Ikaslearen Hiztegia, diccionario dirigido especialmente al alumnado. En total, se han añadido 10.000 lexemas, 65 formas de cada uno de estos lexemas (de todos los casos de declinación, en singular, plural e indeterminado) y sus definiciones.

 

Gracias a este trabajo, ahora resulta más fácil identificar las palabras en euskera, por ejemplo, en los textos de Wikipedia, y en un corto plazo se podrán desarrollar nuevas tecnologías a partir de estas bases de datos.

 

El código de programación desarrollado por el grupo de trabajo I+D de Elhuyar para este proyecto está disponible en GitHub.

Noticias relacionadas

IndeusBerri: el espacio de la Industria y el Euskera

IndeusBerri: el espacio de la Industria y el Euskera

Hoy son noticia la primera reunión del año de Indeus, Plataforma Vasca de la Industria; Mikroenpresa Digitala y un curso sobre ChatGPT en euskera; Etekin Ekonomia Topaketak; y Recogida de datos.

La FP vasca y el Parque Tecnológico de Euskadi reúnen a más de 1.000 estudiantes de bachillerato para mostrarles las oportunidades laborales en empresas científico-tecnológicas
24/02/2026 Innovación

La FP vasca y el Parque Tecnológico de Euskadi reúnen a más de 1.000 estudiantes de bachillerato para mostrarles las oportunidades laborales en empresas científico-tecnológicas

La cita, que tendrá lugar en el Campus Zamudio/Derio el 10 de marzo, y en el Campus Donostia y Campus Vitoria-Gasteiz el 12 de marzo, tiene como objetivo mostrar a este alumnado las oportunidades de la FP en las empresas del Parque Tecnológico

El detergente biológico como vector de innovación en la limpieza profesional
15/02/2026 Innovación

El detergente biológico como vector de innovación en la limpieza profesional

A&B Laboratorios de Biotecnología recibió en 2024 el Premio Vasco a la Gestión Avanzada en Innovación

Araba-Pack: Soluciones de etiquetado industrial de confianza en Vitoria-Gasteiz
04/02/2026 Innovación

Araba-Pack: Soluciones de etiquetado industrial de confianza en Vitoria-Gasteiz

Su propuesta de valor para la industria vasca se define por una flexibilidad y enfoque personalizado.

Almarima Surf Company impulsa la evolución del surf con UP Surfboards y una fuerte vocación internacional
31/01/2026 Innovación

Almarima Surf Company impulsa la evolución del surf con UP Surfboards y una fuerte vocación internacional

Este enfoque internacional se apoya en un compromiso claro: ofrecer no solo producto, sino también servicios y soluciones personalizadas

FORZA Herramientas: 50 años de liderazgo europeo y vanguardia tecnológica
27/01/2026 Innovación

FORZA Herramientas: 50 años de liderazgo europeo y vanguardia tecnológica

Es el fabricante con el mayor catálogo de extracción de Europa

Aleovitro, biotecnología vasca para el cultivo in vitro de plantas

Aleovitro, biotecnología vasca para el cultivo in vitro de plantas

La firma ofrece servicios transversales que abarcan desde el sector alimentario, farmacéutico, médico, cosmético al medioambiental

Trelec: Innovación y excelencia en la fabricación de circuitos electrónicos

Trelec: Innovación y excelencia en la fabricación de circuitos electrónicos

La planificación inteligente, la clave de un producto fiable.

QUBIZ.team lidera la vanguardia de la sensórica cuántica europea para Agua, Energía, Industria y Salud


QUBIZ.team lidera la vanguardia de la sensórica cuántica europea para Agua, Energía, Industria y Salud


La ‘deep tech’ vasca, reconocida con el EIC Accelerator Seal of Excellence 2025, desarrolla soluciones de ultraprecisión capaces de detectar una única molécula tóxica en el equivalente a una piscina olímpica

Bilbao, elegida sede del Congreso Nacional de Industria el 4 y 5 de febrero, que visitará cinco empresas del Parque Tecnológico
05/01/2026 Innovación

Bilbao, elegida sede del Congreso Nacional de Industria el 4 y 5 de febrero, que visitará cinco empresas del Parque Tecnológico

El consejero Mikel Jauregi participará en la inauguración y en el campus de Bizkaia se mostrará como ejemplos a BIC Bizkaia, Biolan, Cocoon, ITP y Syngoi.

Ir al blog

Síguenos

Canales especializados y actualidad diaria en nuestras redes.