Noticias 16 octubre, 2019

El euskera es el idioma que tiene un mayor número de significados en Wikidata

Se encuentra en el sexto lugar en cuanto al número de lexemas

Se encuentra en el sexto lugar en cuanto al número de lexemas
Ocupa el segundo puesto en cuanto al número de formas de las palabras
Es el principal idioma en cuanto al número de significados

Gracias a la colaboración entre Euskal Wikilarien Kultur elkartea y Elhuyar, de entre todas las lenguas incluidas en Wikidata el euskera se encuentra en el sexto lugar en cuanto al número de lexemas, ocupa el segundo puesto en cuanto al número de formas de las palabras (teniendo en cuenta todas las formas que se crean al declinar cada lexema) y es el principal idioma en cuanto al número de significados, por delante del inglés, el castellano y el francés, entre otros.
Wikidata es una enorme base de datos que se edita de forma colaborativa. Lo gestiona la Fundación Wikimedia, con el fin de utilizarlo en sus proyectos; por ejemplo, en Wikipedia.

Se puso en marcha en 2012, y hemos ido alimentándolo progresivamente. Hace dos años, por ejemplo, incluimos alrededor de 6.500 conceptos provenientes del Diccionario Enciclopédico de la Ciencia y la Tecnología, así como varios vídeos de nuestro programa de televisión, Teknopolis.

A lo largo de estos últimos años, Wikidata ha comenzado a guardar nuevos tipos de datos, correspondientes a varios idiomas, en una estructura similar al de los diccionarios. Toda esta información se guarda clasificada en tres grupos: raíces de palabras (entradas de diccionario o lexemas), formas (las formas que puede tomar cada palabra en función del caso de declinación) y significados o definiciones.

Gracias a la colaboración entre Euskal Wikilariak Kultur Elkartea y Elhuyar, hemos podido incluir en Wikidata un gran número de palabras o lexemas (de la categoría de los sustantivos) de nuestro Ikaslearen Hiztegia, diccionario dirigido especialmente al alumnado. En total, se han añadido 10.000 lexemas, 65 formas de cada uno de estos lexemas (de todos los casos de declinación, en singular, plural e indeterminado) y sus definiciones.

Gracias a este trabajo, ahora resulta más fácil identificar las palabras en euskera, por ejemplo, en los textos de Wikipedia, y en un corto plazo se podrán desarrollar nuevas tecnologías a partir de estas bases de datos.

El código de programación desarrollado por el grupo de trabajo I+D de Elhuyar para este proyecto está disponible en GitHub.

Noticias relacionadas

10/06/2026 Sostenibilidad Ambiental

Las nuevas ISO 9001 e ISO 14001 marcan el camino: ISO Training Spain forma a las empresas para adaptarse a tiempo

Ante los cambios previstos en los estándares de calidad y gestión ambiental, la compañía ofrece formación técnica y práctica para acompañar a organizaciones y profesionales en su adaptación a los nuevos requisitos normativos.

08/06/2026 Innovación

Innobasque lanza la séptima edición de casos prácticos de innovación en Euskadi

La convocatoria pondrá el foco en casos vinculados a la transferencia de conocimiento, la aplicación de la inteligencia artificial en la innovación, la diversificación hacia nuevos sectores científico-tecnológicos y el papel de la administración pública como motor de innovación

01/06/2026 Innovación

La VII “Leaders in Tech Conference” abordará las últimas tendencias tecnológicas y de innovación

El evento se celebra el 12 de junio en la Torre Iberdrola en Bilbao

29/05/2026 Sostenibilidad Ambiental

Agaleus pone en marcha una nueva instalación para valorizar envases industriales de plástico

La instalación cuenta con una capacidad de entrada de hasta 1.500 kg/h de envases

28/05/2026 Innovación

ONTZI presenta una herramienta digital para evaluar la reciclabilidad de los envases alimentarios

Esta presentación ha tenido lugar en el marco de Food 4 Future, dentro de una sesión dedicada a innovación, normativa y colaboración en envases sostenibles.

14/05/2026 Innovación

Las agencias de desarrollo regional reclaman mayor participación en la gobernanza de los fondos de financiación europeos

El director del Grupo SPRI, Jon Ansoleaga, señala, en la celebración del Foro ADR en Bilbao, que, además de gestionar programas, deben “alinear políticas e instrumentos entre territorios”

11/05/2026 Sostenibilidad Ambiental

NAIDER: inteligencia aplicada para la transformación económica, territorial y climática

El trabajo de NAIDER se estructura en torno a tres grandes ámbitos: el análisis económico y la competitividad territorial, la transición ecológica y energética, y la regeneración urbana y territorial.

06/05/2026 Política de clusters

La Máquina-Herramienta cierra 2025 con desigual comportamiento por subsectores

El Sector afronta un 2026 afectado por la convulsa situación geopolítica

30/04/2026 Innovación

Spri consigue el reconocimiento Bidean del premio Euskadi Agenda 2030

Siete organizaciones han sido reconocidas con el distintivo más alto Aurreratua, 16 con el reconocimiento Bidean y 64 organizaciones con el nivel Konpromisoa

15/04/2026 Innovación

Kelias se consolida con sistemas de señalización inteligente que refuerzan la seguridad vial

Sus sistemas conectados evitan accidentes en retenciones de tráfico, pasos de peatones y por presencia de fauna salvaje

Ir al blog

Consentimiento de las cookies
Utilizamos cookies propias y de terceros para fines analíticos y para mostrarte publicidad personalizada en base a un perfil elaborado a partir de tus hábitos de navegación (por ejemplo, páginas visitadas). Clic aquí para más información. Puedes aceptar todas las cookies pulsando el botón “Aceptar” o configurarlas en “ver preferencias”.

Técnicas Siempre activo

El almacenamiento o acceso técnico es estrictamente necesario para el propósito legítimo de permitir el uso de un servicio específico explícitamente solicitado por el abonado o usuario, o con el único propósito de llevar a cabo la transmisión de una comunicación a través de una red de comunicaciones electrónicas.

Preferencias

El almacenamiento o acceso técnico es necesario para la finalidad legítima de almacenar preferencias no solicitadas por el abonado o usuario.

Estadísticas

El almacenamiento o acceso técnico que es utilizado exclusivamente con fines estadísticos. El almacenamiento o acceso técnico que se utiliza exclusivamente con fines estadísticos anónimos. Sin un requerimiento, el cumplimiento voluntario por parte de tu proveedor de servicios de Internet, o los registros adicionales de un tercero, la información almacenada o recuperada sólo para este propósito no se puede utilizar para identificarte.

Marketing

El almacenamiento o acceso técnico es necesario para crear perfiles de usuario para enviar publicidad, o para rastrear al usuario en una web o en varias web con fines de marketing similares.

Leer más sobre estos propósitos

{title} {title}