Filtros X
Tipos de Posts
Agenda

Ir al blog El blog de la empresa vasca

Información diaria relevante para tu empresa

Noticias 16 octubre, 2019 Innovación Programa Fast Track Innobideak

El euskera es el idioma que tiene un mayor número de significados en Wikidata

Se encuentra en el sexto lugar en cuanto al número de lexemas

Se encuentra en el sexto lugar en cuanto al número de lexemas
Ocupa el segundo puesto en cuanto al número de formas de las palabras
Es el principal idioma en cuanto al número de significados

Gracias a la colaboración entre Euskal Wikilarien Kultur elkartea y Elhuyar, de entre todas las lenguas incluidas en Wikidata el euskera se encuentra en el sexto lugar en cuanto al número de lexemas, ocupa el segundo puesto en cuanto al número de formas de las palabras (teniendo en cuenta todas las formas que se crean al declinar cada lexema) y es el principal idioma en cuanto al número de significados, por delante del inglés, el castellano y el francés, entre otros.
Wikidata es una enorme base de datos que se edita de forma colaborativa. Lo gestiona la Fundación Wikimedia, con el fin de utilizarlo en sus proyectos; por ejemplo, en Wikipedia.

 

Se puso en marcha en 2012, y hemos ido alimentándolo progresivamente. Hace dos años, por ejemplo, incluimos alrededor de 6.500 conceptos provenientes del Diccionario Enciclopédico de la Ciencia y la Tecnología, así como varios vídeos de nuestro programa de televisión, Teknopolis.

 

A lo largo de estos últimos años, Wikidata ha comenzado a guardar nuevos tipos de datos, correspondientes a varios idiomas, en una estructura similar al de los diccionarios. Toda esta información se guarda clasificada en tres grupos: raíces de palabras (entradas de diccionario o lexemas), formas (las formas que puede tomar cada palabra en función del caso de declinación) y significados o definiciones.

 

Gracias a la colaboración entre Euskal Wikilariak Kultur Elkartea y Elhuyar, hemos podido incluir en Wikidata un gran número de palabras o lexemas (de la categoría de los sustantivos) de nuestro Ikaslearen Hiztegia, diccionario dirigido especialmente al alumnado. En total, se han añadido 10.000 lexemas, 65 formas de cada uno de estos lexemas (de todos los casos de declinación, en singular, plural e indeterminado) y sus definiciones.

 

Gracias a este trabajo, ahora resulta más fácil identificar las palabras en euskera, por ejemplo, en los textos de Wikipedia, y en un corto plazo se podrán desarrollar nuevas tecnologías a partir de estas bases de datos.

 

El código de programación desarrollado por el grupo de trabajo I+D de Elhuyar para este proyecto está disponible en GitHub.

Noticias relacionadas

18 abril, 2024 Innovación
Ikasplay, la empresa de Gipuzkoa pionera en la creación de experiencias de formación inmersivas y altamente interactivas
Leer más
16 abril, 2024 Innovación
Las empresas con mayor nivel de igualdad de género presentan mejores niveles de innovación y son más competitivas
Leer más
Buzones Arregui 15 abril, 2024 Innovación
Arregui da respuesta a la nueva necesidad en los edificios, recibir paquetes sin estar en casa
Leer más
Ser b-CORP libro Comunidad NORTE 11 abril, 2024 Emprendimiento
Ser B Corp es utilizar la fuerza de las empresas para cambiar el mundo
Leer más
9 abril, 2024 Innovación
SPRI participa en una sesión dedicada a Potenciar el Talento Femenino en el Universo STEM
Leer más
Ir al blog

Última hora sobre nuevas ayudas

Para pymes, para diversificar mercados, becas en el extranjero, licitaciones internacionales, subvenciones a fondo perdido para afianzar la exportación, ayudas para implantaciones o formación específica en internacionalización.

Te interesa ¿verdad?
// Canales especializados

Síguenos. Canales especializados
y actualidad diaria