Transformación Digital
Noticias 27 febrero, 2018

Las nuevas técnicas para extraer datos de las webs

Una jornada organizada por el Grupo SPRI analiza el web scraping, una técnica utilizada mediante programas de software para extraer información de sitios web
-

Una jornada organizada por el Grupo SPRI analiza el web scraping, una técnica utilizada mediante programas de software para extraer información de sitios web

Esta tecnología permite detectar cambios en sitios web, obtener precios para comparadores, aplicaciones para business intelligence, o incluso se usa en el periodismo de investigación

 

Los datos se están convirtiendo en el recurso más valioso del mundo y la obtención de información es cada vez más codiciada. Una jornada organizada por el Grupo SPRI, la agencia vasca de desarrollo empresarial, se ha centrado en analizar el web scraping, una técnica utilizada mediante programas de software para extraer información de sitios web. “Obtener datos, información y contenido es relativamente fácil con la tecnología actual que tenemos”, ha afirmado el experto Juan Riaza en una conferencia celebrada en el Polo de Innovación Garaia, en Mondragón,

 

Riaza ha expuesto numerosos ejemplos de las posibilidades de esta técnica, como  detección de cambios en sitios web, obtención de precios para comparadores, aplicaciones para business intelligence, o incluso el  periodismo de investigación. “Por ejemplo, cuando alguien quiere alquilar un piso y has recibido 500 emails de gente interesada. Utilizas el web scraping para priorizar las personas a las que quieres alquilar el piso”.  El experto se ha referido a infinidad de negocios que trabajan con este modelo. “Hay gente que se dedica a ver si las personas tienen deudas”.

 

O casos como Strava, una empresa que comercializa pulseras para correr que indican los datos de kilómetros recorridos, pulsaciones o rendimiento personalizado, que pudo conocer el funcionamiento de  instalaciones militares a  través de los miembros del Ejército que hacían footing.

 

¿Y cómo protegerse de un web scraping? “Podemos bloquearlo, aunque es costoso”. Riaza ha recomendado, para utilizar esta técnica, que también se tengan en cuenta los costes de mantenimiento.

 

Ha comentado que, si el uso de los datos es interno, no hay problemas. “Pero hay empresas que se dedican a revender los datos y las cuestiones legales y éticas dependen de cada país y de cada uno”.

 

Jorge Campanillas, también de la empresa Iurismática, se ha referido a los aspectos legales del uso del web scraping. “El Tribunal Europeo ha dictaminado que el poseedor de una base de datos puede negarse a que se use por terceros”. Y en España, ha revelado, el Tribunal Supremo también ha dictado dos sentencias contrarias a empresas que usaron datos de precios de vuelos de compañías aéreas. “Ha señalado que el simple hecho de navegar por internet no es un contrato. Pero otra cosa es el acceso a la zona privada y no puedes utilizar esa información”.

 

La ley, ha asegurado, dictamina que los datos se protegen y el coste que ha generado al propietario. “Lo que no puedes prohibir es extraer partes de esos datos con un fin privado, pero no con ánimo de lucro ni tampoco desde una empresa”.

 

En Estados Unidos la privacidad de datos no tiene ni siquiera anclaje constitucional, a diferencia de Europa, donde se exige el consentimiento expreso. “Se acabaron los consentimientos por silencio o tácitos”.

 

Campanillas ha recomendado, para evitar problemas legales, “leer la letra pequeña” de los portales en los que se va a utilizar el web scraping y solicitar el consentimiento si hay datos personales.

Noticias relacionadas

Ulma Medical Technologies impulsa el primer sistema con IA para prevenir la ceguera diabética en atención primaria

Ulma Medical Technologies impulsa el primer sistema con IA para prevenir la ceguera diabética en atención primaria

La Rioja se convierte en la comunidad pionera al implantar una solución automatizada para el cribado de retinopatía diabética en sus centros de salud

El informe DESI 2024 confirma que la digitalización de Euskadi avanza a buen ritmo

El informe DESI 2024 confirma que la digitalización de Euskadi avanza a buen ritmo

El estudio sobre la Economía y Sociedad Digitales del País Vasco destaca el liderazgo a nivel europeo del territorio en infraestructuras digitales

KAUDATU: Digitalización segura y sostenible para empresas vascas

KAUDATU: Digitalización segura y sostenible para empresas vascas

La plataforma web de KAUDATU facilita la digitalización basada en el eIDAS 2, proporcionando a las empresas las herramientas necesarias para cumplir con los requisitos legales y de privacidad del dato mientras avanzan hacia una transformación digital responsable

Volvemos a ampliar el presupuesto para apoyar proyectos que integren tecnologías de inteligencia artificial y optimicen la infraestructura de datos de las empresas vascas

Volvemos a ampliar el presupuesto para apoyar proyectos que integren tecnologías de inteligencia artificial y optimicen la infraestructura de datos de las empresas vascas

Estas ayudas están financiadas por la Unión Europea a través del plan de recuperación NextGenerationEU destinado a reparar los daños causados por la pandemia y a sentar las bases de un futuro más sostenible, digital y resiliente. En España estos fondos se gestionan a través del Plan de Recuperación, Transformación...

Seinale ayuda a las empresas a proteger su información frente a cualquier amenaza
08/07/2025 Ciberseguridad

Seinale ayuda a las empresas a proteger su información frente a cualquier amenaza

Con más de 20 años de experiencia, Seinale se ha consolidado como una compañía especializada en ciberseguridad y Derecho Digital.

El Grupo SPRI organiza seis talleres sobre inteligencia artificial en la Euskal Encounter

El Grupo SPRI organiza seis talleres sobre inteligencia artificial en la Euskal Encounter

Se celebran del 24 al 26 de este mes y las inscripciones, que son gratuitas, ya están abiertas

Bullhost culmina la adquisición de SPCNet como parte de su estrategia de consolidación en el área Cloud

Bullhost culmina la adquisición de SPCNet como parte de su estrategia de consolidación en el área Cloud

"Nuestros clientes necesitan tener sus datos cerca para utilizarlos en tareas críticas como la predicción, la optimización o la toma de decisiones en tiempo real.."

Blinda tu empresa ante los ciberataques con las nuevas ayudas Ciberseguridad Empresarial
17/06/2025 Ciberseguridad

Blinda tu empresa ante los ciberataques con las nuevas ayudas Ciberseguridad Empresarial

La nueva edición del programa de ayudas Ciberseguridad Empresarial que se ha abierto hoy, contará con un presupuesto de 4 millones y medio de euros. Todas las empresas vascas interesadas en reforzarse contra ciberataques podrán presentar sus solicitudes hasta el 24 de noviembre de 2025.

Tecnalia crea la startup TramoIA Intralogistics Robots, una solución tecnológica para automatizar procesos complejos en logística
16/06/2025 Emprendimiento

Tecnalia crea la startup TramoIA Intralogistics Robots, una solución tecnológica para automatizar procesos complejos en logística

La nueva startup cuenta con el apoyo de Basque Tek Ventures, una iniciativa de Gobierno Vasco dirigida a acompañar la creación de nuevas empresas de base tecnológica e impulsar su crecimiento

Digitalización y pensamiento crítico: así se ha vivido la 1.ª edición de CodeOK en las aulas vascas

Digitalización y pensamiento crítico: así se ha vivido la 1.ª edición de CodeOK en las aulas vascas

La primera edición de CodeOK 2024-2025 ha involucrado a casi 5.000 estudiantes de 280 centros vascos, completando más de 600.000 actividades. Impulsada por el Departamento de Educación y el clúster GAIA, la iniciativa ha fomentado la digitalización y el pensamiento computacional en las aulas mediante retos, gamificación y resolución de...

Ir al blog

Síguenos

Canales especializados y actualidad diaria en nuestras redes.