Las nuevas técnicas para extraer datos de las webs

27 febrero, 2018
Ihardunaldiaren momentu bat.

Una jornada organizada por el Grupo SPRI analiza el web scraping, una técnica utilizada mediante programas de software para extraer información de sitios web

Esta tecnología permite detectar cambios en sitios web, obtener precios para comparadores, aplicaciones para business intelligence, o incluso se usa en el periodismo de investigación

 

Los datos se están convirtiendo en el recurso más valioso del mundo y la obtención de información es cada vez más codiciada. Una jornada organizada por el Grupo SPRI, la agencia vasca de desarrollo empresarial, se ha centrado en analizar el web scraping, una técnica utilizada mediante programas de software para extraer información de sitios web. “Obtener datos, información y contenido es relativamente fácil con la tecnología actual que tenemos”, ha afirmado el experto Juan Riaza en una conferencia celebrada en el Polo de Innovación Garaia, en Mondragón,

 

Riaza ha expuesto numerosos ejemplos de las posibilidades de esta técnica, como  detección de cambios en sitios web, obtención de precios para comparadores, aplicaciones para business intelligence, o incluso el  periodismo de investigación. “Por ejemplo, cuando alguien quiere alquilar un piso y has recibido 500 emails de gente interesada. Utilizas el web scraping para priorizar las personas a las que quieres alquilar el piso”.  El experto se ha referido a infinidad de negocios que trabajan con este modelo. “Hay gente que se dedica a ver si las personas tienen deudas”.

 

O casos como Strava, una empresa que comercializa pulseras para correr que indican los datos de kilómetros recorridos, pulsaciones o rendimiento personalizado, que pudo conocer el funcionamiento de  instalaciones militares a  través de los miembros del Ejército que hacían footing.

 

¿Y cómo protegerse de un web scraping? “Podemos bloquearlo, aunque es costoso”. Riaza ha recomendado, para utilizar esta técnica, que también se tengan en cuenta los costes de mantenimiento.

 

Ha comentado que, si el uso de los datos es interno, no hay problemas. “Pero hay empresas que se dedican a revender los datos y las cuestiones legales y éticas dependen de cada país y de cada uno”.

 

Jorge Campanillas, también de la empresa Iurismática, se ha referido a los aspectos legales del uso del web scraping. “El Tribunal Europeo ha dictaminado que el poseedor de una base de datos puede negarse a que se use por terceros”. Y en España, ha revelado, el Tribunal Supremo también ha dictado dos sentencias contrarias a empresas que usaron datos de precios de vuelos de compañías aéreas. “Ha señalado que el simple hecho de navegar por internet no es un contrato. Pero otra cosa es el acceso a la zona privada y no puedes utilizar esa información”.

 

La ley, ha asegurado, dictamina que los datos se protegen y el coste que ha generado al propietario. “Lo que no puedes prohibir es extraer partes de esos datos con un fin privado, pero no con ánimo de lucro ni tampoco desde una empresa”.

 

En Estados Unidos la privacidad de datos no tiene ni siquiera anclaje constitucional, a diferencia de Europa, donde se exige el consentimiento expreso. “Se acabaron los consentimientos por silencio o tácitos”.

 

Campanillas ha recomendado, para evitar problemas legales, “leer la letra pequeña” de los portales en los que se va a utilizar el web scraping y solicitar el consentimiento si hay datos personales.

Artículos relacionados

También te puede interesar

Ver todo arrow