Transformación Digital
Noticias 27 febrero, 2018

Las nuevas técnicas para extraer datos de las webs

Una jornada organizada por el Grupo SPRI analiza el web scraping, una técnica utilizada mediante programas de software para extraer información de sitios web
-

Una jornada organizada por el Grupo SPRI analiza el web scraping, una técnica utilizada mediante programas de software para extraer información de sitios web

Esta tecnología permite detectar cambios en sitios web, obtener precios para comparadores, aplicaciones para business intelligence, o incluso se usa en el periodismo de investigación

 

Los datos se están convirtiendo en el recurso más valioso del mundo y la obtención de información es cada vez más codiciada. Una jornada organizada por el Grupo SPRI, la agencia vasca de desarrollo empresarial, se ha centrado en analizar el web scraping, una técnica utilizada mediante programas de software para extraer información de sitios web. “Obtener datos, información y contenido es relativamente fácil con la tecnología actual que tenemos”, ha afirmado el experto Juan Riaza en una conferencia celebrada en el Polo de Innovación Garaia, en Mondragón,

 

Riaza ha expuesto numerosos ejemplos de las posibilidades de esta técnica, como  detección de cambios en sitios web, obtención de precios para comparadores, aplicaciones para business intelligence, o incluso el  periodismo de investigación. “Por ejemplo, cuando alguien quiere alquilar un piso y has recibido 500 emails de gente interesada. Utilizas el web scraping para priorizar las personas a las que quieres alquilar el piso”.  El experto se ha referido a infinidad de negocios que trabajan con este modelo. “Hay gente que se dedica a ver si las personas tienen deudas”.

 

O casos como Strava, una empresa que comercializa pulseras para correr que indican los datos de kilómetros recorridos, pulsaciones o rendimiento personalizado, que pudo conocer el funcionamiento de  instalaciones militares a  través de los miembros del Ejército que hacían footing.

 

¿Y cómo protegerse de un web scraping? “Podemos bloquearlo, aunque es costoso”. Riaza ha recomendado, para utilizar esta técnica, que también se tengan en cuenta los costes de mantenimiento.

 

Ha comentado que, si el uso de los datos es interno, no hay problemas. “Pero hay empresas que se dedican a revender los datos y las cuestiones legales y éticas dependen de cada país y de cada uno”.

 

Jorge Campanillas, también de la empresa Iurismática, se ha referido a los aspectos legales del uso del web scraping. “El Tribunal Europeo ha dictaminado que el poseedor de una base de datos puede negarse a que se use por terceros”. Y en España, ha revelado, el Tribunal Supremo también ha dictado dos sentencias contrarias a empresas que usaron datos de precios de vuelos de compañías aéreas. “Ha señalado que el simple hecho de navegar por internet no es un contrato. Pero otra cosa es el acceso a la zona privada y no puedes utilizar esa información”.

 

La ley, ha asegurado, dictamina que los datos se protegen y el coste que ha generado al propietario. “Lo que no puedes prohibir es extraer partes de esos datos con un fin privado, pero no con ánimo de lucro ni tampoco desde una empresa”.

 

En Estados Unidos la privacidad de datos no tiene ni siquiera anclaje constitucional, a diferencia de Europa, donde se exige el consentimiento expreso. “Se acabaron los consentimientos por silencio o tácitos”.

 

Campanillas ha recomendado, para evitar problemas legales, “leer la letra pequeña” de los portales en los que se va a utilizar el web scraping y solicitar el consentimiento si hay datos personales.

Noticias relacionadas

Las pymes de Euskadi aceleran su apuesta por la IA tras el programa formativo impulsado por el Gobierno Vasco, IndesIA y BAIC

Las pymes de Euskadi aceleran su apuesta por la IA tras el programa formativo impulsado por el Gobierno Vasco, IndesIA y BAIC

Más de 80 empresas mostraron su interés inicial en la iniciativa, reflejando la creciente demanda de IA en el tejido empresarial vasco

El consejero de Industria, Mikel Jauregi, visita la planta de Schaeffler en Elgoibar, pionera en digitalización industrial

El consejero de Industria, Mikel Jauregi, visita la planta de Schaeffler en Elgoibar, pionera en digitalización industrial

La factoría de Elgoibar cuenta con 240 personas empleadas, está especializada en la fabricación de agujas de rodamientos y en ella se ubica la sede social de la entidad legal Schaeffler Iberia.

Creatividad en entorno IA: del caos operativo al control estratégico

Creatividad en entorno IA: del caos operativo al control estratégico

La inteligencia artificial ya forma parte de los procesos creativos. El reto no es adoptarla, sino integrarla con criterio para evitar desorden operativo, pérdida de autoría y dependencia tecnológica.

Innolab Bilbao e Ikerlan sitúan a la capital vizcaína en la vanguardia de los sistemas electrónicos de próxima generación

Innolab Bilbao e Ikerlan sitúan a la capital vizcaína en la vanguardia de los sistemas electrónicos de próxima generación

La jornada reunió a empresas y personas expertas de primer nivel para analizar el impacto de estos sistemas en la competitividad industrial

Trelec: Innovación y excelencia en la fabricación de circuitos electrónicos

Trelec: Innovación y excelencia en la fabricación de circuitos electrónicos

La planificación inteligente, la clave de un producto fiable.

Innolab e Ikerlan abordan en una jornada los retos de los sistemas electrónicos de próxima generación

Innolab e Ikerlan abordan en una jornada los retos de los sistemas electrónicos de próxima generación

El evento se celebra el 21 de enero y las inscripciones ya están abiertas

QUBIZ.team lidera la vanguardia de la sensórica cuántica europea para Agua, Energía, Industria y Salud


QUBIZ.team lidera la vanguardia de la sensórica cuántica europea para Agua, Energía, Industria y Salud


La ‘deep tech’ vasca, reconocida con el EIC Accelerator Seal of Excellence 2025, desarrolla soluciones de ultraprecisión capaces de detectar una única molécula tóxica en el equivalente a una piscina olímpica

El programa Diagnóstico de la Madurez del Dato es el punto de partida para una gestión empresarial más inteligente

El programa Diagnóstico de la Madurez del Dato es el punto de partida para una gestión empresarial más inteligente

El 2 de diciembre se abre la primera convocatoria del programa Diagnóstico de la Madurez del Dato, un nuevo servicio que acompaña a las empresas vascas en la evaluación rigurosa de su situación actual en materia de datos y en la definición de una hoja de ruta hacia modelos más...

El programa Smart Industry se renueva para impulsar proyectos en Tecnologías Cuánticas

El programa Smart Industry se renueva para impulsar proyectos en Tecnologías Cuánticas

El 7 de noviembre se abre la nueva convocatoria del programa de ayudas Smart Industry – Tecnologías Cuánticas 2025, que marca la evolución del histórico programa Smart Industry hacia el ámbito de las tecnologías cuánticas. Las empresas interesadas en aplicar estas tecnologías a sus procesos podrán presentar sus solicitudes hasta...

Soluciona los problemas de conexión a Internet y accede a la ayuda para extender la Banda Ancha a todas las empresas de Euskadi. Disfruta de una conectividad sin límites

Soluciona los problemas de conexión a Internet y accede a la ayuda para extender la Banda Ancha a todas las empresas de Euskadi. Disfruta de una conectividad sin límites

Si tu empresa aún sigue teniendo problemas para acceder a Internet a alta velocidad, esta ayuda te proporciona hasta 30.000€ para contratar servicios de Banda Ancha Ultrarrápida, incluso si se encuentra en zonas de poca cobertura o a las que aún no ha llegado la fibra óptica. Solicítala antes del...

Ir al blog

Síguenos

Canales especializados y actualidad diaria en nuestras redes.