El web scraping es una técnica que emplea diferentes softwares para extraer datos o información de una página web. Se usa para recoger datos sin estructura y convertirlos en datos estructurados para posteriormente ser tratados en bases de datos u hojas de cálculo. El taller será una aproximación práctica al web scraping con el objetivo de permitir a los asistentes el tratamiento de información útil para sus propios proyectos.
El encuentro dará inicio a una línea de trabajo estable en torno a los datos y la visualización de los mismos comisariada por el colectivo Montera34 y heredera de los talleres Maps&Data celebrados en 2016 y 2017 en Hirikilabs y que tuvieron como uno de sus resultados el Informe sobre el efecto Airbnb en Donostia y Euskadi. El objetivo de esta nueva línea de trabajo compuesta por encuentros y talleres es alimentar el DataCommonsLab, un nuevo grupo abierto de trabajo estable en torno a los datos que se reunirá periódicamente en Hirikilabs.
6 de febrero, martes
Introducción: Presentación de la actividad, puesta en contexto y explicación del objetivo del taller
Introducción al scraping: Explicación funcionamiento web (HTML, JSON, APIs...), e introducción de formas de almacenamiento de la información obtenida.
Desarrollo scraper: Explicación y puesta en práctica de herramientas iniciales para hacer scraping (postman, python, beautifulsoup, etc)
7 de febrero, miércoles
Desarrollo scraper: Continuación de la sesión del día anterior.
Introducción a técnicas avanzadas de scraping: Ejecución de Javascript, uso de proxies, otras cuestiones surgidas en el desarrollo del taller.
El web scraping es una técnica que emplea diferentes softwares para extraer datos o información de una página web. Se usa para recoger datos sin estructura y convertirlos en datos estructurados para posteriormente ser tratados en bases de datos u hojas de cálculo.