Inside Data Bodensee: “Web Scraping mit R” (Teil 2)
Beim Web Scraping liest eine Anwendung oder ein Script Informationen von einer Website oder einem Online-Dienst aus und speichert diese. Doch wie funktioniert ein Scraping-Prozess? Zoé Wolter und Phil Bosch von CorrelAid e.V. werden in einem zweiteiligen Workshop in die Welt des Web Scraping mit der Statistiksoftware R einsteigen. Dabei gehen sie unter anderem darauf ein, wie eine Website aufgebaut ist und wie einzelne Informationen extrahiert werden können. Die Teilnehmer lernen anhand von hands-on Übungen, wie Informationen aus dem Internet gescraped werden können, ohne die Daten abzutippen und wie sich die Daten über eine API abrufen lassen.
Der Workshop besteht aus zwei Teilen. Teil 1 behandelt die Grundlagen zu HTML, XPath und klassisches Scrapen. In Teil 2 geht um die APIs. Es ist möglich, nur Teil 1 oder nur Teil 2 zu besuchen. Die Teilnahme ist sowohl vor Ort als auch online möglich.
Der Workshop richtet sich an alle Interessierte im Bereich IT und Data Science aus allen Bereichen (im Optimalfall mit ein wenig Coding-Erfahrung).
Was ist Inside Data Bodensee?
Die Veranstaltungsreihe Inside Data Bodensee richtet sich an alle, die Herausforderungen im Bereich Scientific IT und Data Science im gemeinsamen Austausch angehen und neue Perspektiven gewinnen wollen. Dabei geht es nicht allein um IT, sondern auch um wichtige Schnittstellen zu anderen.
Eingeladen sind Experten und Anwender aus Wissenschaft, Wirtschaft und Zivilgesellschaft, die Interesse an praxisbezogenen Lösungsansätzen zu aktuellen Herausforderungen im Bereich IT und Data Science haben.
Inside Data Bodensee ist eine gemeinsame Veranstaltung von cyberLAGO, CorrelAid e.V. und des Projekts KI-Lab Bodensee.
Die Veranstaltung ist kostenlos, eine Anmeldung erforderlich.
Zoé studiert aktuell im Master ‘Social and Economic Data Science‘ an der Universität Konstanz und arbeitet außerdem bei CorrelAid. Ihr erster Kontakt zum Statistikprogramm R vor einigen Jahren: ein Workshop von CorrelAid zum Thema Web Scraping!
Phil hat vor kurzem seinen Master in „Social and Economic Data Science“ an der Uni Konstanz abgeschlossen und arbeitet nun als Data Scientist für das statistische Kantonalsamt Zürich. Bei CorrelAid hat er schon so ziemlich alles gemacht, kommt jedoch immer wieder zu seiner „ersten Liebe“ zurück: Andere für R und Datenanalyse begeistern!