Web-Scraping

Das Web-Scraping (manchmal auch Harvesting genannt ) ist eine Technik zur Extraktion von Inhalten von Websites über ein Skript oder ein Programm , um sie so umzuwandeln, dass sie in einem anderen Kontext verwendet werden kann, beispielsweise der SEO .

Rechtmäßigkeit

In den USA

In den USA verwendet hiQ Labs Web-Scraping auf LinkedIn- Daten zu Rekrutierungszwecken. Nach einer Klage entschied das Berufungsgericht der Vereinigten Staaten für den neunten Bezirk zugunsten von hiQ inSeptember 2019 : Das Gericht ist insbesondere der Ansicht, dass die Benutzer das Eigentum ihrer Profile behalten und dass die Daten, die frei im Internet verbreitet werden, gesammelt werden können. Der Fall wird dann vor den Obersten Gerichtshof gebracht .

In Europa

In einem Urteil aus dem Jahr 2013 verurteilte der Gerichtshof der Europäischen Union die Metasuchmaschine Innoweb, die Daten des Autovertriebsunternehmens Wegener unverändert weiterverwendete.

Das 30. April 2020, hat die CNIL neue Richtlinien zum Web-Scraping veröffentlicht. Die CNIL-Richtlinien legen fest, dass öffentlich zugängliche Daten immer personenbezogene Daten sind und nicht ohne Wissen der Person, der diese Daten gehören, wiederverwendet werden können.

Anwendungen mit Web-Scraping

Einsatz im Multimedia-Datenmanagement

Web-Scraping kann verwendet werden, um Metadaten abzurufen . Auf diese Weise ruft die XBMC- Multimediabibliothek Informationen zu den von ihr verwalteten Medien (Poster und Zusammenfassungen von Filmen und Fernsehserien, Albumcover usw.) auf verschiedenen Websites wie IMDb oder AlloCiné mithilfe von dedizierten Scrapern ab .

Hinweise und Referenzen

  1. Régis Micheli und Jean-Noël Anderruthy, Le Référencement Werbung mit Google AdWords: Tipps, Ratschläge: alle Techniken zertifizierter Experten. ,29. Oktober 2012( online lesen )
  2. Clément Bohic, "  LinkedIn schränkt die Online-Datenerfassung nicht ein  " , auf Silicon.fr ,10. September 2019(Zugriff am 5. Juni 2020 ) .
  3. (in) Wendy Davis, "  Oberster Gerichtshof fordert hiQ auf, im Kampf um Datenverschrottung zu reagieren  " ,27. April 2020(Zugriff am 5. Juni 2020 ) .
  4. Arnaud Touati und Christina Salassidis, „  Web Scraping, eine legale Extraktionstechnik?  » , Zum geltenden Recht ,11. Oktober 2017(Zugriff am 5. Juni 2020 ) .
  5. „  Die Weiterverwendung von online öffentlich zugänglichen Daten zum Zwecke der kommerziellen Beschaffung  “ , zur Nationalen Kommission für Informatik und Freiheiten ,30. April 2020
  6. (in) "  Legal Web Scraping für rechtliche Zwecke  " auf finddatalab.com ,5. Juli 2020
  7. „  Schaber – Offizielles Kodi-Wiki  “ , auf kodi.wiki (Zugriff am 26. April 2020 )

Siehe auch

Zum Thema passende Artikel