Aus dem Kurs: Data Science – Grundlagen

So erhalten Sie Zugriff auf diesen Kurs

Werden Sie noch heute Mitglied und erhalten Sie Zugriff auf mehr als 24.700 Kurse von Branchenfachleuten.

Data Scraping

Data Scraping

Die Watts-Türme in Los Angeles sind dreißig Meter hohe Skulpturen und Strukturen, die Simon Rodia aus Dingen gebaut hat, die er in seiner Umgebung gefunden hat. Bauschutt, Porzellanscherben, Fliesen, Glas, Flaschen, Muscheln, Spiegel, Tonscherben und so weiter. Die Türme bezeugen, was ein kreativer und beharrlicher Mensch mit den Dingen tun kann, die er ringsum findet. Data Scraping ist die Objet-trouvé-Kunst von Data Science. Sie nehmen Daten von ringsumher, Tabellen im Web und Grafiken in Zeitungen, und integrieren diese in Ihre Data-Science-Arbeit. Anders als die Daten, die über APIs verfügbar sind, Schnittstellen, die extra für die Weitergabe gemacht sind, zielt Data Scraping auf Daten, die nicht unbedingt für eine Weitergabe gedacht waren. Nun muss ich sofort eine Bemerkung über Ethik und Data Science machen. Auch wenn es möglich ist, Daten aus digitalen und Printquellen zu scrapen, müssen Sie sich der rechtlichen und ethischen Grenzen bewusst sein. Sie müssen die Privatsphäre…

Inhalt