GESIS Leibniz-Institut für Sozialwissenschaften: Homepage aufrufen

Web-Scraping als Thema vor dem US Supreme Court – GESIS-Publikation wird zitiert


Kategorien: GESIS-News

Eine GESIS-Publikation wird in einem aktuellen Fall vor dem US Supreme Court angeführt, um die Gesetzgebung über den gesellschaftlichen und wissenschaftlichen Nutzen von Web-Scraping zu informieren.

In den USA laufen derzeit einige gerichtliche Auseinandersetzungen, deren Ausgang weitreichende Bedeutung für die Methode des „Web Scrapings“ und damit für das gesamte wissenschaftliche Feld der Computational Social Science haben könnten. So geht es im Fall „Nathan van Buren vs United States“ vordergründig um einen ehemaligen Polizisten, der die technische Infrastruktur seiner Polizeistation dazu nutze, um eine spezifische Person zu suchen. Damit verstieß er gegen den Computer Fraud and Abuse Act (CFAA), ein inzwischen äußerst kontrovers diskutiertes Gesetz, das aus dem Jahr 1986 und damit aus einer Zeit weit vor der Digitalisierung stammt.

Der CFAA hat in seiner kaum mehr zeitgemäßen engen Auslegung das Potential, Web Scraping zu kriminalisieren und ein ganzes Forschungsfeld empfindlich zu treffen:

„Section 1030(a)(2)(C) of the Computer Fraud and Abuse Act (“CFAA”) proscribes “exceeding authorization” when accessing a computer and thereby obtaining information. This statute is both criminal and civil. Moreover, it is capable of both a broad reading, proscribing any use of any kind of electronic device in any manner and for any purpose not expressly permitted by the device’s owner— essentially using the CFAA to furnish civil, contractual prohibitions with criminal penalties; or a narrow reading, interpreting the Section as akin to a “data theft statute”— thereby restricting this provision of the statute to the proscription actually set forth in its text.“ (https://www.acm.org/binaries/content/assets/public-policy/ustpc-amicus-brief-vanburen-v-us.pdf)

Die „Association for Computing Machinery“ (ACM) hat als weltweite Vereinigung der Informatiker*innen darauf reagiert und eine Stellungnahme (Amicus Curiae) an den US Supreme Court gerichtet. Darin wird argumentiert, dass das Web Scraping von öffentlich verfügbaren Webinhalten eine wichtige Grundlage für die Forschung darstellt. Enthalten sind 20 beispielgebende wissenschaftliche Referenzen, die exemplarisch für die Bedeutung von Web Scraping für die Forschung und die Gesellschaft stehen.

Eine der angeführten Zitationen stammt aus dem Hause GESIS: Aniko Hannák erstellte diese Arbeit mit Kolleg*innen der ETH Zürich, der Northeastern University und GESIS während eines Gastaufenthalts am GESIS-Standort Köln.

Hannák, A., Wagner, C., Garcia, D., Mislove, A., Strohmaier, M., & Wilson, C. (2017, February). Bias in online freelance marketplaces: Evidence from taskrabbit and fiverr. In Proceedings of the 2017 ACM conference on computer supported cooperative work and social computing (pp. 1914-1933). https://doi.org/10.1145/2998181.2998327