Einsteiger-Kit der computergestützten Text- und Netzwerkanalyse

Hilfreiche Materialien, Online-Ressourcen und Kurse für Programmierneulinge und angehende Datenwissenschaftler*innen

Der Einstieg in die Welt des Programmierens im Allgemeinen und der computergestützten Textverfahren im Speziellen bedarf Hingabe, Zeit und regelmäßiger Routinen. Die Lernkurve ist vor allem am Anfang relativ steil, stellt sich doch oftmals eine Überforderung im Anbetracht der neuen, vergleichsweise komplizierten und weitläufigen Materie ein. Es existieren jedoch eine Reihe von Ressourcen und Lernmaterialien, die den Lernprozess sinnvoll unterstützen und hilfreiche Informationen passgenau für Neulinge bereitstellen. Dabei bieten bereits die kostenfreien Angebote viele Möglichkeiten, um sich im Eigenstudium weiterzubilden, während kostenpflichtige Weiterbildungen und Materialien – je nach Geldbeutel und thematischem Fokus – eine sinnvolle Ergänzung darstellen können. Der vorliegende Beitrag soll – im Nachgang zu der von modus|zad im Rahmen von Level Up! im September 2022 organisierten Online-Fachkonferenz zur computergestützten Text- und Netzwerkanalyse – einen entsprechenden Überblick präsentieren.

Geordnet sind die folgenden Informationen in einem ersten Schritt nach dem Kostenfaktor und in einem zweiten Schritt nach der Art des Materials. Empfehlungen, insbesondere für Einsteiger*innen, sind mit drei roten Sternchen versehen. Es gilt zu beachten, dass viele der Ressourcen entweder für R oder Python maßgeschneidert sind, zwei der am häufigsten genutzten Programmiersprachen auf dem Feld der Datenwissenschaften. Daher wurde ggf. der entsprechende Verweis auf die verwendete Programmiersprache in Klammern hinzugefügt.[1]

1) Kostenfreie Ressourcen

      1a) Bücher:

  • van Atteveldt/Trilling/Arcila Calderon (2022): Computational Analysis of Communication.[2] *** (für R und Python)
  • Silge/Robinson (2017): Text Mining with R.[3] *** (für R)
  • Bird/Klein/Loper (2009): Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit.[4] (für Python)

    1b) Online-Ressourcen:

    1c) Gemeinnützige Institutionen:

2) Kostenpflichtige Ressourcen

    2a) Buch:

  • Grimmer/Roberts/Stewart (2022): Text As Data: A New Framework for Machine Learning and the Social Sciences.
  • Salganik (2017): Bit by Bit: Social Research in the Digital Age.
  • Raschka/Liu/Mirjalili/Dzhulgakov (2022): Machine Learning with PyTorch and Scikit-Learn: Develop machine learning and deep learning models with Python. (für Python)

    2b) Kurse und Weiterbildungen:

___________________________________________________________________________________________________________________________________

[1] Um Programmiersprachen zu nutzen, werden üblicherweise Code-Editoren verwendet. Diese Editoren sind Computerprogramme, in welchen der Code geschrieben wird. Für R benutzen viele Programmierer*innen RStudio als Editor. Für Python existiert eine ganze Reihe von Angeboten, die letztlich alle die grundlegenden Funktionen implementiert haben. Der Verfasser des Textes nutzt PyCharm und Visual Studio Code für Python, aber letztlich bleibt die Entscheidung der eigenen Präferenz überlassen. Neben diesen lokalen Editoren existieren zudem digitale Code-Editoren, wie etwa Jupyter Notebook oder Google Colab, die über den eigenen Internetbrowser abrufbar sind. Beide Angebote haben zwei große Vorteile: Erstens ermöglichen sie einen schnellen Beginn mit dem Programmieren für Einsteiger*innen ohne lästige Installationen auf dem lokalen Rechner (was vor allem bei Python immer wieder zu Komplikationen führt). Zweitens kann eine virtuelle Grafikkarte zugeschalteten werden, die im Zusammenhang mit fortgeschritteneren Methoden und deren aufwendigeren Rechenprozessen mit enormen Vorteilen in der Geschwindigkeit verbunden ist. 

[2] Kostenfrei einsehbar unter: Link

[3] Kostenfrei einsehbar unter: Link

[4] Kostenfrei einsehbar unter: Link

[5] Eine Online-Community für Datenwissenschaftler*innen und Programmierer*innen.

[6] CorrelAid ist „ein überparteiliches, gemeinnütziges Netzwerk von Data-Science-begeisterten Menschen“, welches u.a. soziale Organisationen pro-bono im Bereich Datenwissenschaften unterstützt und weiterbildet.

[7] Das Institut bietet ganzjährig Offline- und Online-Seminare bzw. Workshops zu unterschiedlichen Themen der empirischen Sozialforschung und Datenwissenschaften. Einführungskurse finden üblicherweise im Herbst statt. Rabatte für Forschende bzw. Studierende werden offeriert. Es existiert zudem ein Newsletter, der über das Kursangebot informiert: https://www.gesis.org/gesis-training/ueber-uns/newsletter.