Inhalt
Themen: Text and Data Mining
Text-Mining-Verfahren werden eingesetzt, um aus einer großen Menge an Texten automatisiert strukturierte Informationen zu extrahieren. Der Workshop vermittelt einen ersten, praktischen Einstieg in das Thema. Wir werden gemeinsam die Abstracts wissenschaftlicher Artikel analysieren. Als Werkzeug wirddie Python-Bibliothek Natural Language Toolkit zum Einsatz kommen, mit der wir die Texte in Tokens zerlegen, Stoppworte entfernen und schließlich Visualisierungen der für diese Abstracts charakteristischen Wörter erzeugen werden.
Für den Workshop werden keine Vorkenntnisse benötigt.
Zu Beginn wird es eine kurze Einführung in die Programmiersprache Python geben.Sie können alle Programmieraufgaben auf Ihrem lokalen PC durchführen. Als Arbeitsoberfläche werden wir die im Data-Science-Bereich beliebte Open-Source-Software Jupyter Notebook nutzen, um unseren Softwarecode auszuführen und dessen Ergebnisse anzeigen zu lassen.
Im Anschluss an den Workshop können Sie Ihr selbst erstelltes Jupyter-Notebook einsetzen, um die Analysen auf eigenen Textdokumenten zu wiederholen. Installationshinweise werden im Vorfeld des Workshops bereitgestellt.
- Unterrichtsart
- Web-Seminar
- Sonstiges Merkmal
- Grundlagen (Lernzielniveau)