Lizenz: | Titel: | Konsolidierung von kontrollierten Vokabularen im Text Mining | Sprache: | Deutsch | Autorenschaft: | Shi, Xiaoyu | Schlagwörter: | kontrolliertes Vokabular; Python; Pandas; Jupyter Notebook; Konsolidierung | Erscheinungsdatum: | 7-Mai-2019 | Zusammenfassung: | Diese Arbeit beschäftigt sich mit der Frage, wie mit der Python-Bibliothek „Pandas“ die kontrollierten Vokabulare des Text-Mining-Projekts mit dem Titel „Schaffung von mehr Transparenz in der Bundestagswahl 2017“, das von Prof. Dr. Susanne Glissmann im Wintersemester 2017 am Department Information an der Hochschule für Angewandte Wissenschaften (HAW) geleitet wurde, konsolidiert werden können. Nach der Beschreibung der theoretischen Grundlagen zu „Korpus“, dem kontrollierten Vokabular der Python-Bibliothek Pandas, und der Konsolidierung wird das Vorgehen zur Konsolidierung kontrollierter Vokabulare vorgestellt. Es gibt insgesamt 19 kontrollierte Vokabulare-Excel-Dateien, die zusammengeführt und aufbereitet werden. Der dabei genutzte Code wird mit der Python-Bibliothek „Pandas“ in der interaktiven Entwicklungsumgebung Jupyter Notebook erstellt. Das finale konsolidierte kontrollierte Vokabular ist im politischen Bereich nützlich und wertvoll. Die dazu entwickelten Skripte sind zur Analyse von Massendaten anderer Text-Mining-Projekte wiederverwendbar. Für die Nutzung der Python-Bibliothek „Pandas“ ist keine Programmiererfahrung erforderlich. |
URI: | http://hdl.handle.net/20.500.12738/8724 | Einrichtung: | Department Information | Dokumenttyp: | Abschlussarbeit | Abschlussarbeitentyp: | Bachelorarbeit | Hauptgutachter*in: | Glissmann-Hochstein, Susanne | Gutachter*in der Arbeit: | Büschenfeldt, Maika |
Enthalten in den Sammlungen: | Theses |
Dateien zu dieser Ressource:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
Xiaoyu_Shi_Bachelorarbeit.pdf | 1.99 MB | Adobe PDF | Öffnen/Anzeigen |
Feedback zu diesem Datensatz
Export
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.