Volltextdatei(en) in REPOSIT vorhanden Open Access
Lizenz: 
Titel: Konsolidierung von kontrollierten Vokabularen im Text Mining
Sprache: Deutsch
Autorenschaft: Shi, Xiaoyu 
Schlagwörter: kontrolliertes Vokabular; Python; Pandas; Jupyter Notebook; Konsolidierung
Erscheinungsdatum: 7-Mai-2019
Zusammenfassung: 
Diese Arbeit beschäftigt sich mit der Frage, wie mit der Python-Bibliothek „Pandas“ die kontrollierten Vokabulare des Text-Mining-Projekts mit dem Titel „Schaffung von mehr Transparenz in der Bundestagswahl 2017“, das von Prof. Dr. Susanne Glissmann im Wintersemester 2017 am Department Information an der Hochschule für Angewandte Wissenschaften (HAW) geleitet wurde, konsolidiert werden können.
Nach der Beschreibung der theoretischen Grundlagen zu „Korpus“, dem kontrollierten Vokabular der Python-Bibliothek Pandas, und der Konsolidierung wird das Vorgehen zur Konsolidierung kontrollierter Vokabulare vorgestellt. Es gibt insgesamt 19 kontrollierte Vokabulare-Excel-Dateien, die zusammengeführt und aufbereitet werden. Der dabei genutzte Code wird mit der Python-Bibliothek „Pandas“ in der interaktiven Entwicklungsumgebung Jupyter Notebook erstellt. Das finale konsolidierte kontrollierte Vokabular ist im politischen Bereich nützlich und wertvoll. Die dazu entwickelten Skripte sind zur Analyse von Massendaten anderer Text-Mining-Projekte wiederverwendbar.
Für die Nutzung der Python-Bibliothek „Pandas“ ist keine Programmiererfahrung erforderlich.
URI: http://hdl.handle.net/20.500.12738/8724
Einrichtung: Department Information 
Dokumenttyp: Abschlussarbeit
Abschlussarbeitentyp: Bachelorarbeit
Hauptgutachter*in: Glissmann-Hochstein, Susanne 
Gutachter*in der Arbeit: Büschenfeldt, Maika 
Enthalten in den Sammlungen:Theses

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
Xiaoyu_Shi_Bachelorarbeit.pdf1.99 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Seitenansichten

244
checked on 26.12.2024

Download(s)

312
checked on 26.12.2024

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.