Lizenz: | Titel: | Word Embeddings der deutschen Medizinliteratur | Sprache: | Deutsch | Autorenschaft: | Haidar, Nassim | Schlagwörter: | Word2Vec; GloVe; Fasttext; t-SNE; Word Embedding; medizinische Texte; Wort-Vektor; Worteinbettung; Ähnlichkeitstest; Analogie-Test; Textverarbeitung | Erscheinungsdatum: | 7-Dez-2020 | Zusammenfassung: | In dieser Arbeit werden die drei renommierten Word Embeddings (Word2Vec, GloVe und Fastext) mit einem deutschen medizinischen Text trainiert. Dabei soll geprüft werden, inwiefern die Word Embeddings den Inhalt eines deutschen medizinischen-Textes wiedergeben können. Dies wird untersucht, indem für Word Embeddings ein Ähnlichkeitstest und Analogie-Test durchgeführt werden. Zusätzlich werden die Wort-Vektoren visualisiert, um einen tieferen Einblick in die Word Embeddings zu ermöglichen. Dadurch ist es möglich, Cluster-Bildungen von ähnlichen Worten genauestens zu beobachten. Dabei wird deutlich, dass Fasttext eine zufriedenstellende Performance mit einem deutschen medizinischen Korpus erzielen kann. |
URI: | http://hdl.handle.net/20.500.12738/9978 | Einrichtung: | Fakultät Life Sciences Department Medizintechnik |
Dokumenttyp: | Abschlussarbeit | Abschlussarbeitentyp: | Masterarbeit | Hauptgutachter*in: | Meisel, Andreas | Gutachter*in der Arbeit: | Motzek, Alexander |
Enthalten in den Sammlungen: | Theses |
Dateien zu dieser Ressource:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
HaidarNassimMA.pdf | 8.52 MB | Adobe PDF | Öffnen/Anzeigen |
Feedback zu diesem Datensatz
Export
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.