License: | Title: | Word Embeddings der deutschen Medizinliteratur | Language: | German | Authors: | Haidar, Nassim | Keywords: | Word2Vec; GloVe; Fasttext; t-SNE; Word Embedding; medizinische Texte; Wort-Vektor; Worteinbettung; Ähnlichkeitstest; Analogie-Test; Textverarbeitung | Issue Date: | 7-Dec-2020 | Abstract: | In dieser Arbeit werden die drei renommierten Word Embeddings (Word2Vec, GloVe und Fastext) mit einem deutschen medizinischen Text trainiert. Dabei soll geprüft werden, inwiefern die Word Embeddings den Inhalt eines deutschen medizinischen-Textes wiedergeben können. Dies wird untersucht, indem für Word Embeddings ein Ähnlichkeitstest und Analogie-Test durchgeführt werden. Zusätzlich werden die Wort-Vektoren visualisiert, um einen tieferen Einblick in die Word Embeddings zu ermöglichen. Dadurch ist es möglich, Cluster-Bildungen von ähnlichen Worten genauestens zu beobachten. Dabei wird deutlich, dass Fasttext eine zufriedenstellende Performance mit einem deutschen medizinischen Korpus erzielen kann. |
URI: | http://hdl.handle.net/20.500.12738/9978 | Institute: | Fakultät Life Sciences Department Medizintechnik |
Type: | Thesis | Thesis type: | Master Thesis | Advisor: | Meisel, Andreas | Referee: | Motzek, Alexander |
Appears in Collections: | Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
HaidarNassimMA.pdf | 8.52 MB | Adobe PDF | View/Open |
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.