Fulltext available Open Access
License: 
Title: Word Embeddings der deutschen Medizinliteratur
Language: German
Authors: Haidar, Nassim 
Keywords: Word2Vec; GloVe; Fasttext; t-SNE; Word Embedding; medizinische Texte; Wort-Vektor; Worteinbettung; Ähnlichkeitstest; Analogie-Test; Textverarbeitung
Issue Date: 7-Dec-2020
Abstract: 
In dieser Arbeit werden die drei renommierten Word Embeddings (Word2Vec, GloVe und Fastext) mit einem deutschen medizinischen Text trainiert. Dabei soll geprüft werden, inwiefern die Word Embeddings den Inhalt eines deutschen medizinischen-Textes wiedergeben können. Dies wird untersucht, indem für Word Embeddings ein Ähnlichkeitstest und Analogie-Test durchgeführt werden. Zusätzlich werden die Wort-Vektoren visualisiert, um einen tieferen Einblick in die Word Embeddings zu ermöglichen. Dadurch ist es möglich, Cluster-Bildungen von ähnlichen Worten genauestens zu beobachten. Dabei wird deutlich, dass Fasttext eine zufriedenstellende Performance mit einem deutschen medizinischen Korpus erzielen kann.
URI: http://hdl.handle.net/20.500.12738/9978
Institute: Fakultät Life Sciences 
Department Medizintechnik 
Type: Thesis
Thesis type: Master Thesis
Advisor: Meisel, Andreas 
Referee: Motzek, Alexander 
Appears in Collections:Theses

Files in This Item:
File Description SizeFormat
HaidarNassimMA.pdf8.52 MBAdobe PDFView/Open
Show full item record

Page view(s)

271
checked on Dec 26, 2024

Download(s)

860
checked on Dec 26, 2024

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.