Open Access
Title: Word Embeddings der deutschen Medizinliteratur
Language: German
Authors: Haidar, Nassim 
Keywords: Word2Vec;GloVe;Fasttext;t-SNE;Word Embedding;medizinische Texte;Wort-Vektor;Worteinbettung;Ähnlichkeitstest;Analogie-Test;Textverarbeitung
Issue Date: 7-Dec-2020
Abstract: 
In dieser Arbeit werden die drei renommierten Word Embeddings (Word2Vec, GloVe und Fastext) mit einem deutschen medizinischen Text trainiert. Dabei soll geprüft werden, inwiefern die Word Embeddings den Inhalt eines deutschen medizinischen-Textes wiedergeben können. Dies wird untersucht, indem für Word Embeddings ein Ähnlichkeitstest und Analogie-Test durchgeführt werden. Zusätzlich werden die Wort-Vektoren visualisiert, um einen tieferen Einblick in die Word Embeddings zu ermöglichen. Dadurch ist es möglich, Cluster-Bildungen von ähnlichen Worten genauestens zu beobachten. Dabei wird deutlich, dass Fasttext eine zufriedenstellende Performance mit einem deutschen medizinischen Korpus erzielen kann.
URI: https://reposit.haw-hamburg.de/handle/20.500.12738/9978
Institute: Fakultät Life Sciences 
Department Medizintechnik 
Type: Thesis
Thesis type: Master Thesis
Advisor: Meisel, Andreas 
Referee: Motzek, Alexander 
Appears in Collections:Theses

Files in This Item:
File Description SizeFormat
HaidarNassimMA.pdf8.52 MBAdobe PDFView/Open
Show full item record

Page view(s)

54
checked on Jan 24, 2021

Download(s)

19
checked on Jan 24, 2021

Google ScholarTM

Check

Note about this record

Export

Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.