Title: | Text-Klassifikation durch BERT-basiertes Text-Splitting gesteuert durch einen Suchalgorithmus | Language: | German | Authors: | Soblechero Salvado, André | Keywords: | BERT; Text-Klassifikation; Dokumenten-Klassifikation; Textsplitter; Satzsegmentation; Gated Reccurent Units; Algorithmus; Transformer; sentence segmentation; algorithm | Issue Date: | 19-Dec-2023 | Abstract: | Diese Arbeit stellt eine Möglichkeit vor trainierte Text-Klassifikatoren zu verbessern. Dies wird ermöglicht in dem nach dem Textsegment mit der höchsten Wahrscheinlichkeit für eine Klasse gesucht wird. Der Algorithmus konzentriert sich auf umgangsprachliche Texte und nutzt BERT, ein vortrainiertes Sprachmodell, welches im Jahr 2018 die wichtigsten Computerlinguistik-Bestenlisten dominierte. This paper introduces a new way to improve your trained text-classifier by searching for the text-segment with the highest likelihood for a class instead of using the whole text at once. This algorithmen focuses on colloquial speech and uses BERT, a petrained language model, which dominated the most important nlp benchmarks for some time in 2018. |
URI: | http://hdl.handle.net/20.500.12738/14496 | Institute: | Department Informatik Fakultät Technik und Informatik |
Type: | Thesis | Thesis type: | Bachelor Thesis | Advisor: | Neitzke, Michael | Referee: | Pareigis, Stephan |
Appears in Collections: | Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Bachelorarbeit Andre Soblechero_geschwärzt.pdf | 16.9 MB | Adobe PDF | View/Open |
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.