Fulltext available Open Access
Title: Text-Klassifikation durch BERT-basiertes Text-Splitting gesteuert durch einen Suchalgorithmus
Language: German
Authors: Soblechero Salvado, André 
Keywords: BERT; Text-Klassifikation; Dokumenten-Klassifikation; Textsplitter; Satzsegmentation; Gated Reccurent Units; Algorithmus; Transformer; sentence segmentation; algorithm
Issue Date: 19-Dec-2023
Abstract: 
Diese Arbeit stellt eine Möglichkeit vor trainierte Text-Klassifikatoren zu verbessern. Dies wird ermöglicht in dem nach dem Textsegment mit der höchsten Wahrscheinlichkeit für eine Klasse gesucht wird. Der Algorithmus konzentriert sich auf umgangsprachliche Texte und nutzt BERT, ein vortrainiertes Sprachmodell, welches im Jahr 2018 die wichtigsten Computerlinguistik-Bestenlisten dominierte.

This paper introduces a new way to improve your trained text-classifier by searching for the text-segment with the highest likelihood for a class instead of using the whole text at once. This algorithmen focuses on colloquial speech and uses BERT, a petrained language model, which dominated the most important nlp benchmarks for some time in 2018.
URI: http://hdl.handle.net/20.500.12738/14496
Institute: Department Informatik 
Fakultät Technik und Informatik 
Type: Thesis
Thesis type: Bachelor Thesis
Advisor: Neitzke, Michael 
Referee: Pareigis, Stephan  
Appears in Collections:Theses

Files in This Item:
File Description SizeFormat
Bachelorarbeit Andre Soblechero_geschwärzt.pdf16.9 MBAdobe PDFView/Open
Show full item record

Page view(s)

161
checked on Jul 4, 2024

Download(s)

77
checked on Jul 4, 2024

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.