Titel: | Text-Klassifikation durch BERT-basiertes Text-Splitting gesteuert durch einen Suchalgorithmus | Sprache: | Deutsch | Autorenschaft: | Soblechero Salvado, André | Schlagwörter: | BERT; Text-Klassifikation; Dokumenten-Klassifikation; Textsplitter; Satzsegmentation; Gated Reccurent Units; Algorithmus; Transformer; sentence segmentation; algorithm | Erscheinungsdatum: | 19-Dez-2023 | Zusammenfassung: | Diese Arbeit stellt eine Möglichkeit vor trainierte Text-Klassifikatoren zu verbessern. Dies wird ermöglicht in dem nach dem Textsegment mit der höchsten Wahrscheinlichkeit für eine Klasse gesucht wird. Der Algorithmus konzentriert sich auf umgangsprachliche Texte und nutzt BERT, ein vortrainiertes Sprachmodell, welches im Jahr 2018 die wichtigsten Computerlinguistik-Bestenlisten dominierte. This paper introduces a new way to improve your trained text-classifier by searching for the text-segment with the highest likelihood for a class instead of using the whole text at once. This algorithmen focuses on colloquial speech and uses BERT, a petrained language model, which dominated the most important nlp benchmarks for some time in 2018. |
URI: | http://hdl.handle.net/20.500.12738/14496 | Einrichtung: | Department Informatik Fakultät Technik und Informatik |
Dokumenttyp: | Abschlussarbeit | Abschlussarbeitentyp: | Bachelorarbeit | Hauptgutachter*in: | Neitzke, Michael | Gutachter*in der Arbeit: | Pareigis, Stephan |
Enthalten in den Sammlungen: | Theses |
Dateien zu dieser Ressource:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
Bachelorarbeit Andre Soblechero_geschwärzt.pdf | 16.9 MB | Adobe PDF | Öffnen/Anzeigen |
Feedback zu diesem Datensatz
Export
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.