| Title: | Verbesserung der Klassifizierung bei geringer Datenmenge unter Berücksichtigung des Wortkontexts | Language: | German | Authors: | Trendelenburg, Ferdinand Emanuel | Keywords: | NLP; Textklassifizierung; Transformer; BERT; Logistische Regression | Issue Date: | 21-Jan-2026 | Abstract: | Diese Arbeit beschäftigt sich mit einigen Text-Klassifizierungsalgorithmen und derer Performance auf Datensätzen mit geringer Test- und Validierungsdatenmenge. Außerdem werden zwei neuartige Ansätze vorgestellt, die mittels einer bestimmten Kontextsuche eine höhere Zuverlässigkeit erbringen könnten. Dafür wurde ein bestehender, etablierter Algorithmus modifiziert und ein zweiter neuer Algortihmus konzipiert und implementiert. Die Performance dieser neuen Algortihmen wurden anschließend mit der Performance einer Auswahl von etablierten Algorithmen verglichen. In diesem Vergleich konnte keine zufriedenstellende Verbesserung der Klassifizierung durch das Hinzufügen einer Kontextvariable erzielt werden. Allerdings konnte ein Trend bei der Ergenzung um die Kontextvariable zu dem etablierten Algorithmus beobachtet werden, der sich allerdings nur auf 0:4% beläuft. Diese Verbesserung ist nur marginal, jedoch gibt diese einen Hinweis darauf, dass eine stärkere Verbesserung erreicht werden könnte, wenn an der Stelle weiter geforscht werden würde. This paper deals with some text classification algorithms and their performance on datasets with few test and validation data. In addition, two novel approaches are presented that could yield a higher performance by using context search. For this purpose, an existing, established algorithm was modified and a second new algorithm was designed and implemented. The performance of these new algorithms was then compared against the performance of a selection of established algorithms. In this comparison, no satisfactory improvement in classification could be achieved by adding a context variable. However, a trend can be observed in the addition of the context variable to the established algorithm, although this only amounts to 0:4%. This improvement is only marginal, but it gives an indication that a greater improvement could be achieved if further research was carried out in this area. |
URI: | https://hdl.handle.net/20.500.12738/18699 | Institute: | Department Informatik (ehemalig, aufgelöst 10.2025) Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025) |
Type: | Thesis | Thesis type: | Bachelor Thesis | Advisor: | Tropmann-Frick, Marina |
Referee: | Sarstedt, Stefan |
| Appears in Collections: | Theses |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| BA_Verbesserung der Klassifizierung bei geringer Datenmenge unter Berücksichtigung des Wortkontexts_geschwärzt.pdf | 1.37 MB | Adobe PDF | View/Open |
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.