| DC Element | Wert | Sprache |
|---|---|---|
| dc.contributor.advisor | Tropmann-Frick, Marina | - |
| dc.contributor.author | Trendelenburg, Ferdinand Emanuel | - |
| dc.date.accessioned | 2026-01-21T13:37:34Z | - |
| dc.date.available | 2026-01-21T13:37:34Z | - |
| dc.date.created | 2024-01-05 | - |
| dc.date.issued | 2026-01-21 | - |
| dc.identifier.uri | https://hdl.handle.net/20.500.12738/18699 | - |
| dc.description.abstract | Diese Arbeit beschäftigt sich mit einigen Text-Klassifizierungsalgorithmen und derer Performance auf Datensätzen mit geringer Test- und Validierungsdatenmenge. Außerdem werden zwei neuartige Ansätze vorgestellt, die mittels einer bestimmten Kontextsuche eine höhere Zuverlässigkeit erbringen könnten. Dafür wurde ein bestehender, etablierter Algorithmus modifiziert und ein zweiter neuer Algortihmus konzipiert und implementiert. Die Performance dieser neuen Algortihmen wurden anschließend mit der Performance einer Auswahl von etablierten Algorithmen verglichen. In diesem Vergleich konnte keine zufriedenstellende Verbesserung der Klassifizierung durch das Hinzufügen einer Kontextvariable erzielt werden. Allerdings konnte ein Trend bei der Ergenzung um die Kontextvariable zu dem etablierten Algorithmus beobachtet werden, der sich allerdings nur auf 0:4% beläuft. Diese Verbesserung ist nur marginal, jedoch gibt diese einen Hinweis darauf, dass eine stärkere Verbesserung erreicht werden könnte, wenn an der Stelle weiter geforscht werden würde. | de |
| dc.description.abstract | This paper deals with some text classification algorithms and their performance on datasets with few test and validation data. In addition, two novel approaches are presented that could yield a higher performance by using context search. For this purpose, an existing, established algorithm was modified and a second new algorithm was designed and implemented. The performance of these new algorithms was then compared against the performance of a selection of established algorithms. In this comparison, no satisfactory improvement in classification could be achieved by adding a context variable. However, a trend can be observed in the addition of the context variable to the established algorithm, although this only amounts to 0:4%. This improvement is only marginal, but it gives an indication that a greater improvement could be achieved if further research was carried out in this area. | en |
| dc.language.iso | de | en_US |
| dc.subject | NLP | en_US |
| dc.subject | Textklassifizierung | en_US |
| dc.subject | Transformer | en_US |
| dc.subject | BERT | en_US |
| dc.subject | Logistische Regression | en_US |
| dc.subject.ddc | 004: Informatik | en_US |
| dc.title | Verbesserung der Klassifizierung bei geringer Datenmenge unter Berücksichtigung des Wortkontexts | de |
| dc.type | Thesis | en_US |
| openaire.rights | info:eu-repo/semantics/openAccess | en_US |
| thesis.grantor.department | Department Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| thesis.grantor.universityOrInstitution | Hochschule für Angewandte Wissenschaften Hamburg | en_US |
| tuhh.contributor.referee | Sarstedt, Stefan | - |
| tuhh.identifier.urn | urn:nbn:de:gbv:18302-reposit-229743 | - |
| tuhh.oai.show | true | en_US |
| tuhh.publication.institute | Department Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| tuhh.publication.institute | Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| tuhh.type.opus | Bachelor Thesis | - |
| dc.type.casrai | Supervised Student Publication | - |
| dc.type.dini | bachelorThesis | - |
| dc.type.driver | bachelorThesis | - |
| dc.type.status | info:eu-repo/semantics/publishedVersion | en_US |
| dc.type.thesis | bachelorThesis | en_US |
| dcterms.DCMIType | Text | - |
| tuhh.dnb.status | domain | en_US |
| item.creatorOrcid | Trendelenburg, Ferdinand Emanuel | - |
| item.openairetype | Thesis | - |
| item.creatorGND | Trendelenburg, Ferdinand Emanuel | - |
| item.languageiso639-1 | de | - |
| item.advisorGND | Tropmann-Frick, Marina | - |
| item.openairecristype | http://purl.org/coar/resource_type/c_46ec | - |
| item.fulltext | With Fulltext | - |
| item.cerifentitytype | Publications | - |
| item.grantfulltext | open | - |
| Enthalten in den Sammlungen: | Theses | |
Dateien zu dieser Ressource:
| Datei | Beschreibung | Größe | Format | |
|---|---|---|---|---|
| BA_Verbesserung der Klassifizierung bei geringer Datenmenge unter Berücksichtigung des Wortkontexts_geschwärzt.pdf | 1.37 MB | Adobe PDF | Öffnen/Anzeigen |
Feedback zu diesem Datensatz
Export
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.