Fulltext available Open Access
DC FieldValueLanguage
dc.contributor.advisorTropmann-Frick, Marina-
dc.contributor.authorTrendelenburg, Ferdinand Emanuel-
dc.date.accessioned2026-01-21T13:37:34Z-
dc.date.available2026-01-21T13:37:34Z-
dc.date.created2024-01-05-
dc.date.issued2026-01-21-
dc.identifier.urihttps://hdl.handle.net/20.500.12738/18699-
dc.description.abstractDiese Arbeit beschäftigt sich mit einigen Text-Klassifizierungsalgorithmen und derer Performance auf Datensätzen mit geringer Test- und Validierungsdatenmenge. Außerdem werden zwei neuartige Ansätze vorgestellt, die mittels einer bestimmten Kontextsuche eine höhere Zuverlässigkeit erbringen könnten. Dafür wurde ein bestehender, etablierter Algorithmus modifiziert und ein zweiter neuer Algortihmus konzipiert und implementiert. Die Performance dieser neuen Algortihmen wurden anschließend mit der Performance einer Auswahl von etablierten Algorithmen verglichen. In diesem Vergleich konnte keine zufriedenstellende Verbesserung der Klassifizierung durch das Hinzufügen einer Kontextvariable erzielt werden. Allerdings konnte ein Trend bei der Ergenzung um die Kontextvariable zu dem etablierten Algorithmus beobachtet werden, der sich allerdings nur auf 0:4% beläuft. Diese Verbesserung ist nur marginal, jedoch gibt diese einen Hinweis darauf, dass eine stärkere Verbesserung erreicht werden könnte, wenn an der Stelle weiter geforscht werden würde.de
dc.description.abstractThis paper deals with some text classification algorithms and their performance on datasets with few test and validation data. In addition, two novel approaches are presented that could yield a higher performance by using context search. For this purpose, an existing, established algorithm was modified and a second new algorithm was designed and implemented. The performance of these new algorithms was then compared against the performance of a selection of established algorithms. In this comparison, no satisfactory improvement in classification could be achieved by adding a context variable. However, a trend can be observed in the addition of the context variable to the established algorithm, although this only amounts to 0:4%. This improvement is only marginal, but it gives an indication that a greater improvement could be achieved if further research was carried out in this area.en
dc.language.isodeen_US
dc.subjectNLPen_US
dc.subjectTextklassifizierungen_US
dc.subjectTransformeren_US
dc.subjectBERTen_US
dc.subjectLogistische Regressionen_US
dc.subject.ddc004: Informatiken_US
dc.titleVerbesserung der Klassifizierung bei geringer Datenmenge unter Berücksichtigung des Wortkontextsde
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentDepartment Informatik (ehemalig, aufgelöst 10.2025)en_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeSarstedt, Stefan-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-229743-
tuhh.oai.showtrueen_US
tuhh.publication.instituteDepartment Informatik (ehemalig, aufgelöst 10.2025)en_US
tuhh.publication.instituteFakultät Technik und Informatik (ehemalig, aufgelöst 10.2025)en_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.creatorOrcidTrendelenburg, Ferdinand Emanuel-
item.openairetypeThesis-
item.creatorGNDTrendelenburg, Ferdinand Emanuel-
item.languageiso639-1de-
item.advisorGNDTropmann-Frick, Marina-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.fulltextWith Fulltext-
item.cerifentitytypePublications-
item.grantfulltextopen-
Appears in Collections:Theses
Show simple item record

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.