Verbesserung der Klassifizierung bei geringer Datenmenge unter Berücksichtigung des Wortkontexts

Trendelenburg, Ferdinand Emanuel

DC Field	Value	Language
dc.contributor.advisor	Tropmann-Frick, Marina	-
dc.contributor.author	Trendelenburg, Ferdinand Emanuel	-
dc.date.accessioned	2026-01-21T13:37:34Z	-
dc.date.available	2026-01-21T13:37:34Z	-
dc.date.issued	2024-01-05	-
dc.identifier.uri	https://hdl.handle.net/20.500.12738/18699	-
dc.description.abstract	Diese Arbeit beschäftigt sich mit einigen Text-Klassifizierungsalgorithmen und derer Performance auf Datensätzen mit geringer Test- und Validierungsdatenmenge. Außerdem werden zwei neuartige Ansätze vorgestellt, die mittels einer bestimmten Kontextsuche eine höhere Zuverlässigkeit erbringen könnten. Dafür wurde ein bestehender, etablierter Algorithmus modifiziert und ein zweiter neuer Algortihmus konzipiert und implementiert. Die Performance dieser neuen Algortihmen wurden anschließend mit der Performance einer Auswahl von etablierten Algorithmen verglichen. In diesem Vergleich konnte keine zufriedenstellende Verbesserung der Klassifizierung durch das Hinzufügen einer Kontextvariable erzielt werden. Allerdings konnte ein Trend bei der Ergenzung um die Kontextvariable zu dem etablierten Algorithmus beobachtet werden, der sich allerdings nur auf 0:4% beläuft. Diese Verbesserung ist nur marginal, jedoch gibt diese einen Hinweis darauf, dass eine stärkere Verbesserung erreicht werden könnte, wenn an der Stelle weiter geforscht werden würde.	de
dc.description.abstract	This paper deals with some text classification algorithms and their performance on datasets with few test and validation data. In addition, two novel approaches are presented that could yield a higher performance by using context search. For this purpose, an existing, established algorithm was modified and a second new algorithm was designed and implemented. The performance of these new algorithms was then compared against the performance of a selection of established algorithms. In this comparison, no satisfactory improvement in classification could be achieved by adding a context variable. However, a trend can be observed in the addition of the context variable to the established algorithm, although this only amounts to 0:4%. This improvement is only marginal, but it gives an indication that a greater improvement could be achieved if further research was carried out in this area.	en
dc.language.iso	de	en_US
dc.subject	NLP	en_US
dc.subject	Textklassifizierung	en_US
dc.subject	Transformer	en_US
dc.subject	BERT	en_US
dc.subject	Logistische Regression	en_US
dc.subject.ddc	004: Informatik	en_US
dc.title	Verbesserung der Klassifizierung bei geringer Datenmenge unter Berücksichtigung des Wortkontexts	de
dc.type	Thesis	en_US
openaire.rights	info:eu-repo/semantics/openAccess	en_US
thesis.grantor.department	Department Informatik (ehemalig, aufgelöst 10.2025)	en_US
thesis.grantor.universityOrInstitution	Hochschule für Angewandte Wissenschaften Hamburg	en_US
tuhh.contributor.referee	Sarstedt, Stefan	-
tuhh.identifier.urn	urn:nbn:de:gbv:18302-reposit-229743	-
tuhh.oai.show	true	en_US
tuhh.publication.institute	Department Informatik (ehemalig, aufgelöst 10.2025)	en_US
tuhh.publication.institute	Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025)	en_US
tuhh.type.opus	Bachelor Thesis	-
dc.type.casrai	Supervised Student Publication	-
dc.type.dini	bachelorThesis	-
dc.type.driver	bachelorThesis	-
dc.type.status	info:eu-repo/semantics/publishedVersion	en_US
dc.type.thesis	bachelorThesis	en_US
dcterms.DCMIType	Text	-
tuhh.dnb.status	domain	en_US
item.creatorOrcid	Trendelenburg, Ferdinand Emanuel	-
item.advisorGND	Tropmann-Frick, Marina	-
item.creatorGND	Trendelenburg, Ferdinand Emanuel	-
item.languageiso639-1	de	-
item.openairetype	Thesis	-
item.openairecristype	http://purl.org/coar/resource_type/c_46ec	-
item.fulltext	With Fulltext	-
item.cerifentitytype	Publications	-
item.grantfulltext	open	-
Appears in Collections:	Theses