Monolinguale Maschinenübersetzung von Standardsprache in Leichte Sprache mittels Retrieval-Augmented Generation und Large Language Models

Tinman, Burak

DC Field	Value	Language
dc.contributor.advisor	Tropmann-Frick, Marina	-
dc.contributor.author	Tinman, Burak	-
dc.date.accessioned	2026-05-29T10:26:14Z	-
dc.date.available	2026-05-29T10:26:14Z	-
dc.date.issued	2025-08-21	-
dc.identifier.uri	https://hdl.handle.net/20.500.12738/19395	-
dc.description.abstract	Barrierefreiheit und Inklusion erfordern zugängliche Informationen. Insbesondere im öffentlichen Sektor ist dabei die Leichte Sprache von großer Bedeutung. Manuelle Übersetzungen sind jedoch zeit- und kostenintensiv. Diese Arbeit untersucht deshalb die automatisierte, monolinguale Textvereinfachung von deutscher Standardsprache in Leichte Sprache, mit einem spezifischen Fokus auf die Anforderungen des öffentlichen Sektors. Im Mittelpunkt steht der systematische Vergleich der Leistungsfähigkeit kleinerer Large Language Models mit jener großer, dem Stand der Technik entsprechender Modelle. Der Vergleich berücksichtigt neben qualitativen Anforderungen, evaluiert anhand der Kriterien Einfachheit, Grammatikalität und Semantik durch automatisierte Metriken, auch wirtschaftliche und rechtliche Aspekte, die im öffentlichen Sektor ebenfalls relevant sind. Darüber hinaus wird die Wirksamkeit der zwei Optimierungsstrategien In-context Learning mittels Retrieval-Augmented Generation und Fine-Tuning der Modelle evaluiert. Die Ergebnisse belegen, dass State-of-the-Art-Modelle zwar gute Übersetzungen liefern, aber optimierte kleinere Sprachmodelle eine kompetitive oder sogar überlegene Leistung erzielen können. Retrieval-Augmented Generation verbessert die Textqualität durch die Einbeziehung domänenspezifischer Beispiele, und auch das Fine-Tuning erweist sich als robuste Methode zur Leistungssteigerung. Schließlich wird gezeigt, dass optimierte kleinere Sprachmodelle eine leistungsstarke, kosteneffiziente und datenschutzkonforme Alternative zu großen, cloudbasierten Modellen darstellen. Sie bieten öffentlichen Institutionen eine praktikable Lösung, um die qualitativen, wirtschaftlichen und gesetzlichen Anforderungen an die digitale Barrierefreiheit zu erfüllen.	de
dc.description.abstract	Accessibility and inclusion require accessible information. In the public sector in particular, Easy Language is of great importance. However, manual translations are timeconsuming and costly. This work therefore investigates the automated, monolingual text simplification from standard German into Easy Language, with a specific focus on the requirements of the public sector. The core of the study is a systematic comparison of the performance of smaller Large Language Models with that of large, state-of-the-art models. The comparison considers not only qualitative requirements, evaluated using automated metrics based on the criteria of simplicity, grammaticality, and semantics, but also economic and legal aspects relevant to the public sector. Furthermore, the effectiveness of the two optimization strategies In-context Learning via Retrieval-Augmented Generation and Fine-Tuning of the models is evaluated. The results demonstrate that while state-of-the-art models already provide good translations, optimized smaller language models can achieve competitive or even superior performance. Retrieval-Augmented Generation improves text quality by incorporating domain-specific examples, and Fine-Tuning also proves to be a robust method for performance enhancement. Finally, it is shown that optimized smaller language models represent a high-performing, cost-effective, and privacy-compliant alternative to large, cloud-based models. They offer public institutions a viable solution to meet the qualitative, economic, and legal requirements for digital accessibility.	en
dc.language.iso	de	en_US
dc.subject	Maschinenübersetzung	en_US
dc.subject	Leichte Sprache	en_US
dc.subject	Large Language Models	en_US
dc.subject	Retrieval-Augmented Generation	en_US
dc.subject	In-context Learning	en_US
dc.subject	Fine-Tuning	en_US
dc.subject.ddc	004: Informatik	en_US
dc.title	Monolinguale Maschinenübersetzung von Standardsprache in Leichte Sprache mittels Retrieval-Augmented Generation und Large Language Models	de
dc.type	Thesis	en_US
openaire.rights	info:eu-repo/semantics/openAccess	en_US
thesis.grantor.department	Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025)	en_US
thesis.grantor.department	Department Informatik (ehemalig, aufgelöst 10.2025)	en_US
thesis.grantor.universityOrInstitution	Hochschule für Angewandte Wissenschaften Hamburg	en_US
tuhh.contributor.referee	Schultz, Martin	-
tuhh.identifier.urn	urn:nbn:de:gbv:18302-reposit-240225	-
tuhh.oai.show	true	en_US
tuhh.publication.institute	Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025)	en_US
tuhh.publication.institute	Department Informatik (ehemalig, aufgelöst 10.2025)	en_US
tuhh.type.opus	Masterarbeit	-
dc.type.casrai	Supervised Student Publication	-
dc.type.dini	masterThesis	-
dc.type.driver	masterThesis	-
dc.type.status	info:eu-repo/semantics/publishedVersion	en_US
dc.type.thesis	masterThesis	en_US
dcterms.DCMIType	Text	-
tuhh.dnb.status	domain	en_US
item.languageiso639-1	de	-
item.openairetype	Thesis	-
item.fulltext	With Fulltext	-
item.advisorGND	Tropmann-Frick, Marina	-
item.cerifentitytype	Publications	-
item.grantfulltext	open	-
item.creatorOrcid	Tinman, Burak	-
item.creatorGND	Tinman, Burak	-
item.openairecristype	http://purl.org/coar/resource_type/c_46ec	-
Appears in Collections:	Theses