| DC Field | Value | Language |
|---|---|---|
| dc.contributor.advisor | Tropmann-Frick, Marina | - |
| dc.contributor.author | Tinman, Burak | - |
| dc.date.accessioned | 2026-05-29T10:26:14Z | - |
| dc.date.available | 2026-05-29T10:26:14Z | - |
| dc.date.issued | 2025-08-21 | - |
| dc.identifier.uri | https://hdl.handle.net/20.500.12738/19395 | - |
| dc.description.abstract | Barrierefreiheit und Inklusion erfordern zugängliche Informationen. Insbesondere im öffentlichen Sektor ist dabei die Leichte Sprache von großer Bedeutung. Manuelle Übersetzungen sind jedoch zeit- und kostenintensiv. Diese Arbeit untersucht deshalb die automatisierte, monolinguale Textvereinfachung von deutscher Standardsprache in Leichte Sprache, mit einem spezifischen Fokus auf die Anforderungen des öffentlichen Sektors. Im Mittelpunkt steht der systematische Vergleich der Leistungsfähigkeit kleinerer Large Language Models mit jener großer, dem Stand der Technik entsprechender Modelle. Der Vergleich berücksichtigt neben qualitativen Anforderungen, evaluiert anhand der Kriterien Einfachheit, Grammatikalität und Semantik durch automatisierte Metriken, auch wirtschaftliche und rechtliche Aspekte, die im öffentlichen Sektor ebenfalls relevant sind. Darüber hinaus wird die Wirksamkeit der zwei Optimierungsstrategien In-context Learning mittels Retrieval-Augmented Generation und Fine-Tuning der Modelle evaluiert. Die Ergebnisse belegen, dass State-of-the-Art-Modelle zwar gute Übersetzungen liefern, aber optimierte kleinere Sprachmodelle eine kompetitive oder sogar überlegene Leistung erzielen können. Retrieval-Augmented Generation verbessert die Textqualität durch die Einbeziehung domänenspezifischer Beispiele, und auch das Fine-Tuning erweist sich als robuste Methode zur Leistungssteigerung. Schließlich wird gezeigt, dass optimierte kleinere Sprachmodelle eine leistungsstarke, kosteneffiziente und datenschutzkonforme Alternative zu großen, cloudbasierten Modellen darstellen. Sie bieten öffentlichen Institutionen eine praktikable Lösung, um die qualitativen, wirtschaftlichen und gesetzlichen Anforderungen an die digitale Barrierefreiheit zu erfüllen. | de |
| dc.description.abstract | Accessibility and inclusion require accessible information. In the public sector in particular, Easy Language is of great importance. However, manual translations are timeconsuming and costly. This work therefore investigates the automated, monolingual text simplification from standard German into Easy Language, with a specific focus on the requirements of the public sector. The core of the study is a systematic comparison of the performance of smaller Large Language Models with that of large, state-of-the-art models. The comparison considers not only qualitative requirements, evaluated using automated metrics based on the criteria of simplicity, grammaticality, and semantics, but also economic and legal aspects relevant to the public sector. Furthermore, the effectiveness of the two optimization strategies In-context Learning via Retrieval-Augmented Generation and Fine-Tuning of the models is evaluated. The results demonstrate that while state-of-the-art models already provide good translations, optimized smaller language models can achieve competitive or even superior performance. Retrieval-Augmented Generation improves text quality by incorporating domain-specific examples, and Fine-Tuning also proves to be a robust method for performance enhancement. Finally, it is shown that optimized smaller language models represent a high-performing, cost-effective, and privacy-compliant alternative to large, cloud-based models. They offer public institutions a viable solution to meet the qualitative, economic, and legal requirements for digital accessibility. | en |
| dc.language.iso | de | en_US |
| dc.subject | Maschinenübersetzung | en_US |
| dc.subject | Leichte Sprache | en_US |
| dc.subject | Large Language Models | en_US |
| dc.subject | Retrieval-Augmented Generation | en_US |
| dc.subject | In-context Learning | en_US |
| dc.subject | Fine-Tuning | en_US |
| dc.subject.ddc | 004: Informatik | en_US |
| dc.title | Monolinguale Maschinenübersetzung von Standardsprache in Leichte Sprache mittels Retrieval-Augmented Generation und Large Language Models | de |
| dc.type | Thesis | en_US |
| openaire.rights | info:eu-repo/semantics/openAccess | en_US |
| thesis.grantor.department | Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| thesis.grantor.department | Department Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| thesis.grantor.universityOrInstitution | Hochschule für Angewandte Wissenschaften Hamburg | en_US |
| tuhh.contributor.referee | Schultz, Martin | - |
| tuhh.identifier.urn | urn:nbn:de:gbv:18302-reposit-240225 | - |
| tuhh.oai.show | true | en_US |
| tuhh.publication.institute | Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| tuhh.publication.institute | Department Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| tuhh.type.opus | Masterarbeit | - |
| dc.type.casrai | Supervised Student Publication | - |
| dc.type.dini | masterThesis | - |
| dc.type.driver | masterThesis | - |
| dc.type.status | info:eu-repo/semantics/publishedVersion | en_US |
| dc.type.thesis | masterThesis | en_US |
| dcterms.DCMIType | Text | - |
| tuhh.dnb.status | domain | en_US |
| item.languageiso639-1 | de | - |
| item.openairetype | Thesis | - |
| item.fulltext | With Fulltext | - |
| item.advisorGND | Tropmann-Frick, Marina | - |
| item.cerifentitytype | Publications | - |
| item.grantfulltext | open | - |
| item.creatorOrcid | Tinman, Burak | - |
| item.creatorGND | Tinman, Burak | - |
| item.openairecristype | http://purl.org/coar/resource_type/c_46ec | - |
| Appears in Collections: | Theses | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| MA_Monolinguale_Maschinenübersetzung_Standardsprache_Leichte_Sprache.pdf | 2.32 MB | Adobe PDF | View/Open |
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.