Fulltext available Open Access
Title: Using NLP to Improve Document Accessibility in the Legal Domain
Language: English
Authors: Nguyen, Dinh Hai 
Keywords: Rechtsdokumente; Textvereinfachung; Barrierefreiheit; NLP; Juristische Fachsprache; Lesbarkeit; Rechtliche Dokumentenzusammenfassung
Issue Date: 12-Nov-2025
Abstract: 
Juristische Dokumente enthalten häufig komplexe Satzstrukturen und spezialisierte Terminologie, was ihre Verständlichkeit für Nicht-Experten erschwert. Diese Arbeit untersucht, wie Natural Language Processing (NLP)-Techniken, insbesondere Textvereinfachung und abstraktive Zusammenfassung, die Lesbarkeit und Zugänglichkeit juristischer Texte verbessern können. In einer Reihe von Experimenten wurden vorgefertigte und feinabgestimmte NLPModelle (PEGASUS, BART und T5) evaluiert, der Einfluss der Textvereinfachung auf die Verarbeitung juristischer Dokumente untersucht und die Effektivität verschiedener Verarbeitungs-kombinationen analysiert. Die Ergebnisse zeigen, dass die Feinabstimmung von PEGASUS auf diverse juristische Datensätze die Zusammenfassungsqualität erheblich verbessert, wobei die Abstractheit und Inhaltsgenauigkeit erhalten bleiben. Allerdings wurde ein Zielkonflikt festgestellt: Während die Vereinfachung die Lesbarkeit verbessert, kann sie durch lexikalische Änderungen zu einem Informationsverlust führen. Die Reihenfolge der Vereinfachung und Zusammenfassung spielt eine entscheidende Rolle. Die Simplify-then-Summarize-Methode bewahrt juristische Fachbegriffe besser, während die Summarize-then-Simplify-Methode die besten Lesbar-keitswerte erzielt. Bewertungen mit Lesbarkeitsmetriken zeigen, dass die Vereinfachung die sprachliche Komplexität effektiv reduziert und juristische Dokumente zugänglicher macht. Allerdings erfassen standardisierte NLP-Metriken wie ROUGE und BLEU Lesbarkeitsverbesserungen nur unzureichend, da sie primär auf lexikalische Übereinstimmungen und nicht auf inhaltliche Klarheit fokussiert sind. Diese Forschung trägt zur Entwicklung von KI-gestützten juristischen Anwendungen bei, indem sie zeigt, wie NLP-Techniken helfen können, die Verständlichkeitslücke in juristischen Texten zu überbrücken. Zukünftige Arbeiten sollten Post-Processing-Methoden zur weiteren Verbesserung der Lesbarkeit, menschliche Evaluierungen zur juristischen Genauigkeit sowie Optimierungsstrategien für Vereinfachungsmodelle erforschen, um Zugänglichkeit und juristische Präzision in Einklang zu bringen.

Legal documents often contain complex sentence structures and specialized terminology, making them difficult to understand for non-experts. This thesis explores how Natural Language Processing (NLP) techniques, particularly text simplification and abstractive summarization, can improve the readability and accessibility of legal texts. Through a series of experiments, we evaluated pretrained and fine-tuned NLP models (PEGASUS, BART, and T5), assessed the impact of text simplification on legal document processing, and analyzed the effectiveness of different processing sequences. The findings show that fine-tuning PEGASUS on diverse legal datasets significantly improves summarization performance while maintaining its abstractiveness and content retention. However, a trade-off was observed: while simplification improves readability, it can lead to a decrease in content retention due to lexical modifications. The sequence of applying simplification and summarization plays a crucial role. The simplify-then-summarize approach better preserves key legal terms, while the summarizethen- simplify approach achieves higher readability scores. Readability assessments confirm that simplification effectively reduces linguistic complexity, making legal documents more accessible. However, standard NLP evaluation metrics, such as ROUGE and BLEU, may not fully capture improvements in readability, as they primarily focus on lexical overlap rather than conceptual clarity. This research contributes to legal AI applications by demonstrating how NLP techniques can bridge the gap between legal complexity and accessibility. Future work should explore post-processing methods for readability refinement, human-in-the-loop evaluation for legal accuracy, and optimization of simplification models to balance accessibility with legal precision.
URI: https://hdl.handle.net/20.500.12738/18382
Institute: Department Informatik (ehemalig, aufgelöst 10.2025) 
Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025) 
Type: Thesis
Thesis type: Bachelor Thesis
Advisor: Tropmann-Frick, Marina  
Referee: Tiedemann, Tim 
Appears in Collections:Theses

Files in This Item:
Show full item record

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.