Volltextdatei(en) in REPOSIT vorhanden Open Access
Titel: Nutzung von Stable Diffusion zur Datensatzgenerierung für die Bilderkennung von Verschmutzungen in Sanitärbereichen
Sprache: Deutsch
Autorenschaft: Tasch, Martin 
Erscheinungsdatum: 27-Sep-2024
Zusammenfassung: 
Diese Arbeit untersucht die Anwendung von Stable Diffusion zur Generierung von Datensätzen für die Bilderkennung, speziell im Sanitärbereich. Die Methodik umfasst die Anpassung von Stable Diffusion für diese spezifische Anwendung mittels einer Low Rank Adaptation (LoRA) und nutzt das Realistic Vision 5.1 Modell zur Erstellung photorealistischer Bilder. Die Arbeit demonstriert die Machbarkeit der automatisierten Datensatzerstellung mit Stable Diffusion und erzielt vielversprechende Ergebnisse mit einer Validierungsgenauigkeit von über 90 % bei den generierten Datensätzen, bewertet durch ein trainiertes InceptionV3 Bilderkennungsmodell. Verbesserungspotentiale wurden identifiziert, darunter die Notwendigkeit, die realistische Darstellung der Verschmutzung durch einen größeren und realistischeren Trainingsdatensatz zu verbessern und das Modell mittels LoRA weiter anzupassen. Zukünftige Arbeiten sollten außerdem die Erstellung eines größeren, ausgewogeneren Evaluationsdatensatzes in Betracht ziehen, um aussagekräftigere Ergebnisse zu erzielen. Das Entwickelte Framework zur automatisierten Datensatzgenerierung ist unter folgendem Link auf Github verfügbar: https://github.com/marttasch/StableDiffusion_generateDataset

This thesis investigates the application of Stable Diffusion to generate datasets for image recognition, specifically in the sanitation domain. The methodology includes the adaptation of Stable Diffusion for this specific application using a Low Rank Adaptation (LoRA) and utilises the Realistic Vision 5.1 model to generate photorealistic images. The work demonstrates the feasibility of automated dataset generation with Stable Diffusion and achieves promising results with a validation accuracy of over 90 % for the generated datasets, evaluated by a trained InceptionV3 image recognition model. Areas for improvement were identified, including the need to improve the realistic representation of contamination with a larger and more realistic training dataset and to further customise the model using LoRA. Future work should also consider the creation of a larger, more balanced evaluation dataset to achieve more meaningful results. The developed framework for automated dataset generation is available on Github at the following link: https://github.com/marttasch/StableDiffusion_generateDataset
URI: https://hdl.handle.net/20.500.12738/16340
Einrichtung: Fakultät Design, Medien und Information 
Department Medientechnik 
Dokumenttyp: Abschlussarbeit
Abschlussarbeitentyp: Bachelorarbeit
Hauptgutachter*in: Taefi, Tessa  
Gutachter*in der Arbeit: Fuchs, Cedrik 
Enthalten in den Sammlungen:Theses

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
BA_Nutzung_von_Stable_Diffusion.pdf1.85 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Seitenansichten

61
checked on 23.11.2024

Download(s)

38
checked on 23.11.2024

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.