Fulltext available Open Access
Title: Nutzung von Stable Diffusion zur Datensatzgenerierung für die Bilderkennung von Verschmutzungen in Sanitärbereichen
Language: German
Authors: Tasch, Martin 
Issue Date: 27-Sep-2024
Abstract: 
Diese Arbeit untersucht die Anwendung von Stable Diffusion zur Generierung von Datensätzen für die Bilderkennung, speziell im Sanitärbereich. Die Methodik umfasst die Anpassung von Stable Diffusion für diese spezifische Anwendung mittels einer Low Rank Adaptation (LoRA) und nutzt das Realistic Vision 5.1 Modell zur Erstellung photorealistischer Bilder. Die Arbeit demonstriert die Machbarkeit der automatisierten Datensatzerstellung mit Stable Diffusion und erzielt vielversprechende Ergebnisse mit einer Validierungsgenauigkeit von über 90 % bei den generierten Datensätzen, bewertet durch ein trainiertes InceptionV3 Bilderkennungsmodell. Verbesserungspotentiale wurden identifiziert, darunter die Notwendigkeit, die realistische Darstellung der Verschmutzung durch einen größeren und realistischeren Trainingsdatensatz zu verbessern und das Modell mittels LoRA weiter anzupassen. Zukünftige Arbeiten sollten außerdem die Erstellung eines größeren, ausgewogeneren Evaluationsdatensatzes in Betracht ziehen, um aussagekräftigere Ergebnisse zu erzielen. Das Entwickelte Framework zur automatisierten Datensatzgenerierung ist unter folgendem Link auf Github verfügbar: https://github.com/marttasch/StableDiffusion_generateDataset

This thesis investigates the application of Stable Diffusion to generate datasets for image recognition, specifically in the sanitation domain. The methodology includes the adaptation of Stable Diffusion for this specific application using a Low Rank Adaptation (LoRA) and utilises the Realistic Vision 5.1 model to generate photorealistic images. The work demonstrates the feasibility of automated dataset generation with Stable Diffusion and achieves promising results with a validation accuracy of over 90 % for the generated datasets, evaluated by a trained InceptionV3 image recognition model. Areas for improvement were identified, including the need to improve the realistic representation of contamination with a larger and more realistic training dataset and to further customise the model using LoRA. Future work should also consider the creation of a larger, more balanced evaluation dataset to achieve more meaningful results. The developed framework for automated dataset generation is available on Github at the following link: https://github.com/marttasch/StableDiffusion_generateDataset
URI: https://hdl.handle.net/20.500.12738/16340
Institute: Fakultät Design, Medien und Information 
Department Medientechnik 
Type: Thesis
Thesis type: Bachelor Thesis
Advisor: Taefi, Tessa  
Referee: Fuchs, Cedrik 
Appears in Collections:Theses

Files in This Item:
File Description SizeFormat
BA_Nutzung_von_Stable_Diffusion.pdf1.85 MBAdobe PDFView/Open
Show full item record

Page view(s)

61
checked on Nov 23, 2024

Download(s)

38
checked on Nov 23, 2024

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.