Fulltext available Open Access
Title: Data Cleansing Ansätze zur Verbesserung der Datenqualität am Beispiel fehlerhafter Testdaten für Data Mining
Language: German
Authors: Zhdanova, Daria 
Keywords: Data Cleansing; Data Mining; Data Quality
Issue Date: 2-Oct-2025
Abstract: 
In dieser Arbeit werden verschiedene Ansätze zur Bereinigung von Daten für Mining-Prozesse untersucht und verglichen. Mithilfe von Werkzeugen wie Python-Pipelines, ETL-Prozessen sowie ML-basierten Ansätzen werden fehlerhafte Testdaten aus unterschiedlichen Quellen auf verschiedene Weise bereinigt. Der Schwerpunkt liegt auf der Evaluierung dieser Methoden und deren Einfluss auf die Genauigkeit der Data-Mining-Ergebnisse.

This study examines and compares various approaches to data cleansing for mining processes. Using tools such as Python pipelines, ETL workflows and machine learning-based approaches, faulty test data from multiple sources areas cleansed in different ways. The focus is on evaluating these methods and their influence on the accuracy of the data mining results.
URI: https://hdl.handle.net/20.500.12738/19467
Institute: Department Informatik (ehemalig, aufgelöst 10.2025) 
Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025) 
Type: Thesis
Thesis type: Bachelor Thesis
Advisor: Steffens, Ulrike  
Referee: Sarstedt, Stefan 
Appears in Collections:Theses

Files in This Item:
Show full item record

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.