Fulltext available Open Access
DC FieldValueLanguage
dc.contributor.advisorSteffens, Ulrike-
dc.contributor.authorZhdanova, Daria-
dc.date.accessioned2026-06-23T08:42:11Z-
dc.date.available2026-06-23T08:42:11Z-
dc.date.issued2025-10-02-
dc.identifier.urihttps://hdl.handle.net/20.500.12738/19467-
dc.description.abstractIn dieser Arbeit werden verschiedene Ansätze zur Bereinigung von Daten für Mining-Prozesse untersucht und verglichen. Mithilfe von Werkzeugen wie Python-Pipelines, ETL-Prozessen sowie ML-basierten Ansätzen werden fehlerhafte Testdaten aus unterschiedlichen Quellen auf verschiedene Weise bereinigt. Der Schwerpunkt liegt auf der Evaluierung dieser Methoden und deren Einfluss auf die Genauigkeit der Data-Mining-Ergebnisse.de
dc.description.abstractThis study examines and compares various approaches to data cleansing for mining processes. Using tools such as Python pipelines, ETL workflows and machine learning-based approaches, faulty test data from multiple sources areas cleansed in different ways. The focus is on evaluating these methods and their influence on the accuracy of the data mining results.en
dc.language.isodeen_US
dc.subjectData Cleansingen_US
dc.subjectData Miningen_US
dc.subjectData Qualityen_US
dc.subject.ddc004: Informatiken_US
dc.titleData Cleansing Ansätze zur Verbesserung der Datenqualität am Beispiel fehlerhafter Testdaten für Data Miningde
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentDepartment Informatik (ehemalig, aufgelöst 10.2025)en_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeSarstedt, Stefan-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-241489-
tuhh.oai.showtrueen_US
tuhh.publication.instituteDepartment Informatik (ehemalig, aufgelöst 10.2025)en_US
tuhh.publication.instituteFakultät Technik und Informatik (ehemalig, aufgelöst 10.2025)en_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.creatorGNDZhdanova, Daria-
item.openairetypeThesis-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.languageiso639-1de-
item.advisorGNDSteffens, Ulrike-
item.grantfulltextopen-
item.fulltextWith Fulltext-
item.creatorOrcidZhdanova, Daria-
item.cerifentitytypePublications-
Appears in Collections:Theses
Files in This Item:
Show simple item record

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.