| DC Field | Value | Language |
|---|---|---|
| dc.contributor.advisor | Steffens, Ulrike | - |
| dc.contributor.author | Zhdanova, Daria | - |
| dc.date.accessioned | 2026-06-23T08:42:11Z | - |
| dc.date.available | 2026-06-23T08:42:11Z | - |
| dc.date.issued | 2025-10-02 | - |
| dc.identifier.uri | https://hdl.handle.net/20.500.12738/19467 | - |
| dc.description.abstract | In dieser Arbeit werden verschiedene Ansätze zur Bereinigung von Daten für Mining-Prozesse untersucht und verglichen. Mithilfe von Werkzeugen wie Python-Pipelines, ETL-Prozessen sowie ML-basierten Ansätzen werden fehlerhafte Testdaten aus unterschiedlichen Quellen auf verschiedene Weise bereinigt. Der Schwerpunkt liegt auf der Evaluierung dieser Methoden und deren Einfluss auf die Genauigkeit der Data-Mining-Ergebnisse. | de |
| dc.description.abstract | This study examines and compares various approaches to data cleansing for mining processes. Using tools such as Python pipelines, ETL workflows and machine learning-based approaches, faulty test data from multiple sources areas cleansed in different ways. The focus is on evaluating these methods and their influence on the accuracy of the data mining results. | en |
| dc.language.iso | de | en_US |
| dc.subject | Data Cleansing | en_US |
| dc.subject | Data Mining | en_US |
| dc.subject | Data Quality | en_US |
| dc.subject.ddc | 004: Informatik | en_US |
| dc.title | Data Cleansing Ansätze zur Verbesserung der Datenqualität am Beispiel fehlerhafter Testdaten für Data Mining | de |
| dc.type | Thesis | en_US |
| openaire.rights | info:eu-repo/semantics/openAccess | en_US |
| thesis.grantor.department | Department Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| thesis.grantor.universityOrInstitution | Hochschule für Angewandte Wissenschaften Hamburg | en_US |
| tuhh.contributor.referee | Sarstedt, Stefan | - |
| tuhh.identifier.urn | urn:nbn:de:gbv:18302-reposit-241489 | - |
| tuhh.oai.show | true | en_US |
| tuhh.publication.institute | Department Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| tuhh.publication.institute | Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025) | en_US |
| tuhh.type.opus | Bachelor Thesis | - |
| dc.type.casrai | Supervised Student Publication | - |
| dc.type.dini | bachelorThesis | - |
| dc.type.driver | bachelorThesis | - |
| dc.type.status | info:eu-repo/semantics/publishedVersion | en_US |
| dc.type.thesis | bachelorThesis | en_US |
| dcterms.DCMIType | Text | - |
| tuhh.dnb.status | domain | en_US |
| item.creatorGND | Zhdanova, Daria | - |
| item.openairetype | Thesis | - |
| item.openairecristype | http://purl.org/coar/resource_type/c_46ec | - |
| item.languageiso639-1 | de | - |
| item.advisorGND | Steffens, Ulrike | - |
| item.grantfulltext | open | - |
| item.fulltext | With Fulltext | - |
| item.creatorOrcid | Zhdanova, Daria | - |
| item.cerifentitytype | Publications | - |
| Appears in Collections: | Theses | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| BA_Data Cleansing Ansätze zur Verbesserung der Datenqualität_geschwärzt.pdf | 2.24 MB | Adobe PDF | View/Open |
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.