Volltextdatei(en) in REPOSIT vorhanden Open Access
DC ElementWertSprache
dc.contributor.advisorSteffens, Ulrike-
dc.contributor.authorSchleiermacher, Jakob-
dc.date.accessioned2026-06-12T06:37:35Z-
dc.date.available2026-06-12T06:37:35Z-
dc.date.issued2025-09-25-
dc.identifier.urihttps://hdl.handle.net/20.500.12738/19414-
dc.description.abstractIn einer zunehmend datengesteuerten Welt bieten synthetische Daten eine praktikable Möglichkeit, hochwertige Testdaten bereitzustellen und gleichzeitig den Schutz personenbezogener Informationen zu gewährleisten. Diese Bachelorarbeit untersucht den PrivBayes-Algorithmus, der Bayessche Netzwerke mit dem Konzept der differenziellen Privatsphäre kombiniert, um synthetische Datensätze zu generieren, die sowohl statistisch aussagekräftig als auch datenschutzkonform sind. Ziel ist es, die Qualität dieser synthetischen Daten anhand zentraler Metriken systematisch zu bewerten. Dazu werden mehrere öffentlich verfügbare Datensätze verwendet, auf deren Grundlage insgesamt 80 synthetische Varianten unter variierenden Parametereinstellungen entstehen. Die Bewertung erfolgt mithilfe etablierter Metriken wie Weighted Statistics, Column Pair Trends, Value Coverage und Disclosure Protection. Die Ergebnisse zeigen, dass PrivBayes unter bestimmten Bedingungen in der Lage ist, zentrale statistische Strukturen und Variabilität der Originaldaten weitgehend zu erhalten und gleichzeitig ein hohes Maß an Datenschutz zu gewährleisten. Die Arbeit leistet darüber hinaus einen Beitrag zum Forschungsprojekt INSIGHT (INtelligent Synthesis and Generation of High-quality Test Data), das sich mit der Generierung und Nutzung synthetischer Testdaten befasst. Durch die systematische Evaluation von PrivBayes entsteht ein besseres Verständnis darüber, wie sich Datenschutz und Datenqualität in Einklang bringen lassen. Damit unterstützt die Arbeit das langfristige Ziel der Forschungsgruppe, Werkzeuge und Verfahren zur automatisierten Erzeugung synthetischer Testdaten zu entwickeln, die für realitätsnahe, datenschutzfreundliche Testszenarien geeignet sind.de
dc.description.abstractIn an increasingly data-driven world, synthetic data offers a practical approach to providing high-quality test data while ensuring the protection of personal information. This bachelor thesis examines the PrivBayes algorithm, which combines Bayesian networks with the concept of differential privacy to generate synthetic datasets that are both statistically meaningful and privacy-preserving. The aim is to systematically evaluate the quality of these synthetic datasets using key metrics. Several publicly available datasets were used as a basis, from which a total of 80 synthetic variants were generated under varying parameter configurations. The evaluation was conducted using established metrics such as Weighted Statistics, Column Pair Trends, Value Coverage, and Disclosure Protection. The results demonstrate that, under specific conditions, PrivBayes can largely preserve the central statistical structures and variability of the original data while maintaining a high level of data protection. Moreover, this thesis contributes to the INSIGHT (INtelligent Synthesis and Generation of High-quality Test Data) research project, which focuses on the generation and use of synthetic test data. By systematically evaluating PrivBayes, this work helps to deepen the understanding of how privacy and data quality can be effectively balanced. In doing so, it supports the long-term goal of the research group to develop tools and methods for the automated generation of synthetic test data suitable for realistic and privacy-compliant testing scenarios.en
dc.language.isodeen_US
dc.subjectSynthetische Datenen_US
dc.subjectDifferenzielle Privatsphäreen_US
dc.subjectDatenqualitätsbewertungen_US
dc.subjectBayessche Netzwerkeen_US
dc.subject.ddc004: Informatiken_US
dc.titleEvaluierung des PrivBayes-Algorithmus : Vergleich zwischen Original- und synthetischen Daten anhand von Qualitäts- und Datenschutzmetrikende
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentFakultät Technik und Informatik (ehemalig, aufgelöst 10.2025)en_US
thesis.grantor.departmentDepartment Informatik (ehemalig, aufgelöst 10.2025)en_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeZukunft, Olaf-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-241003-
tuhh.oai.showtrueen_US
tuhh.publication.instituteFakultät Technik und Informatik (ehemalig, aufgelöst 10.2025)en_US
tuhh.publication.instituteDepartment Informatik (ehemalig, aufgelöst 10.2025)en_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.creatorGNDSchleiermacher, Jakob-
item.advisorGNDSteffens, Ulrike-
item.cerifentitytypePublications-
item.openairetypeThesis-
item.creatorOrcidSchleiermacher, Jakob-
item.grantfulltextopen-
item.languageiso639-1de-
item.fulltextWith Fulltext-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
Enthalten in den Sammlungen:Theses
Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
BA_Evaluierung_des_PrivBayes-Algorithmus.pdf1.17 MBAdobe PDFÖffnen/Anzeigen
Zur Kurzanzeige

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.