Volltextdatei(en) in REPOSIT vorhanden Open Access
DC ElementWertSprache
dc.contributor.advisorNeitzke, Michael-
dc.contributor.authorTeyou Soh, Theophile-
dc.date.accessioned2023-10-18T08:39:13Z-
dc.date.available2023-10-18T08:39:13Z-
dc.date.created2022-07-11-
dc.date.issued2023-10-18-
dc.identifier.urihttp://hdl.handle.net/20.500.12738/14251-
dc.description.abstractClustering stellt einen wichtigen Teil des maschinellen Lernens dar, der nicht vernachlässigt werden kann und die Klassifizierung von Daten ermöglicht. Im Rahmen der vorliegenden Studie wird ein Gesamtüberblick über den Vergleich verschiedener Clustering- Methoden gegeben. Ebenso werden ihre Leistung auf mehrdimensionalen Datensätze analysiert. In dieser Arbeit wird ein System entworfen, welches aus Clustering-Algorithmen besteht. Nachdem der Datensatz ausgewählt und die Merkmale der Cluster identifiziert wurden, wird die Leistung der Methode analysiert. Da die Daten hochdimensional sind, umfasst diese Arbeit auch eine Faktorenanalyse der Daten sowie eine anschließende Reduktion der Daten auf niedrigere Dimensionen zum Zweck der Visualisierung.de
dc.description.abstractClustering is an important part of machine learning that cannot be neglected and enables classification of data. This study provides an overall view of the comparison of different clustering methods and analyzes their performance on multidimensional datasets. A system is designed which consists of the composite of clustering algorithms. After selecting the dataset and identifying the characteristics of the clusters, the performance of the method is analyzed. Since the data is high dimensional, this work also includes factor analysis of the data and subsequent reduction of the data to lower dimensions for visualization.en
dc.language.isodeen_US
dc.subjectClusteringen_US
dc.subjectDimensionsreduktionen_US
dc.subjectCURE Clusteringen_US
dc.subjectspektrales Clusteringen_US
dc.subjectPCAen_US
dc.subjectUMAPen_US
dc.subjectT-SNEen_US
dc.subjectmaschinelles Lernenen_US
dc.subjectHochdimensionaler Datensatzen_US
dc.subjectdimensionality reductionen_US
dc.subjectCURE clustringen_US
dc.subjectspectral clusteringen_US
dc.subjectmachine learningen_US
dc.subjecthigh dimensional dataseten_US
dc.subject.ddc004: Informatiken_US
dc.titleAnalyse und Vergleich von verschiedenen Clustering - Verfahren auf Datensätze unterschiedlicher Dimensionalitätende
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentDepartment Informatiken_US
thesis.grantor.departmentFakultät Technik und Informatiken_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeTropmann-Frick, Marina-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-163572-
tuhh.oai.showtrueen_US
tuhh.publication.instituteDepartment Informatiken_US
tuhh.publication.instituteFakultät Technik und Informatiken_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.advisorGNDNeitzke, Michael-
item.creatorGNDTeyou Soh, Theophile-
item.languageiso639-1de-
item.cerifentitytypePublications-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.creatorOrcidTeyou Soh, Theophile-
item.fulltextWith Fulltext-
item.grantfulltextopen-
item.openairetypeThesis-
Enthalten in den Sammlungen:Theses
Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
thesis_Soh_geschwärzt.pdf2.02 MBAdobe PDFÖffnen/Anzeigen
Zur Kurzanzeige

Seitenansichten

153
checked on 27.11.2024

Download(s)

516
checked on 27.11.2024

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.