Volltextdatei(en) in REPOSIT vorhanden Open Access
DC ElementWertSprache
dc.contributor.advisorNeitzke, Michael-
dc.contributor.authorStein-Cadenbach, Matteo-
dc.date.accessioned2023-11-01T09:36:09Z-
dc.date.available2023-11-01T09:36:09Z-
dc.date.created2022-02-17-
dc.date.issued2023-11-01-
dc.identifier.urihttp://hdl.handle.net/20.500.12738/14310-
dc.description.abstractDurch Messungen vom deutschen Wetterdienst ist ein kontinuierlicher Datenstrom mit den Eigenschaften von Wetterphänomenen gegeben. Diese Phänomene sind von variabler Dauer und erscheinen zu unvorhersehbaren Zeitpunkten. Eine statische Fensterbreite zur Merkmalsextraktion durch Autoencoder erzeugt keine optimalen Segmente für die unüberwachte Detektion und Klassifikation der Phänomene. Die Klassifikation muss aufgrund fehlender Labels über ein Clustering erfolgen. Sie könnte durch eine unbekannte optimale Segmentierung des Datenstroms begünstigt werden. Das Ziel der vorliegenden Arbeit ist die Untersuchung der Eignung von LSTMAutoencodern für die Merkmalsextraktion unter einer Segmentierung mit variablen Fensterbreiten. Hierbei soll ein neuartiger Lösungsansatz als Platzhalter für die unbekannte optimale Segmentierung genutzt werden. Der Ansatz besteht aus der Abtastung des Datensatzes mit zufälligen, aber gleichverteilten Fensterbreiten. Für eine überwachte Messung der Clusterqualität wurde ein gelabelter künstlicher Datensatz mit den für die Untersuchung notwendigen Eigenschaften der realen Daten hergestellt. Ein Prozess wurde entwickelt, um mithilfe der Labels eine ideale Partitionierung der Segmente zu bilden. Um zu überprüfen, dass die neuartige Segmentierung eine Annäherung an eine optimale Segmentierung darstellt, wurde sie einer statischen Segmentierung gegenübergestellt. Zuletzt wurden implementierte Varianten von LSTMAutoencodern mit Clustering-Verfahren angewandt und miteinander verglichen. Die Ergebnisse zeigen bessere Kennzahlen für die neuartige Segmentierung. Außerdem zeigen sie, dass bei Wahl unterschiedlicher maximaler Segmentbreiten für die Gleichverteilung eine stabile Clusterqualität gewährleistet ist, während dies bei Wahl unterschiedlicher statischer Segmentbreiten nicht der Fall ist. Im Vergleich der Architekturvarianten ist festzustellen, dass ein VAE mit klassischen LSTM-Schichten zur Kodierung der Segmente am besten geeignet ist. Weiterführende Forschung ist hinsichtlich alternativer Clustering-Methoden und einer gezielten Segmentierung vorzunehmen.de
dc.description.abstractA continuous data stream with properties of weather phenomenons of variable duration and unpredictable appearance is given by measurements by the German Meteorological Service. The usage of a static window length for an Autoencoder-based feature extraction does not produce optimal segments in order to detect and classify the phenomenons in an unsupervised manner. The classification has to be done through clustering due to missing labels. It could be improved by an unknown optimal segmentation of the data stream. Goal of this thesis is to investigate the suitability of LSTM autoencoders for the feature extraction under usage of a segmentation with variabel window lengths. Thereby a novel approach shall be used as placeholder for the unknown optimal segmentation. The data stream is segmented by using a sliding window with a random, but uniformly distributed window length. In order to measure the clustering quality in a supervised way, a labeled synthetic dataset was created according to the mentioned real data properties. A process was defined to build an ideal partitioning of the segments for the calculation of rating indices. To verify that the novel segmentation method can serve as a valid placeholder for the optimal segmentation, it was compared to a segmentation with static window length. At last, implemented variants of LSTM autoencoder combined with clustering were applied and compared. The results show better ratings for the new segmentation method. Furthermore, they show a stable clustering quality picking different maximal segment lengths for the uniform distribution. In contrast, the clustering quality differs highly when picking different static segment lengths. The comparison of the architecture variants shows that a VAE with conventional LSTM layers is most suitable for encoding the segments. Further research could be done by using other clustering techniques and applying systematic segmentation methods.en
dc.language.isodeen_US
dc.subjectMerkmalsextraktionen_US
dc.subjectLSTMen_US
dc.subjectAutoencoderen_US
dc.subjectVAEen_US
dc.subjectDeep-Clusteringen_US
dc.subjectAerosol- Rückstreuprofileen_US
dc.subjectMustererkennungen_US
dc.subjectDeep-Learningen_US
dc.subjectZufällige Zeitreihensegmentierungen_US
dc.subjectFeature extractionen_US
dc.subjectAerosol backscatter profilesen_US
dc.subjectPattern recognitionen_US
dc.subjectRandom time-series segmentationen_US
dc.subject.ddc004: Informatiken_US
dc.titleMerkmalsextraktion durch LSTM-Autoencoder am Beispiel von Aerosol-Rückstreuprofilen aus LIDAR-Ceilometernde
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentDepartment Informatiken_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeSteffens, Ulrike-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-164043-
tuhh.oai.showtrueen_US
tuhh.publication.instituteDepartment Informatiken_US
tuhh.publication.instituteFakultät Technik und Informatiken_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.fulltextWith Fulltext-
item.grantfulltextopen-
item.openairetypeThesis-
item.creatorGNDStein-Cadenbach, Matteo-
item.languageiso639-1de-
item.creatorOrcidStein-Cadenbach, Matteo-
item.cerifentitytypePublications-
item.advisorGNDNeitzke, Michael-
Enthalten in den Sammlungen:Theses
Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
Bachelorthesis_Matteo_Stein-Cadenbach_geschwärzt.pdf2.16 MBAdobe PDFÖffnen/Anzeigen
Zur Kurzanzeige

Seitenansichten

148
checked on 05.07.2024

Download(s)

237
checked on 05.07.2024

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.