Fulltext available Open Access
DC FieldValueLanguage
dc.contributor.advisorSudeikat, Jan-
dc.contributor.authorGebhardt, Luca Leo-
dc.date.accessioned2025-08-20T09:57:57Z-
dc.date.available2025-08-20T09:57:57Z-
dc.date.created2023-10-12-
dc.date.issued2025-08-20-
dc.identifier.urihttps://hdl.handle.net/20.500.12738/18055-
dc.description.abstractDas Ziel der vorliegenden Arbeit ist es in den Transfer-Events und pool-info-Logs des dCache-Speichersystems Indikatoren zu identifizieren, die auf ein verfügbarkeitsgefährdendes Nutzerverhalten durch parallele Dateizugriffe hindeuten.Weiterhin soll mit diesen Indikatoren ein Klassifikations-Modell auf Basis der logistischen Regression entwickelt werden, welches in ein Software-Tool eingebettet wird, welches im Anschluss evaluiert wird. Um Indikatoren in den Events und Log-Daten zu identifizieren wurde der KDDProzess genutzt, wodurch strukturiert Merkmale in den Daten ausgewählt und extrahiert werden konnten. Mit diesen Daten konnte ein Modell trainiert und getestet werden. Das Software-Tool ist auf Basis eines MAPE-Loops entwickelt worden, in welchen das Modell eingebettet wurde. Mittels verschiedener Evaluationsmetriken ist das Modell mit Referenzwerten und einem Baseline-Klassifikator verglichen worden. Zur Evaluation ist das Software-Tool in den Betrieb integriert worden und hat die Zugriffe der echten Nutzer überwacht. Zur reproduzierbaren Evaluation wurden verschiedene Zugriffsmuster simuliert.Diese Arbeit konnte zeigen, dass sich aus den Transfer-Events Indikatoren extrahieren lassen und diese auch erfolgreich zum Training eines Modells verwendet werden können. Weiterhin konnte dieses in ein funktionierendes Software-Tool integriert werden, welches getestet wurde. Die Ergebnisse der Evaluation zeigen, dass das Modell im Betrieb verfügbarkeitsgefährdende Zugriffe erkennt und meldet. Im Zuge der Evaluation ist ein weiterer Indikator ermittelt worden, welcher genutzt werden kann, um möglicherweise die Anzahl an Falschmeldungen zu verringern. Die Simulation der Zugriffe hat nicht zum erwarteten Ergebnis geführt, es konnten aber mögliche Ursachen identifiziert werden.de
dc.description.abstractThe objective of the present work is to identify indicators of user behavior potentially threatening availability through parallel file accesses in the transfer events and pool-info logs of the dCache storage system. Additionally, a classification model based on logistic regression is developed using these indicators, embedded into a software tool, and evaluated. The Knowledge Discovery in Databases (KDD) process was employed to systematically select and extract features from the events and log data. With these data, a model was trained and tested. The software tool was developed based on a Monitoring, Analyze, Planning, Execution Loop (MAPE-Loop), incorporating the model. The model was compared with reference values and a baseline classifier using various evaluation metrics. For evaluation, the software tool was integrated into operations, monitoring real user accesses. Different access patterns were simulated for reproducible evaluation. This study demonstrated that indicators can be extracted from transfer events and successfully used for model training. Furthermore, the model was integrated into a functional software tool and successfully tested. Evaluation results indicate that the model detects and reports availability-threatening accesses during operations. An additional indicator was identified during evaluation, which could potentially reduce false positives. Simulating accesses did not yield the expected results, but potential causes were identified.en
dc.language.isodeen_US
dc.subjectdCacheen_US
dc.subjectData Miningen_US
dc.subjectKDDen_US
dc.subjectlogistische Regressionen_US
dc.subjectMAPE-Loopen_US
dc.subjectlogistic regressionen_US
dc.subject.ddc004: Informatiken_US
dc.titleErkennung von verfügbarkeitsgefährdendem Nutzerverhalten im dCache-Systemde
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentFakultät Technik und Informatiken_US
thesis.grantor.departmentDepartment Informatiken_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeKöhler-Bußmeier, Michael-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-217856-
tuhh.oai.showtrueen_US
tuhh.publication.instituteFakultät Technik und Informatiken_US
tuhh.publication.instituteDepartment Informatiken_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.cerifentitytypePublications-
item.fulltextWith Fulltext-
item.languageiso639-1de-
item.advisorGNDSudeikat, Jan-
item.grantfulltextopen-
item.creatorGNDGebhardt, Luca Leo-
item.openairetypeThesis-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.creatorOrcidGebhardt, Luca Leo-
crisitem.author.orcid0000-0002-5389-7259-
Appears in Collections:Theses
Files in This Item:
Show simple item record

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.