Fulltext available Open Access
DC FieldValueLanguage
dc.contributor.advisorZukunft, Olaf-
dc.contributor.authorKönemann, Alexander-
dc.date.accessioned2024-09-13T07:10:34Z-
dc.date.available2024-09-13T07:10:34Z-
dc.date.created2022-07-14-
dc.date.issued2024-09-13-
dc.identifier.urihttps://hdl.handle.net/20.500.12738/16254-
dc.description.abstractApache Spark und Flink werden kommerziell vorwiegend in Rechenzentren mit hochperformanten Computern eingesetzt. Ein gänzlich anderes Szenario stellt der Einsatz von heterogener Hardware dar, welches in dieser Studie betrachtet wird. In verschiedenen Versuchsaufbauten wird die Datenverarbeitung getestet und die Leistungsfähigkeit beider Systeme analysiert. Dafür wurden fünf Hypothesen aufgestellt und betrachtet. Es konnte gezeigt werden, dass das Hinzufügen von zu schwacher Hardware einen negativen Einfluss auf die Leistung eines Clusters hat. Weiterhin hat die Leistungsfähigkeit der Master Node einen signifikanten Einfluss auf die Gesamtleistung. Beim Systemvergleich schnitt Spark besser in der Stapelverarbeitung ab, wohingegen sich Flink bei der kontinuierlichen Verarbeitung überlegen zeigte.de
dc.description.abstractApache Spark and Flink are primarily deployed in commercial data centers on highperformance nodes. A fundamentally different approach is the utilization of heterogeneous hardware, which is considered in this study. In various experimental setups, data processing is being trialed and the performance of both systems is being analyzed. For this purpose, five hypotheses were formulated and investigated. It was shown, that insufficient hardware has a negative influence on a cluster. Additionally, the performance of the master node has a significant influence on the overall performance. Upon comparing both frameworks, Spark showed better performance in batch processing, whereas Flink was found to be superior in stream processing.en
dc.language.isoenen_US
dc.subjectApache Sparken_US
dc.subjectApache Flinken_US
dc.subjectStapelverarbeitungen_US
dc.subjectkontinuierliche Verarbeitungen_US
dc.subjectRaspberry Pien_US
dc.subject.ddc004: Informatiken_US
dc.titleExperimental comparison between Apache Spark and Flink in heterogeneous hardware environmentsen
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentFakultät Technik und Informatiken_US
thesis.grantor.departmentDepartment Informatiken_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeSarstedt, Stefan-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-193642-
tuhh.oai.showtrueen_US
tuhh.publication.instituteFakultät Technik und Informatiken_US
tuhh.publication.instituteDepartment Informatiken_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.advisorGNDZukunft, Olaf-
item.creatorGNDKönemann, Alexander-
item.languageiso639-1en-
item.cerifentitytypePublications-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.creatorOrcidKönemann, Alexander-
item.fulltextWith Fulltext-
item.grantfulltextopen-
item.openairetypeThesis-
Appears in Collections:Theses
Files in This Item:
File Description SizeFormat
BA_Experimental_comparison_Apache-Spark_Flink.pdf2.26 MBAdobe PDFView/Open
Show simple item record

Page view(s)

51
checked on Nov 23, 2024

Download(s)

46
checked on Nov 23, 2024

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.