Volltextdatei(en) in REPOSIT vorhanden Open Access
Lizenz: 
Titel: Skalierbare Datenanalyse mit Apache Spark : Implementation einer Text-Mining-Anwendung und Testbetrieb auf einem Low-End-Cluster
Sprache: Deutsch
Autorenschaft: Kirchner, Daniel 
Erscheinungsdatum: 29-Jul-2015
Zusammenfassung: 
Apache Spark ist auf dem Weg sich als zentrale Komponente von Big-Data-Analyse-Systemen für eine Vielzahl von Anwendungsfällen durchzusetzen. Diese Arbeit scha t einen Überblick der zentralen Konzepte und Bestandteile von Apache Spark und untersucht das Verhalten von Spark auf einem Cluster mit minimalem Leistungspro l. Grundlage dieser Untersuchung ist ein realitätsnaher Anwendungsfall, der Sparkmodule für Batch-Processing und Streaming kombiniert.

Apache Spark is quickly becoming a central component of Big Data analysis systems for a variety of applications. This work provides an overview of key concepts and components of Apache Spark and examines the behavior of Spark on a cluster with a minimal performance pro le. This study is based on an application that is inspired by a real-world usecase. The application combines the Spark modules for batch processing and streaming.
URI: http://hdl.handle.net/20.500.12738/7075
Einrichtung: Department Informatik 
Dokumenttyp: Abschlussarbeit
Abschlussarbeitentyp: Bachelorarbeit
Hauptgutachter*in: Kahlbrandt, Bernd 
Gutachter*in der Arbeit: Zukunft, Olaf 
Enthalten in den Sammlungen:Theses

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
BA_Kirchner.pdf2.06 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Seitenansichten

262
checked on 27.12.2024

Download(s)

193
checked on 27.12.2024

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.