Fulltext available Open Access
DC FieldValueLanguage
dc.contributor.advisorEger, Kolja-
dc.contributor.authorJoshi, Divyesh-
dc.date.accessioned2025-10-01T07:55:32Z-
dc.date.available2025-10-01T07:55:32Z-
dc.date.created2024-10-04-
dc.date.issued2025-10-01-
dc.identifier.urihttps://hdl.handle.net/20.500.12738/18245-
dc.description.abstractThis thesis presents an evaluation of model serving frameworks for machine learning, focusing on their performance, ease of deployment, and multi-model support in real-world production environments. The frameworks evaluated include TensorFlow Serving, Triton Inference Server, BentoML, TorchServe, and FastAPI. After a comprehensive theoretical analysis, TensorFlow Serving, Triton, and BentoML were selected for practical evaluation due to their compatibility with the project’s requirements. The final system integrates TensorFlow Serving with FastAPI to create a efficient machine learning model-serving platform. In this architecture, TensorFlow Serving handles inference while FastAPI is responsible for preprocessing, postprocessing, and implementing secure authentication using OAuth2. The system was tested under CPU-bound conditions using REST APIs to ensure broad compatibility. Although TensorFlow Serving exhibited superior performance in terms of latency, testing on GPU-enabled hardware could potentially enhance performance across all frameworks, offering even greater improvements in inference speed and efficiency. Future work can focus on conducting more extensive testing, particularly on GPU-enabled systems.en
dc.description.abstractDiese Arbeit stellt eine Evaluierung von Model serving Frameworks für maschinelles Lernen vor und konzentriert sich dabei auf deren Leistung, einfache Bereitstellung und Multi- Modell-Unterstützung in realen Produktionsumgebungen. Zu den evaluierten Frameworks gehören TensorFlow Serving, Triton Inference Server, BentoML, TorchServe und FastAPI. Nach einer umfassenden theoretischen Analyse wurden TensorFlow Serving, Triton und BentoML aufgrund ihrer Kompatibilität mit den Anforderungen des Projekts für die praktische Evaluierung ausgewählt. Das endgültige System integriert TensorFlow Serving mit FastAPI, um eine effiziente Plattform für maschinelles Lernen und Modellserving zu schaffen. In dieser Architektur übernimmt TensorFlow Serving die Inferenz, während FastAPI für das Preprocessing, Postprocessing und die Implementierung einer sicheren Authentifizierung mittels OAuth2 verantwortlich ist. Das System wurde unter CPU-gebundenen Bedingungen mit REST APIs getestet, um eine breite Kompatibilität zu gewährleisten. Obwohl TensorFlow Serving eine überlegene Leistung in Bezug auf die Latenzzeit aufwies, könnte das Testen auf GPU-fähiger Hardware die Leistung aller Frameworks potenziell verbessern und noch größere Verbesserungen bei der Inferenzgeschwindigkeit und -effizienz bieten. Zukünftige Arbeiten können sich auf die Durchführung umfassenderer Tests konzentrieren, insbesondere auf GPU-fähigen Systemen.de
dc.language.isoenen_US
dc.subjectMachine Learningen_US
dc.subjectModel Servingen_US
dc.subjectTensorFlow Servingen_US
dc.subjectTriton Inference Serveren_US
dc.subjectBentoMLen_US
dc.subjectFastAPIen_US
dc.subjectInferenceen_US
dc.subjectPreprocessingen_US
dc.subjectPostprocessingen_US
dc.subject.ddc600: Techniken_US
dc.subject.ddc620: Ingenieurwissenschaftenen_US
dc.titleEvaluation of Model Serving Frameworks for Machine Learningen
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentDepartment Informations- und Elektrotechniken_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeRenz, Wolfgang-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-220872-
tuhh.oai.showtrueen_US
tuhh.publication.instituteDepartment Informations- und Elektrotechniken_US
tuhh.publication.instituteFakultät Technik und Informatiken_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.languageiso639-1en-
item.openairetypeThesis-
item.advisorGNDEger, Kolja-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.creatorOrcidJoshi, Divyesh-
item.cerifentitytypePublications-
item.fulltextWith Fulltext-
item.creatorGNDJoshi, Divyesh-
item.grantfulltextopen-
Appears in Collections:Theses
Files in This Item:
Show simple item record

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.