Volltextdatei(en) in REPOSIT vorhanden Open Access
DC ElementWertSprache
dc.contributor.advisorMeisel, Andreas-
dc.contributor.authorPham, Duy Anh-
dc.date.accessioned2024-04-05T08:15:22Z-
dc.date.available2024-04-05T08:15:22Z-
dc.date.created2021-06-21-
dc.date.issued2024-04-05-
dc.identifier.urihttp://hdl.handle.net/20.500.12738/15406-
dc.description.abstractTinyML ist die neue Technologie, die die Implementierung und Bereitstellung von Maschinelles Learnen auf eingebetteten Systemen, insbesondere Mikrocontrollersystemen, ermöglicht. Das Kernstück einer TinyML-Anwendung ist die Inferenz-API, die auf dem TensorFlow Lite/Mikrokernel basiert. Diese Arbeit ist eine experimentelle Implementierung einer Sprachbefehlsschnittstelle auf einem Mikrocontroller. Das implementierte ML-Modell verwendet das MFCC als Sprachmerkmal, weil es häufig verwendet wird und sich in vielen Anwendungen als effektiv erwiesen hat. Anstelle eines Standard-CNN-Modells mit 2D-Faltungsfiltern wird der 1D-Faltungsoperator zum Extrahieren von Informationen aus Eingaben verwendet, da diese Methode dazu beiträgt, die Modellgröße noch weiter zu reduzieren, ohne viel Leistung zu verlieren. Am Ende wird ein winziges 1D-Conv-Modell geschaffen, das einen minimalen RAM-Verbrauch von 13, 8kB hat. Das SCI ist als individuelles Sprachverarbeitungsmodul konzipiert, sodass es über eine serielle Kommunikation oder UART mit dem AT-Befehl als Anwendungsnachrichtenprotokoll mit dem externen Hostsystem verbunden ist.de
dc.description.abstractTinyML is the new technology that enables the implementation and deployment of ML on embedded systems, particularly microcontroller systems. The core part of a TinyML application is the inference API built upon the TensorFlow Lite/micro-kernel. This document is an experimental implementation of a speech-command interface on a microcontroller. The implemented ML model uses the MFCC as speech features as it is commonly used and proven to be effective in many applications. Instead of a standard CNN model using 2D convolutional filters, the 1D convolution operator is applied for extracting information from inputs since this method helps to reduce the model size even more without losing much performance. In the end, we have achieved a tiny 1D-Conv model consuming minimal RAM usage of 13, 8kB. The SCI is designed as an individual speech processing module, interfacing with the external host system through a serial communication or UART with the AT command as the application message protocol.en
dc.language.isoenen_US
dc.subjectMaschinelles Learnenen_US
dc.subjectDeep Learningen_US
dc.subjectEingebettetes Systemen_US
dc.subjectSpracherkennungen_US
dc.subjectEingebettetes KIen_US
dc.subjectMachine learningen_US
dc.subjectEmbedded Systemen_US
dc.subjectVoice Recognitionen_US
dc.subjectEmbedded MLen_US
dc.subject.ddc004: Informatiken_US
dc.titleImplementation of a Speech-command-interface on Microcontroller with TinyMLen
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentFakultät Technik und Informatiken_US
thesis.grantor.departmentDepartment Fahrzeugtechnik und Flugzeugbauen_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeDahlkemper, Jörg-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-183440-
tuhh.oai.showtrueen_US
tuhh.publication.instituteFakultät Technik und Informatiken_US
tuhh.publication.instituteDepartment Fahrzeugtechnik und Flugzeugbauen_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.fulltextWith Fulltext-
item.grantfulltextopen-
item.openairetypeThesis-
item.creatorGNDPham, Duy Anh-
item.languageiso639-1en-
item.creatorOrcidPham, Duy Anh-
item.cerifentitytypePublications-
item.advisorGNDMeisel, Andreas-
Enthalten in den Sammlungen:Theses
Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
BA_Speech-command-interface.pdf3.08 MBAdobe PDFÖffnen/Anzeigen
Zur Kurzanzeige

Seitenansichten

109
checked on 03.07.2024

Download(s)

56
checked on 03.07.2024

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.