Fulltext available Open Access
Title: Keyword-spotting für eingebettete Systeme auf Basis eines RNN-Transducers
Language: German
Authors: Nguyen, Paul Duy An 
Keywords: ML; RNN; RNN-Transducer; LSTM; Keyword-Spotting; Embedded System
Issue Date: 10-May-2024
Abstract: 
Die Signifikanz von Robotern ist in der heutigen Zeit unverzichtbar. Es ist weiterhin ein Problem, Roboter mit der menschlichen Sprache zu steuern. Das Problem kann als Keyword-Spotting Problem modeliert werden, die die Aufgabe hat, bestimmte Sprachbefehle zu erkennen. Neuronale Netzwerke werden immer häufiger im Bereich der Sprachverarbeitung verwendet, welche solche Probleme mit hoher Prezision zu lösen kann. Im Bereich von Embedded-Systemen sind solche Anwendungen limitiert, da neuronale Netzwerke generell hohe Resourcenanforderungen besitzen. Diese Arbeit evaluiert die Anwendbarkeit der RNN-Tranducer (RNN-T) Basisarchitektur als ein Keyword-Spotting System mit Embedded-Systemanforderungen. Die Experimente zeigen, dass sich mit limitierten und nicht optimalen Lerndaten das RNN-T nicht zum einem nutzbarem Optimum konvergiert. Potentielle Gründe werden hinsich der RNN-T Basisarchitektur Auswahl geschildert.

The significance of todays robots is greater than ever and society will be unthinkable without it in the future. Even though an active issue in this space, is how we control the robot without our voice. This problem can be categorized in the area of keywordspotting systems. Today’s neural networks can perform with the highest precision in the area of automatic speech-recognition because of recent advancements in this area. The usecase of neural networks is still limited to non-embedded platforms because usual neural networks have high resource utilization. The usability of an RNN-Transducer (RNN-T) as a keyword-spotting-system (KWS) is evaluated with embedded-systems requirements. The experiments show limited results in terms of convergence, probably because of limited and non-optimal training data. Potential reasons are explored as to why an RNN-T might not be an optimal choice as a base for a keyword-spotting-system.
URI: http://hdl.handle.net/20.500.12738/15714
Institute: Fakultät Technik und Informatik 
Department Informatik 
Type: Thesis
Thesis type: Bachelor Thesis
Advisor: Meisel, Andreas 
Referee: Neitzke, Michael 
Appears in Collections:Theses

Files in This Item:
File Description SizeFormat
BA_Keyword-spotting_RNN-Transducers.pdf3.7 MBAdobe PDFView/Open
Show full item record

Page view(s)

70
checked on Dec 25, 2024

Download(s)

47
checked on Dec 25, 2024

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.