Fulltext available Open Access
Title: Synthetisierung von Audiosignalen mithilfe Neuronaler Netze am Beispiel von Vogelgesang
Language: German
Authors: Lapok, Fabien 
Keywords: Deep Learning; Neuronale Netze; GANs; Wasserstein-GANs; Vocoder; Audiosynthese; Synthese von Vogelgesang; Mel-Spektrogramme; Python; Pytorch; FID-Score; Audio synthesis; synthesis of bird songs; mel spectrograms
Issue Date: 10-May-2024
Abstract: 
Das Ziel der vorliegenden Arbeit ist die Konzeption, Implementierung und Evaluation einer Architektur auf Basis Neuronaler Netze für die Synthese von Vogelgesang. Die hier entwickelte Architektur besteht aus zwei Neuronalen Netzen: einem Wasserstein-GAN, der Mel-Spektrogramme mit Vogelgesang erzeugt und einem für die Sprachsynthese vortrainierten Vocoder, der diese Mel-Spektrogramme in Audiosignal...

The goal of this paper is to design, implement, and evaluate a neural network-based architecture for bird song synthesis. The developed architecture consists of two neural networks: A Wasserstein GAN that generates mel spectrograms of bird song and a vocoder, pre-trained for speech synthesis, that converts these spectrograms into audio signals. In this context, Generative Adversarial Networks (GAN...
URI: http://hdl.handle.net/20.500.12738/15720
Institute: Fakultät Technik und Informatik 
Department Informatik 
Type: Thesis
Thesis type: Master Thesis
Advisor: Meisel, Andreas 
Referee: Tiedemann, Tim 
Appears in Collections:Theses

Files in This Item:
Show full item record

Page view(s)

232
checked on Aug 21, 2025

Download(s)

118
checked on Aug 21, 2025

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.