Volltextdatei(en) in REPOSIT vorhanden Open Access
DC ElementWertSprache
dc.contributor.advisorTaefi, Tessa-
dc.contributor.authorHesse, Mira-
dc.date.accessioned2024-09-20T09:24:31Z-
dc.date.available2024-09-20T09:24:31Z-
dc.date.created2024-05-23-
dc.date.issued2024-09-20-
dc.identifier.urihttps://hdl.handle.net/20.500.12738/16303-
dc.description.abstractThere are several approaches to bat call classification using deep learning. In this thesis, I compared existing architectures for bat call classification and for general audio classification on a dataset that contained acoustic drone noise in the recordings in addition to bat calls. Two pretrained models (without further training) showed no significant difference between data with and without drone noise. I also compared two pretrained models after transfer learning. For the training dataset I compared different levels of resampling and an augmented dataset to compensate for the high class imbalance between the three classes in the dataset. The best results were obtained using the Patchout faSt Spectrogram Transformer (PaSST) model with oversampling. The model achieved a f1-score of 94.9% on a binary classification task. On multilabel classification it achieved a micro f1-Score of 90.6% and a macro f1-score of 78.5%.en
dc.description.abstractEs gibt bereits einige Modelle für die Klassifikation von Fledermausrufen mithilfe von Deep Learning. In dieser Arbeit habe ich existierende Modelle für die Klassifizierung von Fledermausrufen und für die allgemeine Audioklassifikation für einen Datensatz verglichen, der zusätzlich akustisches Drohnenrauschen enthält. Zwei vortrainierte Modelle (ohne weiteres Training) zeigten keinen signifikanten Unterschied zwischen Daten mit und ohne Drohnenrauschen. Ich habe auch zwei Modelle nach „Transfer Learning“ verglichen. Für den Trainingsdatensatz habe ich verschiedene „Resampling“ und „Augmentation“ Kombinationen verglichen, um das hohe Ungleichgewicht zwischen den drei Klassen im Datensatz auszugleichen. Die besten Ergebnisse wurden mit dem Modell „Patchout faSt Spectrogram Transformer“ (PaSST) und „Oversampling“ erzielt. Das Modell erreichte einen F1-Score von 94, 3% für binäre Klassifizierung. Für „Multilabel“ Klassifizierung erreichte es einen Mikro F1-Score von 90, 6% und einen Makro F1-Score von 78, 5%.de
dc.language.isoenen_US
dc.subject.ddc004: Informatiken_US
dc.titleBat Call Classification in Audio Recordings with Drone Noise Using Deep Learningen
dc.typeThesisen_US
openaire.rightsinfo:eu-repo/semantics/openAccessen_US
thesis.grantor.departmentFakultät Design, Medien und Informationen_US
thesis.grantor.departmentDepartment Medientechniken_US
thesis.grantor.universityOrInstitutionHochschule für Angewandte Wissenschaften Hamburgen_US
tuhh.contributor.refereeRoswag, Marc-
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-194941-
tuhh.oai.showtrueen_US
tuhh.publication.instituteFakultät Design, Medien und Informationen_US
tuhh.publication.instituteDepartment Medientechniken_US
tuhh.type.opusBachelor Thesis-
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionen_US
dc.type.thesisbachelorThesisen_US
dcterms.DCMITypeText-
tuhh.dnb.statusdomainen_US
item.advisorGNDTaefi, Tessa-
item.creatorGNDHesse, Mira-
item.languageiso639-1en-
item.cerifentitytypePublications-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.creatorOrcidHesse, Mira-
item.fulltextWith Fulltext-
item.grantfulltextopen-
item.openairetypeThesis-
Enthalten in den Sammlungen:Theses
Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
BA_Bat_Call_Classification_in_Audio_Recordings.pdf1.03 MBAdobe PDFÖffnen/Anzeigen
Zur Kurzanzeige

Seitenansichten

66
checked on 23.11.2024

Download(s)

37
checked on 23.11.2024

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.