Publisher DOI: | 10.1145/3594806.3594825 | Title: | Small data, big challenges : pitfalls and strategies for machine learning in fatigue detection | Other Titles: | Kleine Daten, große Herausforderungen : Fallstricke und Strategien für maschinelles Lernen in der Ermüdungserkennung | Language: | English | Authors: | Jeworutzki, André Schwarzer, Jan von Luck, Kai Stelldinger, Peer Draheim, Susanne Wang, Qi |
Keywords: | small data; imbalanced data; oversampling; model evaluation; class distribution; fatigue detection; machine learning; pose estimation; wearable sensors; sports; exercise; squats; IMU; RPE | Issue Date: | 10-Aug-2023 | Publisher: | Association for Computing Machinery | Part of Series: | Proceedings of the 16th ACM International Conference on PErvasive Technologies Related to Assistive Environments (PETRA 2023) | Startpage: | 364 | Endpage: | 373 | Conference: | International Conference on PErvasive Technologies Related to Assistive Environments 2023 | Abstract: | This research addresses the pitfalls and strategies for machine learning with small data sets in the context of sensor-based fatigue detection. It is shown that many existing studies in this area rely on small data sets and that classification results can vary considerably depending on the evaluation method. Our analysis is based on a study with 46 subjects performing multiple sets of squat exercises in a laboratory setting. Data from ratings of perceived exertion, inertial measurement units, and pose estimation were used to train and compare different classifiers. Our findings suggest that commonly used evaluation methods, such as leave-one-subject-out, should be used with caution and may not lead to generalizable classifiers. Furthermore, challenges related to imbalanced data and oversampling are discussed. Diese Forschung befasst sich mit den Fallstricken und Strategien des maschinellen Lernens mit kleinen Datensätzen im Kontext der sensorgestützten Ermüdungserkennung. Es wird gezeigt, dass viele existierende Studien in diesem Bereich auf kleinen Datensätzen beruhen und dass die Klassifikationsergebnisse je nach Auswertungsmethode erheblich variieren können. Unsere Analyse basiert auf einer Studie mit 46 Probanden, die mehrere Sätze von Kniebeugenübungen in einer Laborumgebung durchführten. Daten aus Bewertungen der wahrgenommenen Anstrengung, Trägheitsmaßeinheiten und Posenschätzung wurden verwendet, um verschiedene Klassifikatoren zu trainieren und zu vergleichen. Unsere Ergebnisse deuten darauf hin, dass häufig verwendete Bewertungsmethoden, wie z.B. Leave-one-subject-out, mit Vorsicht eingesetzt werden sollten und möglicherweise nicht zu verallgemeinerbaren Klassifikatoren führen. Darüber hinaus werden Herausforderungen im Zusammenhang mit unausgewogenen Daten und Oversampling diskutiert. |
URI: | http://hdl.handle.net/20.500.12738/14039 | ISBN: | 979-8-4007-0069-9 | Review status: | This version was peer reviewed (peer review) | Institute: | Forschungs- und Transferzentrum Smart Systems Department Informatik Fakultät Technik und Informatik |
Type: | Chapter/Article (Proceedings) | Additional note: | André Jeworutzki, Jan Schwarzer, Kai von Luck, Peer Stelldinger, Susanne Draheim, and Qi Wang. 2023. Small Data, Big Challenges: Pitfalls and Strategies for Machine Learning in Fatigue Detection. In Proceedings of the 16th International Conference on PErvasive Technologies Related to Assistive Environments (PETRA ’23), July 05–07, 2023, Corfu, Greece. ACM, New York, NY, USA, 10 pages. https://doi.org/10.1145/3594806.3594825 |
Appears in Collections: | Publications without full text |
Show full item record
Add Files to Item
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.