Small data, big challenges : pitfalls and strategies for machine learning in fatigue detection

Jeworutzki, André; Schwarzer, Jan; von Luck, Kai; Stelldinger, Peer; Draheim, Susanne; Wang, Qi

doi:10.1145/3594806.3594825

Publisher DOI:	10.1145/3594806.3594825
Title:	Small data, big challenges : pitfalls and strategies for machine learning in fatigue detection
Other Titles:	Kleine Daten, große Herausforderungen : Fallstricke und Strategien für maschinelles Lernen in der Ermüdungserkennung
Language:	English
Authors:	Jeworutzki, André Schwarzer, Jan von Luck, Kai Stelldinger, Peer Draheim, Susanne Wang, Qi
Keywords:	small data; imbalanced data; oversampling; model evaluation; class distribution; fatigue detection; machine learning; pose estimation; wearable sensors; sports; exercise; squats; IMU; RPE
Issue Date:	10-Aug-2023
Publisher:	Association for Computing Machinery
Part of Series:	Proceedings of the 16th ACM International Conference on PErvasive Technologies Related to Assistive Environments (PETRA 2023)
Startpage:	364
Endpage:	373
Conference:	International Conference on PErvasive Technologies Related to Assistive Environments 2023
Abstract:	This research addresses the pitfalls and strategies for machine learning with small data sets in the context of sensor-based fatigue detection. It is shown that many existing studies in this area rely on small data sets and that classification results can vary considerably depending on the evaluation method. Our analysis is based on a study with 46 subjects performing multiple sets of squat exercises in a laboratory setting. Data from ratings of perceived exertion, inertial measurement units, and pose estimation were used to train and compare different classifiers. Our findings suggest that commonly used evaluation methods, such as leave-one-subject-out, should be used with caution and may not lead to generalizable classifiers. Furthermore, challenges related to imbalanced data and oversampling are discussed. Diese Forschung befasst sich mit den Fallstricken und Strategien des maschinellen Lernens mit kleinen Datensätzen im Kontext der sensorgestützten Ermüdungserkennung. Es wird gezeigt, dass viele existierende Studien in diesem Bereich auf kleinen Datensätzen beruhen und dass die Klassifikationsergebnisse je nach Auswertungsmethode erheblich variieren können. Unsere Analyse basiert auf einer Studie mit 46 Probanden, die mehrere Sätze von Kniebeugenübungen in einer Laborumgebung durchführten. Daten aus Bewertungen der wahrgenommenen Anstrengung, Trägheitsmaßeinheiten und Posenschätzung wurden verwendet, um verschiedene Klassifikatoren zu trainieren und zu vergleichen. Unsere Ergebnisse deuten darauf hin, dass häufig verwendete Bewertungsmethoden, wie z.B. Leave-one-subject-out, mit Vorsicht eingesetzt werden sollten und möglicherweise nicht zu verallgemeinerbaren Klassifikatoren führen. Darüber hinaus werden Herausforderungen im Zusammenhang mit unausgewogenen Daten und Oversampling diskutiert.
URI:	http://hdl.handle.net/20.500.12738/14039
ISBN:	979-8-4007-0069-9
Review status:	This version was peer reviewed (peer review)
Institute:	Forschungs- und Transferzentrum Smart Systems Department Informatik Fakultät Technik und Informatik
Type:	Chapter/Article (Proceedings)
Additional note:	André Jeworutzki, Jan Schwarzer, Kai von Luck, Peer Stelldinger, Susanne Draheim, and Qi Wang. 2023. Small Data, Big Challenges: Pitfalls and Strategies for Machine Learning in Fatigue Detection. In Proceedings of the 16th International Conference on PErvasive Technologies Related to Assistive Environments (PETRA ’23), July 05–07, 2023, Corfu, Greece. ACM, New York, NY, USA, 10 pages. https://doi.org/10.1145/3594806.3594825
Appears in Collections:	Publications without full text