License: | Title: | Data analyses and preparation for machine learning based order prediction | Language: | English | Authors: | Hinrichs, Gerriet | Keywords: | Datenanalyse; Datenaufbereitung; maschinelles Lernen; Bestellungsvorhersage | Issue Date: | 23-Feb-2022 | Abstract: | The thesis discusses label generation for order positions based on free-text identifiers for a later predictive analysis with the goal to optimize a business process. Working with real-world data, analyses show the low data quality and the need to generate appropriate labels. With a generic data processing architecture, an iterative approach is taken to create a label approximation. It is reasoned that data quality is important and that poor quality might prevent useful data analyses. Die Arbeit diskutiert Label Generierung für Bestellpositionen auf Basis von Freitextbezeichnungen für eine spätere prädiktive Analyse mit dem Ziel einen Geschäftsprozess zu optimieren. Analysen der verwendeten Daten aus der Wirtschaft zeigen die geringe Datenqualität und die Notwendigkeit vernünftige Labels zu erzeugen. Mit einer generischen Datenverarbeitungsarchitektur wird in einer iterativen Herangehensweise eine Label-Approximation erzeugt. Es wird geschlussfolgert, dass Datenqualität wichtig ist und dass schlechte Qualität sinnvolle Datenanalyse verhindern kann. |
URI: | http://hdl.handle.net/20.500.12738/12496 | Institute: | Fakultät Technik und Informatik Department Informatik |
Type: | Thesis | Thesis type: | Bachelor Thesis | Advisor: | von Luck, Kai | Referee: | Tiedemann, Tim |
Appears in Collections: | Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
thesis.pdf | 497.32 kB | Adobe PDF | View/Open |
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.