| Title: | Crime Prediction mit Machine Learning | Language: | German | Authors: | Varli, Timur | Keywords: | Machine Learning; Crime Prediction; Predictive Policing | Issue Date: | 17-Dec-2025 | Abstract: | Angesichts zunehmender Verfügbarkeit von Kriminalitätsdaten bieten maschinelle Lernverfahren neue Möglichkeiten zur Identifizierung von Kriminalitätsschwerpunkten und Planung präventiver Maßnahmen. Diese Bachelorarbeit beschäftigt sich mit der Anwendung und dem Vergleich verschiedener Machine-Learning-Algorithmen wie Decision Tree, Random Forest, XGBoost und K-Nearest Neighbors zur Vorhersage von Verbrechen auf Basis des öffentlich zugänglichen San Francisco Crime Datasets. Ziel der Arbeit ist es, die Leistungsfähigkeit unterschiedlicher Klassifikationsmodelle zu bewerten und deren Stärken und Schwächen bei der Klassifikation multiklassiger, unausgewogener Daten zu analysieren. Die besten Ergebnisse wurden mit XGBoost mit Beschränkung auf die zehn häufigsten Verbrechenskategorien erzielt (Accuracy: ~33 %). Dennoch zeigen die insgesamt niedrigen F1-Scores, dass seltene Klassen nur unzureichend vorhergesagt werden. Die Ergebnisse machen deutlich, dass herkömmliche Modelle bei unausgeglichenen Klassen-zuweisungen an ihre Grenzen stoßen. Zur Verbesserung der Modellleistung wurde Feature Engineering eingesetzt. Zusätzlich wird auf ethische Herausforderungen und datenschutzrechtliche Probleme eingegangen. In view of the increasing availability of historical crime data, machine learning methods offer new possibilities for identifying crime hotspots and planning preventive measures. This bachelor thesis deals with the application and comparison of different machine learning algorithms for predicting crime based on the publicly available San Francisco Crime Dataset. The aim of the thesis is to evaluate the performance of different classification models and to analyse their strengths and weaknesses in the classification of multiclass, unbalanced data. The best results were achieved with XGBoost when restricted to the ten most frequent crime categories (Accuracy:~33 %). Nevertheless, the overall low F1 scores show that rare classes are insufficiently predicted. The results show that conventional models reach their limits with unbalanced class assignments. Feature engineering was used to improve model performance. In addition, ethical challenges and data protection issues are addressed. |
URI: | https://hdl.handle.net/20.500.12738/18562 | Institute: | Department Informatik (ehemalig, aufgelöst 10.2025) Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025) |
Type: | Thesis | Thesis type: | Bachelor Thesis | Advisor: | Sarstedt, Stefan | Referee: | Tropmann-Frick, Marina |
| Appears in Collections: | Theses |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| BA_Crime Prediction mit Machine Learning_geschwärzt.pdf | 1.6 MB | Adobe PDF | View/Open |
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.