Fulltext available Open Access
Title: Crime Prediction mit Machine Learning
Language: German
Authors: Varli, Timur 
Keywords: Machine Learning; Crime Prediction; Predictive Policing
Issue Date: 17-Dec-2025
Abstract: 
Angesichts zunehmender Verfügbarkeit von Kriminalitätsdaten bieten maschinelle Lernverfahren neue Möglichkeiten zur Identifizierung von Kriminalitätsschwerpunkten und Planung präventiver Maßnahmen. Diese Bachelorarbeit beschäftigt sich mit der Anwendung und dem Vergleich verschiedener Machine-Learning-Algorithmen wie Decision Tree, Random Forest, XGBoost und K-Nearest Neighbors zur Vorhersage von Verbrechen auf Basis des öffentlich zugänglichen San Francisco Crime Datasets. Ziel der Arbeit ist es, die Leistungsfähigkeit unterschiedlicher Klassifikationsmodelle zu bewerten und deren Stärken und Schwächen bei der Klassifikation multiklassiger, unausgewogener Daten zu analysieren. Die besten Ergebnisse wurden mit XGBoost mit Beschränkung auf die zehn häufigsten Verbrechenskategorien erzielt (Accuracy: ~33 %). Dennoch zeigen die insgesamt niedrigen F1-Scores, dass seltene Klassen nur unzureichend vorhergesagt werden. Die Ergebnisse machen deutlich, dass herkömmliche Modelle bei unausgeglichenen Klassen-zuweisungen an ihre Grenzen stoßen. Zur Verbesserung der Modellleistung wurde Feature Engineering eingesetzt. Zusätzlich wird auf ethische Herausforderungen und datenschutzrechtliche Probleme eingegangen.

In view of the increasing availability of historical crime data, machine learning methods offer new possibilities for identifying crime hotspots and planning preventive measures. This bachelor thesis deals with the application and comparison of different machine learning algorithms for predicting crime based on the publicly available San Francisco Crime Dataset. The aim of the thesis is to evaluate the performance of different classification models and to analyse their strengths and weaknesses in the classification of multiclass, unbalanced data. The best results were achieved with XGBoost when restricted to the ten most frequent crime categories (Accuracy:~33 %). Nevertheless, the overall low F1 scores show that rare classes are insufficiently predicted. The results show that conventional models reach their limits with unbalanced class assignments. Feature engineering was used to improve model performance. In addition, ethical challenges and data protection issues are addressed.
URI: https://hdl.handle.net/20.500.12738/18562
Institute: Department Informatik (ehemalig, aufgelöst 10.2025) 
Fakultät Technik und Informatik (ehemalig, aufgelöst 10.2025) 
Type: Thesis
Thesis type: Bachelor Thesis
Advisor: Sarstedt, Stefan 
Referee: Tropmann-Frick, Marina  
Appears in Collections:Theses

Files in This Item:
File Description SizeFormat
BA_Crime Prediction mit Machine Learning_geschwärzt.pdf1.6 MBAdobe PDFView/Open
Show full item record

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.