License: | Title: | Einsatz eines maschinellen Lernverfahrens in einem Othello-Spielprogramm | Language: | German | Authors: | Tödten, Miriam | Keywords: | Bewertungsfunktion; temporale Differenz; Multi Step Prediction Problem | Issue Date: | 13-Aug-2008 | Abstract: | Diese Arbeit untersucht den Einsatz eines maschinellen Lernverfahrens zum Lernen einer Bewertungsfunktion für Othello-Spielpositionen, wobei kein strategisches Wissen benutzt wird. Das Lernverfahren verwendet wie Samuels Dame-Programm eine temporale Differenz in einem Selfplay-Modus, um beim Spielen mehrmals eine Bewertungsfunktion Pz zu einer neuen Bewertungsfunktion Pz+1 zu ändern, indem es die Gewichte anpasst. In mehreren Versuchsgruppen werden gleichartige Versuche gestartet, die sich in ihren zufälligen Startgewichten unterscheiden. Für die Bewertung wird untersucht, ob das Lernverfahren in gleichartigen Versuchen ähnliche Bewertungsfunktionen produziert und ob die gelernten Bewertungsfunktionen als spielstark zu bewerten sind. This Paper is concerned with a temporal-difference method to learn an evaluation function that can be used in a MinMax search in a game called Othello. Like in Samuels checker program a temporal difference is used to learn the evaluation function by changing its weights. The described approach does not use any strategic knowledge of Othello. Main Part of the investigation concerns the question of similarity of learning results in different groups of similar experiments starting with random weights. |
URI: | http://hdl.handle.net/20.500.12738/9516 | Institute: | Department Informatik | Type: | Thesis | Thesis type: | Bachelor Thesis | Advisor: | von Luck, Kai | Referee: | Neitzke, Michael |
Appears in Collections: | Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
BachelorarbeitMiriamToedten.pdf | 3.41 MB | Adobe PDF | View/Open |
Note about this record
Export
Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.