
DC Element | Wert | Sprache |
---|---|---|
dc.contributor.advisor | Neitzke, Michael | - |
dc.contributor.author | Wagener, Benjamin | |
dc.date.accessioned | 2020-09-29T13:17:58Z | - |
dc.date.available | 2020-09-29T13:17:58Z | - |
dc.date.created | 2015 | |
dc.date.issued | 2016-01-05 | |
dc.identifier.uri | http://hdl.handle.net/20.500.12738/7214 | - |
dc.description.abstract | Diese Arbeit untersucht, wie die Grenzen vom Reinforcement Learning bei großen Zustandsräumen überschritten werden können mittels künstlicher neuronaler Netze als Näherungsverfahren. Dies geschieht auf Basis einer Projektarbeit, in welcher ein Reinforcement Learing Agent entwickelt wurde, um Super Mario zu spielen. Als Spiel wird die frei verfügbare Java Version von MarioAI verwendet. Es wird erklärt, wie die beiden Lernverfahren kombiniert werden und welche Nutzen daraus gezogen werden können. Hierbei zeigt sich, dass die erreichte Verbesserung des Agenten insgesamt gesehen nicht den Aufwand rechtfertigt. | de |
dc.description.abstract | This thesis examines, how the limits of Reinforcement Learning can be exceeded for large state spaces by using artificial neural networks as an approximation method. This is done on the basis of a project, in which a reinforcement learning agent was developed to play Super Mario. The freely available Java version of MarioAI is used as game. It will be explained, how the two learning methods can be combined and what benefits can be drawn from it. Furthermore it will be shown, that the achieved improvements as a whole don’t justify the needed effort. | en |
dc.language.iso | de | de |
dc.rights.uri | http://rightsstatements.org/vocab/InC/1.0/ | - |
dc.subject.ddc | 004 Informatik | |
dc.title | Neuronale Netze als Näherungsverfahren für große Zustandsräume beim Reinforcement Learning | de |
dc.type | Thesis | |
openaire.rights | info:eu-repo/semantics/openAccess | |
thesis.grantor.department | Department Informatik | |
thesis.grantor.place | Hamburg | |
thesis.grantor.universityOrInstitution | Hochschule für angewandte Wissenschaften Hamburg | |
tuhh.contributor.referee | Zukunft, Olaf | - |
tuhh.gvk.ppn | 84518511X | |
tuhh.identifier.urn | urn:nbn:de:gbv:18302-reposit-72165 | - |
tuhh.note.extern | publ-mit-pod | |
tuhh.note.intern | 1 | |
tuhh.oai.show | true | en_US |
tuhh.opus.id | 3197 | |
tuhh.publication.institute | Department Informatik | |
tuhh.type.opus | Bachelor Thesis | - |
dc.subject.gnd | Künstliche Intelligenz | |
dc.type.casrai | Supervised Student Publication | - |
dc.type.dini | bachelorThesis | - |
dc.type.driver | bachelorThesis | - |
dc.type.status | info:eu-repo/semantics/publishedVersion | |
dc.type.thesis | bachelorThesis | |
dcterms.DCMIType | Text | - |
tuhh.dnb.status | domain | - |
item.grantfulltext | open | - |
item.creatorGND | Wagener, Benjamin | - |
item.cerifentitytype | Publications | - |
item.creatorOrcid | Wagener, Benjamin | - |
item.advisorGND | Neitzke, Michael | - |
item.languageiso639-1 | de | - |
item.openairecristype | http://purl.org/coar/resource_type/c_46ec | - |
item.fulltext | With Fulltext | - |
item.openairetype | Thesis | - |
Enthalten in den Sammlungen: | Theses |
Dateien zu dieser Ressource:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
BA_Wagener.pdf | 3.22 MB | Adobe PDF | Öffnen/Anzeigen |
Feedback zu diesem Datensatz
Export
Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.