Neuronale Netze als Näherungsverfahren für große Zustandsräume beim Reinforcement Learning

Wagener, Benjamin

DC Field	Value	Language
dc.contributor.advisor	Neitzke, Michael	-
dc.contributor.author	Wagener, Benjamin
dc.date.accessioned	2020-09-29T13:17:58Z	-
dc.date.available	2020-09-29T13:17:58Z	-
dc.date.created	2015
dc.date.issued	2016-01-05
dc.identifier.uri	http://hdl.handle.net/20.500.12738/7214	-
dc.description.abstract	Diese Arbeit untersucht, wie die Grenzen vom Reinforcement Learning bei großen Zustandsräumen überschritten werden können mittels künstlicher neuronaler Netze als Näherungsverfahren. Dies geschieht auf Basis einer Projektarbeit, in welcher ein Reinforcement Learing Agent entwickelt wurde, um Super Mario zu spielen. Als Spiel wird die frei verfügbare Java Version von MarioAI verwendet. Es wird erklärt, wie die beiden Lernverfahren kombiniert werden und welche Nutzen daraus gezogen werden können. Hierbei zeigt sich, dass die erreichte Verbesserung des Agenten insgesamt gesehen nicht den Aufwand rechtfertigt.	de
dc.description.abstract	This thesis examines, how the limits of Reinforcement Learning can be exceeded for large state spaces by using artificial neural networks as an approximation method. This is done on the basis of a project, in which a reinforcement learning agent was developed to play Super Mario. The freely available Java version of MarioAI is used as game. It will be explained, how the two learning methods can be combined and what benefits can be drawn from it. Furthermore it will be shown, that the achieved improvements as a whole don’t justify the needed effort.	en
dc.language.iso	de	de
dc.rights.uri	http://rightsstatements.org/vocab/InC/1.0/	-
dc.subject.ddc	004 Informatik
dc.title	Neuronale Netze als Näherungsverfahren für große Zustandsräume beim Reinforcement Learning	de
dc.type	Thesis
openaire.rights	info:eu-repo/semantics/openAccess
thesis.grantor.department	Department Informatik
thesis.grantor.place	Hamburg
thesis.grantor.universityOrInstitution	Hochschule für angewandte Wissenschaften Hamburg
tuhh.contributor.referee	Zukunft, Olaf	-
tuhh.gvk.ppn	84518511X
tuhh.identifier.urn	urn:nbn:de:gbv:18302-reposit-72165	-
tuhh.note.extern	publ-mit-pod
tuhh.note.intern	1
tuhh.oai.show	true	en_US
tuhh.opus.id	3197
tuhh.publication.institute	Department Informatik
tuhh.type.opus	Bachelor Thesis	-
dc.subject.gnd	Künstliche Intelligenz
dc.type.casrai	Supervised Student Publication	-
dc.type.dini	bachelorThesis	-
dc.type.driver	bachelorThesis	-
dc.type.status	info:eu-repo/semantics/publishedVersion
dc.type.thesis	bachelorThesis
dcterms.DCMIType	Text	-
tuhh.dnb.status	domain	-
item.creatorGND	Wagener, Benjamin	-
item.grantfulltext	open	-
item.openairetype	Thesis	-
item.advisorGND	Neitzke, Michael	-
item.fulltext	With Fulltext	-
item.languageiso639-1	de	-
item.cerifentitytype	Publications	-
item.creatorOrcid	Wagener, Benjamin	-
item.openairecristype	http://purl.org/coar/resource_type/c_46ec	-
Appears in Collections:	Theses