Fulltext available Open Access
DC FieldValueLanguage
dc.contributor.advisorNeitzke, Michael-
dc.contributor.authorWagener, Benjamin
dc.date.accessioned2020-09-29T13:17:58Z-
dc.date.available2020-09-29T13:17:58Z-
dc.date.created2015
dc.date.issued2016-01-05
dc.identifier.urihttp://hdl.handle.net/20.500.12738/7214-
dc.description.abstractDiese Arbeit untersucht, wie die Grenzen vom Reinforcement Learning bei großen Zustandsräumen überschritten werden können mittels künstlicher neuronaler Netze als Näherungsverfahren. Dies geschieht auf Basis einer Projektarbeit, in welcher ein Reinforcement Learing Agent entwickelt wurde, um Super Mario zu spielen. Als Spiel wird die frei verfügbare Java Version von MarioAI verwendet. Es wird erklärt, wie die beiden Lernverfahren kombiniert werden und welche Nutzen daraus gezogen werden können. Hierbei zeigt sich, dass die erreichte Verbesserung des Agenten insgesamt gesehen nicht den Aufwand rechtfertigt.de
dc.description.abstractThis thesis examines, how the limits of Reinforcement Learning can be exceeded for large state spaces by using artificial neural networks as an approximation method. This is done on the basis of a project, in which a reinforcement learning agent was developed to play Super Mario. The freely available Java version of MarioAI is used as game. It will be explained, how the two learning methods can be combined and what benefits can be drawn from it. Furthermore it will be shown, that the achieved improvements as a whole don’t justify the needed effort.en
dc.language.isodede
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/-
dc.subject.ddc004 Informatik
dc.titleNeuronale Netze als Näherungsverfahren für große Zustandsräume beim Reinforcement Learningde
dc.typeThesis
openaire.rightsinfo:eu-repo/semantics/openAccess
thesis.grantor.departmentDepartment Informatik
thesis.grantor.placeHamburg
thesis.grantor.universityOrInstitutionHochschule für angewandte Wissenschaften Hamburg
tuhh.contributor.refereeZukunft, Olaf-
tuhh.gvk.ppn84518511X
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-72165-
tuhh.note.externpubl-mit-pod
tuhh.note.intern1
tuhh.oai.showtrueen_US
tuhh.opus.id3197
tuhh.publication.instituteDepartment Informatik
tuhh.type.opusBachelor Thesis-
dc.subject.gndKünstliche Intelligenz
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersion
dc.type.thesisbachelorThesis
dcterms.DCMITypeText-
tuhh.dnb.statusdomain-
item.grantfulltextopen-
item.creatorGNDWagener, Benjamin-
item.cerifentitytypePublications-
item.creatorOrcidWagener, Benjamin-
item.advisorGNDNeitzke, Michael-
item.languageiso639-1de-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.fulltextWith Fulltext-
item.openairetypeThesis-
Appears in Collections:Theses
Files in This Item:
File Description SizeFormat
BA_Wagener.pdf3.22 MBAdobe PDFView/Open
Show simple item record

Page view(s)

249
checked on Apr 6, 2025

Download(s)

536
checked on Apr 6, 2025

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.