Volltextdatei(en) in REPOSIT vorhanden Open Access
DC ElementWertSprache
dc.contributor.advisorNeitzke, Michael-
dc.contributor.authorWagener, Benjamin
dc.date.accessioned2020-09-29T13:17:58Z-
dc.date.available2020-09-29T13:17:58Z-
dc.date.created2015
dc.date.issued2016-01-05
dc.identifier.urihttp://hdl.handle.net/20.500.12738/7214-
dc.description.abstractDiese Arbeit untersucht, wie die Grenzen vom Reinforcement Learning bei großen Zustandsräumen überschritten werden können mittels künstlicher neuronaler Netze als Näherungsverfahren. Dies geschieht auf Basis einer Projektarbeit, in welcher ein Reinforcement Learing Agent entwickelt wurde, um Super Mario zu spielen. Als Spiel wird die frei verfügbare Java Version von MarioAI verwendet. Es wird erklärt, wie die beiden Lernverfahren kombiniert werden und welche Nutzen daraus gezogen werden können. Hierbei zeigt sich, dass die erreichte Verbesserung des Agenten insgesamt gesehen nicht den Aufwand rechtfertigt.de
dc.description.abstractThis thesis examines, how the limits of Reinforcement Learning can be exceeded for large state spaces by using artificial neural networks as an approximation method. This is done on the basis of a project, in which a reinforcement learning agent was developed to play Super Mario. The freely available Java version of MarioAI is used as game. It will be explained, how the two learning methods can be combined and what benefits can be drawn from it. Furthermore it will be shown, that the achieved improvements as a whole don’t justify the needed effort.en
dc.language.isodede
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/-
dc.subject.ddc004 Informatik
dc.titleNeuronale Netze als Näherungsverfahren für große Zustandsräume beim Reinforcement Learningde
dc.typeThesis
openaire.rightsinfo:eu-repo/semantics/openAccess
thesis.grantor.departmentDepartment Informatik
thesis.grantor.placeHamburg
thesis.grantor.universityOrInstitutionHochschule für angewandte Wissenschaften Hamburg
tuhh.contributor.refereeZukunft, Olaf-
tuhh.gvk.ppn84518511X
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-72165-
tuhh.note.externpubl-mit-pod
tuhh.note.intern1
tuhh.oai.showtrueen_US
tuhh.opus.id3197
tuhh.publication.instituteDepartment Informatik
tuhh.type.opusBachelor Thesis-
dc.subject.gndKünstliche Intelligenz
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersion
dc.type.thesisbachelorThesis
dcterms.DCMITypeText-
tuhh.dnb.statusdomain-
item.grantfulltextopen-
item.creatorGNDWagener, Benjamin-
item.cerifentitytypePublications-
item.creatorOrcidWagener, Benjamin-
item.advisorGNDNeitzke, Michael-
item.languageiso639-1de-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.fulltextWith Fulltext-
item.openairetypeThesis-
Enthalten in den Sammlungen:Theses
Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
BA_Wagener.pdf3.22 MBAdobe PDFÖffnen/Anzeigen
Zur Kurzanzeige

Seitenansichten

249
checked on 03.04.2025

Download(s)

536
checked on 03.04.2025

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.