Fulltext available Open Access
DC FieldValueLanguage
dc.contributor.advisorNeitzke, Michael-
dc.contributor.authorMeo, Roland
dc.date.accessioned2020-09-29T14:29:48Z-
dc.date.available2020-09-29T14:29:48Z-
dc.date.created2017
dc.date.issued2018-01-31
dc.identifier.urihttp://hdl.handle.net/20.500.12738/8222-
dc.description.abstractDiese Bachelorarbeit behandelt die Entwicklung und Optimierung eines selbständig lernenden Pacman-Agenten, da Pacman über komplexe Zustandsdaten verfügt, welche ein häu ges Problem im Maschinen Lernen darstellen. Eine typische Herangehensweise ist hierbei die Bildung von Merkmalen, eine verallgemeinerte Abstraktion der gegebenen Daten. Im Verstärkenden Lernen werden diese Merkmale genutzt umeinenWert zu berechnen der aussagt wie vorteilhaft eine Situation. Dabei werden meist Verfahren wie lineare Funktions-approximation genutzt. Alternativ wird in dieser Thesis eine andere Herangehensweise vorgeschlagen, namentlich eine Kombination aus Verstärkenden Lernen und Tiefen Lernen mit künstlichen neuronalen Netzen. Ein neuronaler Netz-agent wird implementiert und optimiert bis diese Optimierung als genügend empfunden wird.de
dc.description.abstractThis bachelor thesis deals with the development and the optimization of an autonomous learning Pacman-agent, since Pacman o ers high-dimensional state data, which is a common problem in machine learning. A typical approach to this problem is using features, a high-level abstraction of the given data. In reinforcement learning these features are used to calculate a value describing how bene cial a situation is by using prediction methods like linear function approximation. This thesis suggests a di erent approach by mixing reinforcement learning and deep learning via an arti cial neural network. A neural network agent is implemented then and optimized to a level deemed su cient.en
dc.language.isodede
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/-
dc.subject.ddc004 Informatik
dc.titleDeep Q-Learning With Features Exemplified By Pacmande
dc.typeThesis
openaire.rightsinfo:eu-repo/semantics/openAccess
thesis.grantor.departmentDepartment Informatik
thesis.grantor.placeHamburg
thesis.grantor.universityOrInstitutionHochschule für angewandte Wissenschaften Hamburg
tuhh.contributor.refereeMeisel, Andreas-
tuhh.gvk.ppn1011927519
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-82240-
tuhh.note.externpubl-mit-pod
tuhh.note.intern1
tuhh.oai.showtrueen_US
tuhh.opus.id4168
tuhh.publication.instituteDepartment Informatik
tuhh.type.opusBachelor Thesis-
dc.subject.gndMaschinelles Lernen
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersion
dc.type.thesisbachelorThesis
dcterms.DCMITypeText-
tuhh.dnb.statusdomain-
item.creatorGNDMeo, Roland-
item.fulltextWith Fulltext-
item.creatorOrcidMeo, Roland-
item.grantfulltextopen-
item.cerifentitytypePublications-
item.advisorGNDNeitzke, Michael-
item.languageiso639-1de-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.openairetypeThesis-
Appears in Collections:Theses
Files in This Item:
File Description SizeFormat
Roland_Meo_BA_Thesis.pdf1.49 MBAdobe PDFView/Open
Show simple item record

Page view(s)

298
checked on Dec 27, 2024

Download(s)

1,416
checked on Dec 27, 2024

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.