Volltextdatei(en) in REPOSIT vorhanden Open Access
DC ElementWertSprache
dc.contributor.advisorNeitzke, Michael-
dc.contributor.authorMeo, Roland
dc.date.accessioned2020-09-29T14:29:48Z-
dc.date.available2020-09-29T14:29:48Z-
dc.date.created2017
dc.date.issued2018-01-31
dc.identifier.urihttp://hdl.handle.net/20.500.12738/8222-
dc.description.abstractDiese Bachelorarbeit behandelt die Entwicklung und Optimierung eines selbständig lernenden Pacman-Agenten, da Pacman über komplexe Zustandsdaten verfügt, welche ein häu ges Problem im Maschinen Lernen darstellen. Eine typische Herangehensweise ist hierbei die Bildung von Merkmalen, eine verallgemeinerte Abstraktion der gegebenen Daten. Im Verstärkenden Lernen werden diese Merkmale genutzt umeinenWert zu berechnen der aussagt wie vorteilhaft eine Situation. Dabei werden meist Verfahren wie lineare Funktions-approximation genutzt. Alternativ wird in dieser Thesis eine andere Herangehensweise vorgeschlagen, namentlich eine Kombination aus Verstärkenden Lernen und Tiefen Lernen mit künstlichen neuronalen Netzen. Ein neuronaler Netz-agent wird implementiert und optimiert bis diese Optimierung als genügend empfunden wird.de
dc.description.abstractThis bachelor thesis deals with the development and the optimization of an autonomous learning Pacman-agent, since Pacman o ers high-dimensional state data, which is a common problem in machine learning. A typical approach to this problem is using features, a high-level abstraction of the given data. In reinforcement learning these features are used to calculate a value describing how bene cial a situation is by using prediction methods like linear function approximation. This thesis suggests a di erent approach by mixing reinforcement learning and deep learning via an arti cial neural network. A neural network agent is implemented then and optimized to a level deemed su cient.en
dc.language.isodede
dc.rights.urihttp://rightsstatements.org/vocab/InC/1.0/-
dc.subject.ddc004 Informatik
dc.titleDeep Q-Learning With Features Exemplified By Pacmande
dc.typeThesis
openaire.rightsinfo:eu-repo/semantics/openAccess
thesis.grantor.departmentDepartment Informatik
thesis.grantor.placeHamburg
thesis.grantor.universityOrInstitutionHochschule für angewandte Wissenschaften Hamburg
tuhh.contributor.refereeMeisel, Andreas-
tuhh.gvk.ppn1011927519
tuhh.identifier.urnurn:nbn:de:gbv:18302-reposit-82240-
tuhh.note.externpubl-mit-pod
tuhh.note.intern1
tuhh.oai.showtrueen_US
tuhh.opus.id4168
tuhh.publication.instituteDepartment Informatik
tuhh.type.opusBachelor Thesis-
dc.subject.gndMaschinelles Lernen
dc.type.casraiSupervised Student Publication-
dc.type.dinibachelorThesis-
dc.type.driverbachelorThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersion
dc.type.thesisbachelorThesis
dcterms.DCMITypeText-
tuhh.dnb.statusdomain-
item.creatorGNDMeo, Roland-
item.fulltextWith Fulltext-
item.creatorOrcidMeo, Roland-
item.grantfulltextopen-
item.cerifentitytypePublications-
item.advisorGNDNeitzke, Michael-
item.languageiso639-1de-
item.openairecristypehttp://purl.org/coar/resource_type/c_46ec-
item.openairetypeThesis-
Enthalten in den Sammlungen:Theses
Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
Roland_Meo_BA_Thesis.pdf1.49 MBAdobe PDFÖffnen/Anzeigen
Zur Kurzanzeige

Seitenansichten

298
checked on 27.12.2024

Download(s)

1.416
checked on 27.12.2024

Google ScholarTM

Prüfe

HAW Katalog

Prüfe

Feedback zu diesem Datensatz


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.