Robuster Reinforcement Learning Algorithmus zur Überbrückung der Sim-to-Real Gap im autonomen Fahren

Hoffmann, Alexander

DC Element	Wert	Sprache
dc.contributor.advisor	Pareigis, Stephan	-
dc.contributor.author	Hoffmann, Alexander	-
dc.date.accessioned	2024-09-27T12:36:26Z	-
dc.date.available	2024-09-27T12:36:26Z	-
dc.date.created	2023-08-17	-
dc.date.issued	2024-09-27	-
dc.identifier.uri	https://hdl.handle.net/20.500.12738/16344	-
dc.description.abstract	Die Diskrepanz zwischen der Realität und einer Simulation stellt die Forschung im Bereich des autonomen Fahrens vor zahlreiche Herausforderungen. Simulationen erfassen nicht alle Aspekte der realenWelt, und das Training in der Simulation kann zu unvorhersehbarem Verhalten in der tatsächlichen Anwendung führen, aufgrund der Unterschiede zwischen der Simulation und der realen Umgebung. In dieser Arbeit wird ein Ansatz vorgestellt, um diese Unterschiede speziell in Bezug auf die Lenkung eines Fahrzeugs zu behandeln. Dieser Ansatz wird bei drei unterschiedlichen Reinforcement Learning Algorithmen angewandt: TD3, PPO und DQN. Die Idee besteht darin, anstatt das Netzwerk mit einem absoluten Lenkwinkel zu trainieren, mit der Differenz zwischen dem gewünschten und dem gegebenen Lenkwinkel zu arbeiten. Dadurch können Abweichungen in der Lenkung korrigiert werden, die durch technische Fehler in einer realen Anwendung verursacht wurden. Dieser Ansatz, der als TD3Δ, PPOΔ und DQNΔ bezeichnet wird, wird mit dem herkömmlichen TD3, PPO und DQN verglichen. Zusätzlich werden die Architekturen beschrieben, die in TD3Δ, PPOΔ und DQNΔ verwendet werden.	de
dc.description.abstract	The discrepancy between reality and simulation presents numerous challenges in the field of autonomous driving research. Simulations do not capture all aspects of the real world, and training in a simulation can lead to unpredictable behavior in real-world applications due to differences between the simulation and the actual environment. This work presents an approach to specifically address these differences in relation to vehicle steering. This approach is applied to three different reinforcement learning algorithms: TD3, PPO, and DQN. The idea is to train the network not with an absolute steering angle but with the difference between the desired and actual steering angles. This allows for correcting steering deviations caused by technical errors in a real-world application. This approach, referred to as TD3Δ, PPOΔ, and DQNΔ, is compared with the conventional TD3, PPO, and DQN methods. Additionally, the architectures used in TD3Δ, PPOΔ, and DQNΔ are described.	en
dc.language.iso	de	en_US
dc.subject	Autonomes Fahren	en_US
dc.subject	Reinforcement Learning	en_US
dc.subject	Sim-to-Real Gap	en_US
dc.subject	Machine Learning	en_US
dc.subject	Deep Learning	en_US
dc.subject	Robuste Steuerung	en_US
dc.subject	Autonomous Driving	en_US
dc.subject	Reinforcement Learning	en_US
dc.subject	Robust Control	en_US
dc.subject.ddc	004: Informatik	en_US
dc.title	Robuster Reinforcement Learning Algorithmus zur Überbrückung der Sim-to-Real Gap im autonomen Fahren	de
dc.type	Thesis	en_US
openaire.rights	info:eu-repo/semantics/openAccess	en_US
thesis.grantor.department	Fakultät Technik und Informatik	en_US
thesis.grantor.department	Department Informatik	en_US
thesis.grantor.universityOrInstitution	Hochschule für Angewandte Wissenschaften Hamburg	en_US
tuhh.contributor.referee	Tiedemann, Tim	-
tuhh.identifier.urn	urn:nbn:de:gbv:18302-reposit-195197	-
tuhh.oai.show	true	en_US
tuhh.publication.institute	Fakultät Technik und Informatik	en_US
tuhh.publication.institute	Department Informatik	en_US
tuhh.type.opus	Masterarbeit	-
dc.type.casrai	Supervised Student Publication	-
dc.type.dini	masterThesis	-
dc.type.driver	masterThesis	-
dc.type.status	info:eu-repo/semantics/publishedVersion	en_US
dc.type.thesis	masterThesis	en_US
dcterms.DCMIType	Text	-
tuhh.dnb.status	domain	en_US
item.advisorGND	Pareigis, Stephan	-
item.languageiso639-1	de	-
item.creatorGND	Hoffmann, Alexander	-
item.cerifentitytype	Publications	-
item.fulltext	With Fulltext	-
item.creatorOrcid	Hoffmann, Alexander	-
item.openairetype	Thesis	-
item.grantfulltext	open	-
item.openairecristype	http://purl.org/coar/resource_type/c_46ec	-
Enthalten in den Sammlungen:	Theses