|
Verstärkungslernen (Reinforcement learning, RL) ist ein Untergebiet des Maschinellen Lernens. Ein Agent befindet sich in einer Umwelt und kommuniziert mit dieser durch fest vorgegebene Kanäle. Der Agent beobachtet den Zustand seiner Umwelt
und wählt basierend auf dieser Beobachtung und seiner internen Handlungsstrategie eine Aktion, die von der Umwelt ausgeführt wird. Schließlich erhält der Agent von der Umwelt ein skalares Verstärkungslernsignal, das das Verhalten
des Agenten bewertet. Im ersten Teil werden die konzeptuellen Gemeinsamkeiten und Unterschiede zwischen policy gradient Methoden und evolutionärem RL untersucht und experimentell nachgewiesen. Der zweite Teil der Arbeit befasst sich mit der weiteren
Verbesserung der Rauschkontrolle für evolutionäre Algorithmen. Selektionsrennen werden hergeleitet, ihre theoretischen Eigenschaften dargestellt und ihr Verhalten wird experimentell untersucht und mit einem kompetitiven Verfahren verglichen.
|