- Tytuł:
-
Value-based methods of deep reinforcement learning.
Metody wartościowe głębokiego uczenia ze wzmocnieniem - Autorzy:
- Kropiewnicki, Kamil
- Opis:
-
W pracy przedstawiamy krótki wstęp do uczenia ze wzmocnieniem. Po przejrzeniu podstawowej wiedzy z dziedziny przyglądamy się rozwiązywaniu złożonych problemów przy użyciu metod wartościowych uczenia ze wzmocnieniem oraz sztucznych sieci neuronowych. Omawiamy i implementujemy metody przedstawione w czterech fundamentalnych dla głębokiego uczenia ze wzmocnieniem pracach: “Playing Atari with Deep Reinforcement Learning”, “Human-level control through deep reinforcement learning”, “Deep Reinforcement Learning with Double Q-learning” oraz “Dueling Network Architectures for Deep Reinforcement Learning”. Stosujemy nasze implementacje w dwóch grach Atari – Breakout oraz Space Invaders – dostarczonych przez OpenAI Gym. Celami tej pracy są: przedstawienie podstaw uczenia ze wzmocnieniem, dostarczenie implementacji wspomnianych metod oraz sprawdzenie jakości ich działania przy wspólnych hiperparametrach. Zakładamy podstawową wiedzę o uczeniu maszynowym u czytelnika.
In this thesis we provide a brief introduction to reinforcement learning. After reviewing basic knowledge in the domain we take a look at solving complex problems by combining reinforcement learning value-based methods and artificial neural networks. We discuss and implement methods introduced in four fundamental papers of deep reinforcement learning: “Playing Atari with Deep Reinforcement Learning”, “Human-level control through deep reinforcement learning”, “Deep Reinforcement Learning with Double Q-learning” and “Dueling Network Architectures for Deep Reinforcement Learning”. We apply our implementations on two Atari games, Breakout and Space Invaders, provided by OpenAI Gym. The objectives of this thesis are: presenting the foundations of reinforcement learning, delivering implementations of the mentioned methods and testing how they work with shared hyperparameters. Basic knowledge about machine learning is assumed - Dostawca treści:
- Repozytorium Uniwersytetu Jagiellońskiego
Inne