Reinforcement Training (強化学習)
OpenAI Gym
[UP]
-
OpenAI 形式準拠の独自環境 「迷路探索」:
方策反復法、
価値反復法、
Q学習
html
ipynb
-
OpenAI CartPole: Double-DQN
html
ipynb
-
OpenAI CartPole: : Dueling Network
html
ipynb
-
OpenAI CartPole: Prioritized Experience Replay
html
ipynb
-
OpenAI CartPole: A2C
html
ipynb
-
OpenAI Mario: Double-DQN
html
ipynb
mario_net.chkpt ← trained about 40,000 episode
[OpenAI Mario: Double-DQN の試し方]
- 学習済みモデルを使う場合:
ipynb ファイル (gym_mario_ddqn.ipynb) を Google Colab にアップロードし、
mario_net.chkpt を Google Drive の "マイドライブ/PyTorch/ReinforcementLearning/checkpoints/"
に配置してから、「ランタイム」 → 「全てのセルを実行」で実行する。
- 最初から学習したい場合:
ipynb ファイル (gym_mario_ddqn.ipynb) を Google Colab にアップロードし、
最初のコードセルを
LOAD_MODE=Flase
に変更してから「ランタイム」 → 「全てのセルを実行」で実行する。
学習したモデルはGoogle Drive の "マイドライブ/PyTorch/ReinforcementLearning/checkpoints/mario_net.chkpt"
に保存される。2度目以降は LOAD_MODE=True
に変更してから実行すると、追加学習される。