Name	Name	Last commit message	Last commit date
parent directory ..
bean	bean
conf	conf
README.md	README.md
test_DQN.py	test_DQN.py
train_DQN.py	train_DQN.py

Name

Last commit message

Last commit date

Mountain Car（离散动作）

https://gymnasium.farama.org/environments/classic_control/mountain_car/

说明

Mountain Car 是一种确定性 MDP（马尔可夫决策过程）问题。

目标是控制一个无法直接攀登陡峭山坡的小车，使其到达山顶。

但是小车的动力不足以直接爬上山坡，所以必须利用山坡的反向坡度来获得足够的动量。

模型训练

训练命令: python py/01_Classic_Control/04_Mountain_Car/train_DQN.py -d 0.999
查看训练过程参数:
- tensorboard --logdir=./out/tensor/mountain_car
- http://localhost:6006/
模型输出目录: ./out/models/mountain_car （默认每 500 回合保存一次）

默认使用 DQN 算法解题，但是设定了更慢的探索衰减率 0.999；因为在本题中，小车越想接近目标、就必须先学会背道而驰，更需要的是 “探索” 未知而非学习曾经失败的经验。

模型测试

测试所有模型: python py/01_Classic_Control/04_Mountain_Car/test_DQN.py
测试单个模型: python py/01_Classic_Control/04_Mountain_Car/test_DQN.py -m ./out/models/mountain_car/mountain_car_model_epoch_xxxx.pth

验证训练好的最优模型: python py/01_Classic_Control/04_Mountain_Car/test_DQN.py -m ./optimal/01_Classic_Control/04_Mountain_Car/models/mountain_car_model_epoch_500.pth -a

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

Mountain Car（离散动作）

说明

模型训练

模型测试

FilesExpand file tree

04_Mountain_Car

Directory actions

More options

Directory actions

More options

Latest commit

History

04_Mountain_Car

Folders and files

parent directory

README.md

Mountain Car（离散动作）

说明

模型训练

模型测试