📜  cartpole dqn 奖励最大值为 200 - Python 代码示例

📅  最后修改于: 2022-03-11 14:47:17.577000             🧑  作者: Mango

代码示例1
env = gym.envs.make("MountainCar-v0")
env._max_episode_steps = 4000