解決した内容
現在の問題点その1
h = HistData('2010/09')
として、2010年の9月分を学習用に与えているが、ログを見る限り2010年9月1日の05:00:00迄しか学習していない?
問題点その1に対する解
nb_max_episode_steps = None
にする。これが各エピソードにおけるステップ数の上限になっていた。
2010-09-01T05:00:00.000000+0000
で終了するのは、 60 min * 5 hours = 300 steps
で上限に達していたからだった。
まだ問題がもう一つあるので、引き続き修正する。
# before history = dqn.fit(env, nb_steps=50000, visualize=False, verbose=2, nb_max_episode_steps=300) # after history = dqn.fit(env, nb_steps=50000, visualize=False, verbose=2, nb_max_episode_steps=None)