追跡問題のシミュレータ

とりあえずできたので、次はすこし賢くしてみようと思います。卒研プレゼミナールという授業でつくったQ学習のプログラムがあるので、それを流用する。あとあと再利用できるように問題に依存しないインターフェースを設計しておくと何かとおいしい。前は状態数が少なかったので状態のクラスを作ってリストでまとめていたが、今回状態数が多いので、ハッシュテーブルのキーにある状態を指定し、その状態における各行動の価値をリストとして保持する。
ハッシュテーブルは連想配列とも呼ばれる。AWKとかでは文字列しかキーにできなかったけど、LISPでは任意のオブジェクトをキーにできる。すごく便利。