2006-07-15から1日間の記事一覧

Xのネットワーク透過性を使ってマルチディスプレイを実現する。

要するに他のPCへX-Windowを転送して、さらにそこを転送元から操作しようということ。 まず、転送先PCのxhostで転送元のアドレスを登録しておく。 転送元PCにx2xをインストールする。これで転送元のキーボードで転送先のX-windowを操作できるようになる。 $ …

プレ中間発表を控えて

卒業研究にあたっては中間発表があるが、うちの研究室では二回やるらしい。8月の頭にプレ中間発表、10月には中間発表、来年2月に卒研発表の本番がある。プレ中間では選択したテーマの周辺を説明して今後のロードマップを示すという感じだけど、この三ヶ…

on-policyとoff-policy

Suttonの教科書に良く出てくる表現で、学習の過程で方策の評価、改善が行われるものをon-policy、そうではないものをoff-policyと呼ぶ。on-policyの手法としては動的計画法*1やSarsaがあり、off-policyの手法にはQ-learningがある。Q-learningは価値の更新を…