教授と面接

配属の希望調書の件で昨日研究室の先生と面接してきた.
なんでも5人くらいしか第1志望にした人がいなかったらしく配属は確定した模様. 人数が少なさすぎるので他の研究室からあぶれた人が数人入るらしいけど…
なんでも今回の希望調書の結果はかたよりが激しいらしく,卒研が簡単だともっぱらの噂の研究室に人が群がるという始末でそれって大学生としてどうなのよと思ったりもした.
配属される予定のAIの研究室の教授は強化学習をメインにやっていて,学習する対象を行動価値関数ではなく,行動選択の方針である方策(policy)関数の中のパラメータとしている*1. 非マルコフ決定過程でも適用できるらしい.

  • 自分としては基礎理論的なことをやりたいのでその理論に何か新要素を導入していきたい
  • 強化学習の方策の与え方を学習するようなさらに上位の学習主体を考えられないか
  • とりあえず今年度中に強化学習の基礎を固めておくこと
  • 外部の国立の院に進学するつもりであること

なんかを話して帰ってきた.
外の院を受けると言ってもそれほど嫌な顔はされなかったなー. 英語やんなきゃなー

*1:方策勾配法