2006-05-03から1日間の記事一覧
強化学習や疑似焼きなまし法での行動選択確率の確率分布にはボルツマン分布がよく用いられる。 ボルツマン分布は「確率の和が1」、「期待値一定」という二つの制約条件の下でエントロピーを最大化させたときに出てくる確率分布。 期待値が出てくるというこ…
強化学習や疑似焼きなまし法での行動選択確率の確率分布にはボルツマン分布がよく用いられる。 ボルツマン分布は「確率の和が1」、「期待値一定」という二つの制約条件の下でエントロピーを最大化させたときに出てくる確率分布。 期待値が出てくるというこ…