スケーラブルなベイジアン逆強化学習！安全な模倣学習実現への第1歩となるか！? （）

3つの要点 ?? 報酬関数の推定の不確かさを定量化することが可能なベイジアン逆強化学習に関する研究 ?? 従来のベイジアン逆強化学習のボトルネックであるMCMCの反復実行を回避することで大規模な状態空間を扱う問題に対しても適用可能な学習アルゴリズムを提案 ?? 医療診断データセットを用いた比較実…

Gadget Gate