「A Gang of Bandits」の編集履歴(バックアップ)一覧はこちら
「A Gang of Bandits」(2014/01/24 (金) 14:17:50) の最新版変更点
追加された行は緑色になります。
削除された行は赤色になります。
- 挑戦する問題
-- bandit problem
-- contextual bandit problem
-- Gang of Bandits
- Bandit problemとは
- スロットマシンがいっぱい、どうベットするのがいい?
- やっていくと確率が推定できる
- Contextual
- 報酬を予測しながら行動、結果から予測モデルを修正
- アイテムの推薦みたいな?
- 学習
- 一番良かったの+信頼性みたいなのを考える
- contextual bandit problemをsocial networksで表現したい!!!!
-- ユーザの興味関心
-- アイテム推薦
-- 隣接するユーザは類似
- LinUCBっていうcontextual bandit proble用の手法をネットワークに拡張
- Gang of Bandits.Lin←提案手法!!!!!!!!
- グラフラプラシアンとか入ってる
-- 更新が近傍に反映されるらしい
- 実験
- 比較対象
-- 各々独立更新、と、全部同じパラメータ
- 問題設定が難しいゾ~
* A Gang of Bandits
- 挑戦する問題
-- bandit problem
-- contextual bandit problem
-- Gang of Bandits
- Bandit problemとは
- スロットマシンがいっぱい、どうベットするのがいい?
- やっていくと確率が推定できる
- Contextual
- 報酬を予測しながら行動、結果から予測モデルを修正
- アイテムの推薦みたいな?
- 学習
- 一番良かったの+信頼性みたいなのを考える
- contextual bandit problemをsocial networksで表現したい!!!!
-- ユーザの興味関心
-- アイテム推薦
-- 隣接するユーザは類似
- LinUCBっていうcontextual bandit proble用の手法をネットワークに拡張
- Gang of Bandits.Lin←提案手法!!!!!!!!
- グラフラプラシアンとか入ってる
-- 更新が近傍に反映されるらしい
- 実験
- 比較対象
-- 各々独立更新、と、全部同じパラメータ
- 問題設定が難しいゾ~
&tags()
&update()