アットウィキロゴ
 

強化学習

SVM

  • データの入れ替え
識別関数の重みによる切捨て→inclimental SVMに移行?
  • 探索方法
探索確率の離散化→単峰形正規分布による確率調整
  • 操作トルクの決定方法
同心円状に探索後,サポートベクトルに寄せる

補間補外

  • 線形近似
離散状態の遷移完了後にあらためてマップ作成
軌道上の位置をランダムに決定して格子状に探索
ランダムに初期値を決め,最急降下法により代表点決定
代表点を傾きと重心からの距離でクラスタリング
各クラスタを最小二乗法で線形近似
得られた直線をパラメータに変換
  • 補間補外
データのない離散状態の場合
他の離散状態の直線パラメータをクラスタリング
各クラスタを最小二乗補間
現在離散状態のパラメータを推定
推定パラメータを境界に変換
得られた境界により対象物操作
最終更新:2009年12月07日 15:44