PRMU特別講演IBM ReserchのWatson


金山 博様(IBM基礎研究所)IBM基礎研究所 個人ページ
  • watsonに携わった日本人は2人しかいない.そのうちの一人.

[特別講演]質問応答システムWatsonのクイズ番組における対戦
PRMUページ

  • IBMグランドチャレンジ(成功するかどうかわからないことをやるプログラム)の一環でやった.
  • ディープ・ブルーもそのプログラムだった.
  • 2011年2月,クイズチャンピオンに勝ってしまった.
  • IBM基礎研究所は世界9拠点
そのうちアメリカ,イスラエル,中国,日本から人を集めた.


watsonの基礎知識
  • Jeopardyに参加させるためにIBM Researchが開発した質問応答システム
ー テキストで受け取り,その内容から答えの候補を出す,そして答えをマッチしてボタンを押す
ー 一定以上の確信を持った場合にボタンを押す
ー 聞くこと,見ることはやっていない(音声認識,画像認識)

  • Jeopardyについて
ー 平日の夕方に行われている
ー 幅広い分野から出題
ー 答えの種類が決まっている,という前提条件がある
ー Jeopardyのゲーム構成詳しくはこちら


対戦の模様
ー 幅広い分野への対応:膨大なカテゴリの中からの検索を一気にやらなきゃいけない
ー 問題文とカテゴリの解釈:問題文で何を問うているか
ー 高い正解率:実際の対戦時の正解率
ー 確信度の推定:分からないときにはボタンを押さない
ー 応答速度:問題文を読み終わるまでの2,3秒の勝負
ー ゲームの戦略:パネルの選び方,ボタンを押す閾値の設定,賭け金の設定
ゲームを行う上での戦略も多かった


技術の補足
ー 複雑な質問文から答えを適切に選び出す技術:単純ではない(質問文をGoogleで調べても答えは得られない)
ー 代名詞が何を指しているか?を推定
ー 答えの内容を解析した

処理の流れ(上から下)
ー 問われている内容の解析
ー 解答候補の生成
ー 回答の根拠探し
ー スコアリング
ー 同義語の融合(裏で知識データベースを使用)
ー 解答+確信度のリストから閾値以上の一番高い確信度を持つ答えを解答する


マッチング
キーワードのマッチングだけではだめ
→意味を考慮したマッチングをする(いろんな観点から意味付けして投票していく)


人間の成績にどうやって近づけたか?
  • データベースの拡張,文脈の関係を入れた,意味を考えた,などなど.
その結果,人間のレベルに近づいていった.
  • 2880台コアを使用することで,2〜3秒の解答時間を実現した.


適用できる(しやすい)質問応答タスク
  • 仮説が列挙できること
  • 数値計算で決定的にとけないような複雑な問題であること
  • 機械を発見する基となる文書や数値データが大量に使える
  • 100%の正答率は期待できない
→人間を補助する形で使用する


医療の分野での使用
  • どんな病気か,ということを割り出している
ー 医学の知識を放り込んでいる
ー 見落としてしまわないように,コンピュータの候補を見て判断する(医師の誤りを補正- する働きになるのではないか?)


まとめ
  • クイズ番組において,人間の能力を上回った
ー 大量のテキスト情報を用いて適切に解答する
ー 情報アクセスの方法,ハードウェア・ソフトウェアについて
ー 人間とは異なるアプローチ

  • グランドチャレンジは,研究を進歩させる
ー 目標に向かって技術を同定する
ー 達成度の可視化が重要

  • 応用の可能性
ー 医療分野での応用
ー 今後様々な分野でチャレンジしていきたい




最終更新:2011年06月07日 16:57