PRMU特別講演IBM ReserchのWatson

金山博様(IBM基礎研究所)IBM基礎研究所個人ページ

watsonに携わった日本人は2人しかいない．そのうちの一人．

［特別講演］質問応答システムWatsonのクイズ番組における対戦
PRMUページ

IBMグランドチャレンジ(成功するかどうかわからないことをやるプログラム)の一環でやった．
ディープ・ブルーもそのプログラムだった．
2011年2月，クイズチャンピオンに勝ってしまった．
IBM基礎研究所は世界9拠点

そのうちアメリカ，イスラエル，中国，日本から人を集めた．

watsonの基礎知識

Jeopardyに参加させるためにIBM Researchが開発した質問応答システム

ーテキストで受け取り，その内容から答えの候補を出す，そして答えをマッチしてボタンを押す
ー一定以上の確信を持った場合にボタンを押す
ー聞くこと，見ることはやっていない(音声認識，画像認識)

Jeopardyについて

ー平日の夕方に行われている
ー幅広い分野から出題
ー答えの種類が決まっている，という前提条件がある
ー Jeopardyのゲーム構成詳しくはこちら

対戦の模様
ー幅広い分野への対応：膨大なカテゴリの中からの検索を一気にやらなきゃいけない
ー問題文とカテゴリの解釈：問題文で何を問うているか
ー高い正解率：実際の対戦時の正解率
ー確信度の推定：分からないときにはボタンを押さない
ー応答速度：問題文を読み終わるまでの2,3秒の勝負
ーゲームの戦略：パネルの選び方，ボタンを押す閾値の設定，賭け金の設定
ゲームを行う上での戦略も多かった

技術の補足
ー複雑な質問文から答えを適切に選び出す技術：単純ではない(質問文をGoogleで調べても答えは得られない)
ー代名詞が何を指しているか？を推定
ー答えの内容を解析した

処理の流れ(上から下)
ー問われている内容の解析
ー解答候補の生成
ー回答の根拠探し
ースコアリング
ー同義語の融合(裏で知識データベースを使用)
ー解答+確信度のリストから閾値以上の一番高い確信度を持つ答えを解答する

マッチング
キーワードのマッチングだけではだめ
→意味を考慮したマッチングをする(いろんな観点から意味付けして投票していく)

人間の成績にどうやって近づけたか？

データベースの拡張，文脈の関係を入れた，意味を考えた，などなど．

その結果，人間のレベルに近づいていった．

2880台コアを使用することで，2〜3秒の解答時間を実現した．

適用できる(しやすい)質問応答タスク

仮説が列挙できること
数値計算で決定的にとけないような複雑な問題であること
機械を発見する基となる文書や数値データが大量に使える
１００％の正答率は期待できない

→人間を補助する形で使用する

医療の分野での使用

どんな病気か，ということを割り出している

ー医学の知識を放り込んでいる
ー見落としてしまわないように，コンピュータの候補を見て判断する(医師の誤りを補正- する働きになるのではないか？)

まとめ

クイズ番組において，人間の能力を上回った

ー大量のテキスト情報を用いて適切に解答する
ー情報アクセスの方法，ハードウェア・ソフトウェアについて
ー人間とは異なるアプローチ

グランドチャレンジは，研究を進歩させる

ー目標に向かって技術を同定する
ー達成度の可視化が重要

応用の可能性

ー医療分野での応用
ー今後様々な分野でチャレンジしていきたい

「PRMU特別講演IBM ReserchのWatson」をウィキ内検索

最終更新：2011年06月07日 16:57

Hirokatsu Kataoka's wiki

メニュー

English Menu

所属

Twitter

PRMU特別講演IBM ReserchのWatson