アットウィキロゴ

Tagommenders: Connecting Users to Items through Tags

ABSTRACT

タギングシステムの普及によってユーザはコンテンツを探しやすくなった。このタグを推薦システムに導入することによって推薦システムの精度を高める。ユーザのタグへの嗜好を推定し、それを用いてコンテンツを推薦する。

INTRODUCTION

  • Amazon, Digg, Netflixなどのサービスは推薦システムを使ってユーザが好みそうなコンテンツを推薦している
  • 推薦システムにおける主な二つのタスク
    • recommend
    • predict

  • タグの意味はユーザが容易に理解できるものであるため、これによってユーザ自身とコンテンツの関係が分かる
  • 例えば、アリスはアニメが好きでいくつかのアニメ映画を見ていた
    • ある時、Ratatouilleという映画を見ようとしたが、その映画には他のユーザがanimatedというタグを付けていた
    • アリスがアニメを好きという事実と、この映画に付けられたタグによって、アリスはこの映画を好むだろうという推測ができる
    • また、pixarというタグをクリックしてIncredibleという映画を身に行くと推測できる

  • 提案するtagommenderでは、まずユーザのタグに対する嗜好を推定し、次にそれを用いて映画への嗜好を推定する
    • タグへの嗜好は、映画への評価から推定する。
      • 例えば、アニメの映画に高い評価をし、ホラーの映画に低い評価をしていれば、アニメ映画についているようなanime等のタグを好み、horror等のタグを嫌うと推定する

  • タグへの嗜好の推定
    • RQ1: ユーザのタグへの嗜好を推定できるか
    • ユーザのタグ付けの行動や、映画のクリック、タグの質を用いる
      • タグの質とは、そのタグによって映画の内容が分かるかどうか。例えば、animated, horrorは映画の内容が分かるが、likeは映画の内容は分からない。

  • 映画への評価の推定
    • tagommenderには暗黙的評価のみを用いるアルゴリズムと明示的、暗黙的評価の両方を用いるアルゴリズムの二つがある
    • RQ2: 暗黙的な評価のみのシステム上でtagommenderはどれくらい精度良く動くか(e.g., delicious)
    • RQ3: 明示的な評価もあるシステム上でtagommenderはどれくらい精度良く動くか(e.g., Amazon)

RELATED WORK

飛ばす

EXPERIMENTAL DATASETS

  • MoverLensのデータを用いる
    • データセットは5つ以上のタグが付いている映画、5種類以上の映画に付けられているタグを対象とする。反復的にそれらを求める。
    • 5つ以上の映画をクリックしたユーザを対象とする

INFERRING TAG PREFERENCE

RQ1に答える
  • タグへの嗜好を推定するやり方として二つ考える
    • タグへの直接的な行動を用いる
      • アリスがanimatedというタグを何かの映画に付ければ、アリスはそのタグを嗜好してる
    • タグへの間接的な行動を用いる(映画への評価を用いる)
      • アリスがanimatedというタグが付いた映画に評価5を与えればアリスはそのタグを嗜好してる

Inferring Preference using Tag Signals

  • タグへの直接的な行動を基にしたアルゴリズムとして三つ考える
    • Tag applied: ユーザが付与したタグは嗜好が高い
    • Tag searched: ユーザが検索したタグは嗜好が高い
    • Tag quality: ユーザは質の高いタグを好む
      • 質の高いタグとは、多くのユーザが付与したタグ、多くのユーザが検索したタグなど
  • ユーザがとったタグへの行動は{0,1}で表現されるが、それを単純に線形な関係があるとして[0,5]のタグ嗜好値に写像する。
    • 線形関係はユーザのタグへの直接的な行動と実際に与えれたタグへの評価との最小二乗回帰で求める

Inferring Preference using Item Signals

  • 映画への行動を通じてユーザのタグへの嗜好を推定する
    • ユーザがある映画に高い評価を与えた時、その映画についているタグを嗜好していると推定する
    • さらに、評価をした映画と関連が高いタグは強く嗜好すると推定し、あまり関連しないタグはあまり嗜好しないと考える
    • 映画とタグとの関連度はタグの質をもとに算出する

次の6つのアルゴリズムを考える
  • Movie-clicks
    • ユーザは嗜好するタグがついている映画をよくクリックするという仮定
    • ユーザがクリックした映画とタグとの関連度の平均がスコアとなる

  • Movie-log-odds-clicks
    • movie-clicksの指標と似ているが、全体のタグのpopularityで正規化する
    • log-oddsを用いる
    • (結果良くないっぽいから暫定的に無視)

  • Movie-r-clicks
    • クリックした映画ではなく、評価した映画に対してmovie-clicksを適用

  • Movie-r-log-odds-clicks
    • クリックした映画ではなく、評価した映画に対してmovie-log-odds-clicksを適用

  • movie-ratings
    • ユーザのタグに対する嗜好は、ユーザのそのタグが付いている映画に対する評価の平均とみなせる

  • movie-bayes
    • TBD
最終更新:2011年07月09日 17:06