アットウィキロゴ

Latent Dirichlet Allocation for Tag Recommendation

ABSTRACT

タギングシステムにおいて、タグは決められた語彙の中から選択するのではなく、ユーザが自由に付けることが出来るため、表記のゆれが存在する。また、新しいリソースにはあまりタグが付いていないため、数少ないユーザによって特異なタグが付けられてしまう。これは、多くのユーザの観点から付けられたタグではない。そのため、LDAを用いて次元削減を行い、これらの問題を解決する。具体的には、多くのタグが付けられているリソースを基にして、あまりタグが付けられていないリソースに対してタグを推薦する。タグの推薦は、同じ隠れトピックに属するタグを推薦する。提案する手法は従来の相関ルールマイニングを用いるものより良い精度を示した。

INTRODUCTION

アブストと同じ。要は新しいリソースにはあまりタグが付いていない(cold start problem)から、それに対処する。LDAを用いてタグを隠れトピックにマッピングし、同じトピックに属するタグを推薦する。

TAG RECOMMENDATION

Association Rules

相関ルールマイニングを使ってタグ推薦をする。あるリソースにタグ集合Tが付いている時、TがT1を含み、かつT1→T2という相関ルールがあるなら、T2に含まれるタグを推薦する。

Latent Dirichlet Allocation

  • LDAを用いてそれぞれのリソースに対してp(z|r)を推定し、またそれぞれのトピックに対してp(t|z)を推定する。
  • あまりタグが付いていないリソースrを考える
    • rに"photograph", "photo", "howto"が付いている時、その三つが属しているトピックを見る(photographとphotoは同じトピックに属す)。
      • この属しているという概念は、多分p(t|z)が閾値以上であるトピックの事
    • 二つのトピックに対してp(t|z)が閾値以上であるタグをリソースrに推薦する。
最終更新:2011年07月15日 23:34