LSA(Latent Semantic Analysis)とは特異値分解を用いた単語の類似性を抜き出す手法。
特異値分解は、m行n列の行列

を三つの行列に分ける。
ここで

の列ベクトルは

の固有ベクトルを表し
一方、

の列ベクトルは

の固有ベクトルを表す。
また、

は固有値を対角成分に並べたものである。
ここで

を考える。

が小さい時、これを0にすることにより、

を近似することができる。
こうすることにより、近似された

を見ると、潜在的な意味が引き出されることとなる。
最終更新:2008年05月29日 22:45