アットウィキロゴ

LSH

Locality Sensitive Hash の略

二つのデータが似ていれば似ているほど高確率で衝突を起こすようなハッシュを用い、クラスタリング/次元圧縮などに利用する手法のこと。
類似度によってアルゴリズムが異なる。
Google News Personalization では MinHash が利用されている。


最終更新:2010年08月09日 11:50