k近傍法について
1.散布図のようなベクトル空間をイメージすると良い。
2.ある新しい未知のデータが見つかったら、1のベクトル空間にプロットする。
3.未知データと既知データの距離を計測する。
4.円を囲うような形で、複数(k個)の近傍データポイントを探し出す。
5.それらk個のデータポイントの多数決や平均を取って分類や予測を行う。
※近い距離にあるデータの集まりが、分類Aに属するものが多ければ、今回の未知データも分類Aではと予想する。
最近傍識別器
特にk=1の時を最近傍識別器と呼ぶ。
1.トレーニングパターンをプロトタイプとして記憶し、入力パターンと最も近いプロトコルタイプとして記憶する。
2.新しい入力が見つかったら、入力パターンと最も近いプロトタイプが属するクラスによって対象を識別する。
のような形で識別するイメージとなる。
分布モデルなどの事前の知識などを必要としないのがメリットであるが、識別速度が遅いことやメモリ消費量が多いというデメリットも持つ。
最終更新:2025年02月24日 11:00