Hyper Estraier

日本で開発された全文検索エンジンのライブラリ

・ライセンス:LGPL
・対応OS:クロスプラットフォーム

概要

N-gramを拡張したN.M-gramを採用し、どの言語でも洩れの無い検索が可能になっている。
また、MeCabを用いて形態素解析の結果を用いた処理を行うことが出来る。

バックエンドにQDBMを採用、データベースに対するgathererとsearcher、独自のテキスト分析システムで構成される。

文書が持つ複数の属性をインデックスに保存することができる。
属性を用いた検索と、全文検索を併用することができる、実用的な全文検索エンジンである。類似文章検索の機能もある。

・Hyper EstraierのAPIを利用したコマンド群
・Webブラウザを通じて検索を行うためのCGI
・複数台のサーバーのP2Pによる分散処理機能 → 1000万件以上の超大規模インデックスに対応。
・ウェブクローラー → 類似度優先による巡回機能がある。

などが同梱されている。

タグ:

+ タグ編集
  • タグ:
最終更新:2008年08月20日 09:58