Hyper Estraier
日本で開発された全文検索エンジンのライブラリ
・ライセンス:LGPL
・対応OS:クロスプラットフォーム
概要
N-gramを拡張したN.M-gramを採用し、どの言語でも洩れの無い検索が可能になっている。
また、MeCabを用いて形態素解析の結果を用いた処理を行うことが出来る。
バックエンドにQDBMを採用、データベースに対するgathererとsearcher、独自のテキスト分析システムで構成される。
文書が持つ複数の属性をインデックスに保存することができる。
属性を用いた検索と、全文検索を併用することができる、実用的な全文検索エンジンである。類似文章検索の機能もある。
・Hyper EstraierのAPIを利用したコマンド群
・Webブラウザを通じて検索を行うためのCGI
・複数台のサーバーのP2Pによる分散処理機能 → 1000万件以上の超大規模インデックスに対応。
・ウェブクローラー → 類似度優先による巡回機能がある。
などが同梱されている。
最終更新:2008年08月20日 09:58