atwiki-logo
  • 新規作成
    • 新規ページ作成
    • 新規ページ作成(その他)
      • このページをコピーして新規ページ作成
      • このウィキ内の別ページをコピーして新規ページ作成
      • このページの子ページを作成
    • 新規ウィキ作成
  • 編集
    • ページ編集
    • ページ編集(簡易版)
    • ページ名変更
    • メニュー非表示でページ編集
    • ページの閲覧/編集権限変更
    • ページの編集モード変更
    • このページにファイルをアップロード
    • メニューを編集
    • 右メニューを編集
  • バージョン管理
    • 最新版変更点(差分)
    • 編集履歴(バックアップ)
    • アップロードファイル履歴
    • ページ操作履歴
  • ページ一覧
    • ページ一覧
    • このウィキのタグ一覧
    • このウィキのタグ(更新順)
    • このページの全コメント一覧
    • このウィキの全コメント一覧
    • おまかせページ移動
  • RSS
    • このウィキの更新情報RSS
    • このウィキ新着ページRSS
  • ヘルプ
    • ご利用ガイド
    • Wiki初心者向けガイド(基本操作)
    • このウィキの管理者に連絡
    • 運営会社に連絡(不具合、障害など)
ページ検索 メニュー
JURIA @Wiki
  • ウィキ募集バナー
  • 目安箱バナー
  • 操作ガイド
  • 新規作成
  • 編集する
  • 全ページ一覧
  • 登録/ログイン
ページ一覧
JURIA @Wiki
  • ウィキ募集バナー
  • 目安箱バナー
  • 操作ガイド
  • 新規作成
  • 編集する
  • 全ページ一覧
  • 登録/ログイン
ページ一覧
JURIA @Wiki
ページ検索 メニュー
  • 新規作成
  • 編集する
  • 登録/ログイン
  • 管理メニュー
管理メニュー
  • 新規作成
    • 新規ページ作成
    • 新規ページ作成(その他)
      • このページをコピーして新規ページ作成
      • このウィキ内の別ページをコピーして新規ページ作成
      • このページの子ページを作成
    • 新規ウィキ作成
  • 編集
    • ページ編集
    • ページ編集(簡易版)
    • ページ名変更
    • メニュー非表示でページ編集
    • ページの閲覧/編集権限変更
    • ページの編集モード変更
    • このページにファイルをアップロード
    • メニューを編集
    • 右メニューを編集
  • バージョン管理
    • 最新版変更点(差分)
    • 編集履歴(バックアップ)
    • アップロードファイル履歴
    • ページ操作履歴
  • ページ一覧
    • このウィキの全ページ一覧
    • このウィキのタグ一覧
    • このウィキのタグ一覧(更新順)
    • このページの全コメント一覧
    • このウィキの全コメント一覧
    • おまかせページ移動
  • RSS
    • このwikiの更新情報RSS
    • このwikiの新着ページRSS
  • ヘルプ
    • ご利用ガイド
    • Wiki初心者向けガイド(基本操作)
    • このウィキの管理者に連絡
    • 運営会社に連絡する(不具合、障害など)
  • atwiki
  • JURIA @Wiki
  • xyzzy + xdoc2txt.l + Hyper Estraier + HE-grep.l

JURIA @Wiki

xyzzy + xdoc2txt.l + Hyper Estraier + HE-grep.l

最終更新:2008年02月05日 13:39

juria

- view
管理者のみ編集可
xyzzy + xdoc2txt.l + Hyper Estraier + HE-grep.l
  • Hyper Estraier で抽出したファイルに対してgrep
    • 準備
      • xdoc2txt
      • xdoc2txt.l
      • Hyper Estraier
    • HE-grep.l
    • regrep.l
      • HE-grep の検索結果にも regrep
    • grep 結果のクリックでジャンプ


Hyper Estraier で抽出したファイルに対してgrep


[2008-02-06] MyWiki より転記・修正
[2006-02-20]更新 [2005-12-30]

準備

xdoc2txt

xdoc2txt v1.27
 pdf, word, excel などの各種バイナリ文書からテキストを抽出する。
cryptlib.dll Ver1.00
 パスワード無しで暗号化されたPDFを検索・表示するための追加DLL

3つのファイルををパスの通った所に置く。
  • xdoc2txt.exe(2008-02-05 現在 ver.1.27)
  • zlib.dll(xdoc2txt に同梱)
  • cryptlib.dll

xdoc2txt.l

xdoc2txt.l v0.8
  xdoc2txt を利用して pdf, word, excel などの各種バイナリ文書からテキストを
 抽出、xyzzy で表示する。

grep-dialog , ggrep -dialog で 直接 grep が可能。要 encap.l

1.~/site-lisp 配下にxdoc2txt.lをコピー、必要に応じてbyte-compile
2.~/site-lisp/siteinit.l または ~/.xyzzyに アーカイブ同梱の .xyzzy.sample の
  記述を転記、必要に応じてカスタマイズ(xdoc2txtのオプションはreadme.txt参照)

(require "xdoc2txt")

xdoc2txt.l ver.0.7 以前では、システムのTempフォルダに一時ファイルが残ります。
デフォルトでは、
"C:\Documents and Settings\user\Local Settings\Temp\~xyzfnk(数字).tmp"
ver.0.8 以降で削除されるようになりました。(2006-06-10 追記)

Hyper Estraier

http://hyperestraier.sourceforge.net/
インデックスを使った全文検索システム

Windows版バイナリパッケージ(hyperestraier-1.x.x-win32.zip)を DL、
パスの通ったディレクトリに以下の8個のファイルをコピー
(xdoc2txt.exe , zlib.dll は Hyper Estraierパッケージにも同梱されているが、
最新版を別個に展開してあればそれ以外の6個で OK)

estcmd.exe
estraier.dll
estxfilt.bat
libiconv-2.dll
mgwz.dll
pthreadGC2.dll
qdbm.dll
regex.dll

HE-grep.l

 http://homepage2.nifty.com/kimagurenixyzzy/HE-grep.html
 Hyper Estraierで抽出したファイルやバイナリ文書から抽出したテキストに対して
 grep をかける。

1.~/site-lisp 配下にHE-grep.lを保存、必要に応じてバイトコンパイル
2.~/site-lisp/siteinit.l または ~/.xyzzyに 以下を記述

;HE-grep をロード
(require "HE-grep")

設定は HE-grep.l を参考に(自分の環境に合わせて)
;検索結果表示を別フレームにしない
(setq *use-frame-HE-grep* nil)

;検索対象をリスト形式で指定
(setq *HE-command-list*
'(
  (
   "pdf(&P)"           ;ポップアップメニューに表示する名前
   "E:/pdf/casket"     ;インデックスを保存してあるディレクトリ
   "estcmd search -sf -ic CP932 -vh -max -1"
                       ;estcmd search コマンドをオプション付きで指定
   "E:/pdf"            ;インデックス作成対象のディレクトリ
  )
  (
   "doc(&D)"
   "C:/Documents and Settings/user/My Documents/casket"
   "estcmd search -sf -ic CP932 -vh -max -1"
   "C:/Documents and Settings/user/My Documents"
  )
  (
   "html(&H)"
   "E:/HTML/casket"
   "estcmd search -sf -ic CP932 -vh -max -1"
   "E:/HTML"
   )
))

;インデックスを作成
(setq *HE-make-index-command-list*
'(
 ;インデックス化(gather)、存在しない文書情報の削除(purge)、
 ;最適化(optimize)を実行する(PDFの例)
 (
   "E:/pdf/casket"      ;インデックスを保存するディレクトリ
   "E:/pdf"             ;検索対象ディレクトリ
   "estcmd gather -cl -fx .pdf T@estxfilt -fz ^ -ic CP932 -pc CP932 -sd -cm"
                        ;estcmd gather コマンドをオプション付きで指定
   "estcmd purge -cl"   ;estcmd purge コマンドをオプション付きで指定
                        ;行わない場合nil
   "estcmd optimize"    ;estcmd optimize コマンドをオプション付きで指定
                        ;行わない場合nil
   "gather-pdf(&P)"     ;ポップアップメニューに表示する名前
 )

 ;purge と optimize を行わない場合(Office文書の例)
 (
   "C:/Documents and Settings/user/My Documents/casket"
   "C:/Documents and Settings/user/My Documents"
   "estcmd gather -cl -fx .rtf,.doc,.xls,.ppt T@estxfilt -fz
     ^ -ic CP932 -pc CP932 -sd -cm"
   nil
   nil
   "gather-doc(&D)"
 )

;登録したディレクトリのインデックスをまとめて作成
(setq *HE-make-index-all-command-list*
'(
  (
  "E:/casket"
  "E:/DiaryData"
  "estcmd gather -pc CP932 -ic CP932 -fh -sd -cm"
  "estcmd purge"
  "estcmd optimize"
  )
))

管理コマンド
User's Guide of Hyper Estraier Version 1(Japanese) から抜粋

estcmd optimize [-onp] [-ond] db
              :インデックスを最適化して、不要な領域を削除
              
estcmd search [-ic enc] [-vu|-va|-vf|-vs|-vh|-vx|-dd] [-kn num] [-um] [-ec rn]
              [-gs|-gf|-ga] [-cd] [-ni] [-sf] [-hs] [-attr expr] [-ord expr]
              [-max num] [-sk num] [-sim id] db [phrase]
              :インデックスに登録された文書を検索
              
estcmd gather [-cl] [-no] [-fe|-ft|-fh|-fm] [-fx sufs cmd] [-fz] [-fo]
              [-rm sufs] [-ic enc] [-il lang] [-bc] [-pc enc] [-px name]
              [-apn|-acc] [-xl|-xh] [-sd] [-cm] [-cs num] [-kn num] [-um] db
              [file|dir]
              :ファイルシステムを探索して文書を登録
              
estcmd purge [-cl] [-no] [-fc] [-pc enc] [-attr expr] db [prefix]
              :インデックス内にあってファイルシステム上にない文書情報を削除

  -sf:検索式を簡便形式で
  -vh:VIEW HUMAN 表示方法の設定
  -max:最大表示件数。負数にすると無制限
  -cl:上書きされた文書の領域を整理
  
  -fx:ファイル(カンマ区切りで列挙)に関連づけた外部コマンドを指定
  T@estxfilt:Hyper Estraierからxdoc2txtを呼び出し(estxfilt.bat)、
              外部コマンドによる出力をプレーンテキストとして解析(T@)
  -fz:-fxの条件に当てはまらないファイルを無視
  -fh:処理対象をHTMLとして扱う
  -fm:処理対象をMIME(メール)として扱う
  ^:エスケープシーケンス
  -ic;対象文書の文字コードを指定 CP932 はestxfiltの出力の文字コード
  -pc:ファイルのパスの文字コードを指定
  -il:文字コードの判定で優先される言語を指定
  -sd:ファイルの更新日時を文書の属性として追加
  -cm:文書の属性の更新日時がファイルの更新日時より古い場合にのみ登録

3.使い方
M-x HE-make-index
:ポップアップメニューから選択してインデックスを作成
 purge(削除)・optimize(最適化)もこのメニューから。(casketディレクトリは
 初回インデックス作成時に自動作成される)
 初回インデックス作成後すぐに optimize しておく。
M-x HE-make-index-all
:*HE-make-index-all-command-list* に登録したディレクトリのインデックスを
 まとめて作成。
M-x HE-grep
 :検索語を入力して検索(検索対象インデックスが複数ある場合は、前回の対象
 インデックスからの検索になる。)
C-u M-x HE-grep
:検索対象インデックスをポップアップメニューから選択して検索

検索語が含まれるファイル名と行全てと、検索語が強調され表示されます。

HE-grep は AND OR検索などには未対応
AND OR 検索をしたい場合は、ggrep-dialog または Hyper Estraier Mode on xyzzy で。
ただし、Hyper Estraier Mode on xyzzy では、検索語が含まれるファイルパスと
該当する部分の抜き出し表示です(estcmd search の標準出力)。

regrep.l

http://xyzzy.s53.xrea.com/wiki/index.php?Memo%2FGrep%B4%D8%CF%A2
Grep 関係バッファ又は *NAMAZU SEARCH* バッファに対し再検索

  • M-x regrep して検索語入力。
  • M-x regrep-open-file :Grep関連バッファでカーソル下のファイルを開く。

HE-grep の検索結果にも regrep

regrep.l に以下を追加
70行目あたりに  (string= "*HE-grep*" bufname)
130行目あたりに (string= bufname "*HE-grep*")
160行目あたりに (string= "*HE-grep*" bufname)

grep 結果のクリックでジャンプ

(まいくろちっぷすxyzzy部門より)
http://xyzzy.s53.xrea.com/wiki/index.php?TipsDirectory
  • *regrep*バッファの検索結果上でも、 Enter or クリックでファイルを開いて
 該当個所にジャンプ&反転表示ができる。(HTMLのみ?)


-

タグ:

xyzzy xdoc2txt xdoc2txt.l Hyper Estraier HE-grep.l
「xyzzy + xdoc2txt.l + Hyper Estraier + HE-grep.l」をウィキ内検索
LINE
シェア
Tweet
JURIA @Wiki
記事メニュー

Menu


Front Page
Creative Sports
 : Main
 : Mirror
 :Topics

ぷにっつチャンネル @Youtube
juria @Instagram

juria さんち光化計画
 : ひかりOne Tタイプ
 : さよなら Tタイプ

juria @Wiki 新館

▼@あれこれ
  • 2011年11月
  • 2011年10月
  • 2011年8月
  • 2011年7月
  • 2011年5月
  • 2011年4月
  • 2011年3月
  • 2011年2月
  • 2011年1月
▼@あれこれ2010年
  • 201012
  • 201011
  • 201010
  • 201009
  • 201008
  • 201007
  • 201006
  • 201005
  • 201004
  • 201003
  • 201002
  • 201001

▼@あれこれ2009年
  • 200912
  • 200911
  • 200910
  • 200909
  • 200908
  • 200907
  • 200906
  • 200905
  • 200904
  • 200903
  • 200902
  • 200901

▼@あれこれ2008年
  • 200812
  • 200811
  • 200810
  • 200809
  • 200808
  • 200807
  • 200806
  • 200805
  • 200804
  • 200803
  • 200802
  • 200801

▼@あれこれ2007年
  • 200712
  • 200711
  • 200710
  • 200709
  • 200708
  • 200707
  • 200706
  • 200705
  • 200704
  • 200703
  • 200702
  • 200701

▼@あれこれ2006年
  • 200612
  • 200611
  • 200610
  • 200609
  • 200608
  • 200607
  • 200606
  • 200605
  • 200604
  • 200603
  • 200602
  • 200601

▼特別編
  • WindowsはそれなりだけどLinuxは初めてな私
  • Windows XP MS-DOS 起動ディスクって?
  • Windows XP MS-DOS 起動ディスクって? その2
  • Windows XP MS-DOS 起動ディスクって? その3
  • AtPicture history こっそり
  • Fraunhofer IIS MPEG Audio Layer-3 ACM codec Pro
  • Lossless Audio がいいかも、流行りだし
  • MPEG4 AAC LC エンコード
  • あふwと連携
  • あふwと連携 - 其弐
  • IME の状態表示
  • VLC media player でストリーム配信
  • TiMidity++ Windows 版
  • Windows XP 起動の高速化
  • BootVisの失敗
  • GOw(GO for Windows)
  • xyzzy + html+-mode.l + Browserex
  • xyzzy + rss-mode.l
  • xyzzy + Calmemo.l
  • xyzzy + xdoc2txt.l + Hyper Estraier + HE-grep.l
  • xyzzy + estraier.l
  • やることなすことみなリスト

▼番外編
  • ペナン(マレーシア)行って来ましたの記録 その壱
  • ペナン(マレーシア)行って来ましたの記録 その弐
  • ペナン(マレーシア)行って来ましたの記録 その参
  • ペナン(マレーシア)行って来ましたの記録 最終章

▼ページ一覧
  • ページ一覧




#ref error :画像を取得できませんでした。しばらく時間を置いてから再度お試しください。
記事メニュー2

検 索

サイト内検索

更新履歴

取得中です。

リンク


  • 自力整体教室 さあや
  • 『はいびじー・くらふと』
人気記事ランキング
  1. TiMidity++ Windows 版
  2. @あれこれ-2009年4月
  3. @あれこれ-2007年12月
  4. @あれこれ-2010年1月
  5. @あれこれ-2011年3月
  6. @あれこれ-2006年3月
  7. @あれこれ-2008年11月
  8. GOw(GO for Windows)
  9. @あれこれ-2006年8月
  10. @あれこれ-2008年12月
もっと見る
最近更新されたページ
  • 1258日前

    あふwと連携
  • 1259日前

    メニュー
  • 1259日前

    Front Page
  • 4290日前

    AtPicture history こっそり
  • 4290日前

    IME の状態表示
  • 4972日前

    @あれこれ-2011年11月
  • 5169日前

    @あれこれ-2011年8月
  • 5189日前

    @あれこれ-2011年7月
  • 5200日前

    あふwと連携 - 其弐
  • 5268日前

    @あれこれ-2011年5月
もっと見る
「xyzzy」関連ページ
  • @あれこれ-2006年10月
  • xyzzy + html+-mode.l + Browserex
  • @あれこれ-2009年12月
  • @あれこれ-2009年11月
  • @あれこれ-2006年1月
人気タグ「CrystalCPUID」関連ページ
  • @あれこれ-2008年6月
もっと見る
人気記事ランキング
  1. TiMidity++ Windows 版
  2. @あれこれ-2009年4月
  3. @あれこれ-2007年12月
  4. @あれこれ-2010年1月
  5. @あれこれ-2011年3月
  6. @あれこれ-2006年3月
  7. @あれこれ-2008年11月
  8. GOw(GO for Windows)
  9. @あれこれ-2006年8月
  10. @あれこれ-2008年12月
もっと見る
最近更新されたページ
  • 1258日前

    あふwと連携
  • 1259日前

    メニュー
  • 1259日前

    Front Page
  • 4290日前

    AtPicture history こっそり
  • 4290日前

    IME の状態表示
  • 4972日前

    @あれこれ-2011年11月
  • 5169日前

    @あれこれ-2011年8月
  • 5189日前

    @あれこれ-2011年7月
  • 5200日前

    あふwと連携 - 其弐
  • 5268日前

    @あれこれ-2011年5月
もっと見る
ウィキ募集バナー
急上昇Wikiランキング

急上昇中のWikiランキングです。今注目を集めている話題をチェックしてみよう!

  1. 遊戯王DSNTナイトメアトラバドール攻略Wiki@わかな
  2. 発車メロディーwiki
  3. 正田崇作品 @ ウィキ
  4. ElectriarCode @ ウィキ
  5. トリコ総合データベース
  6. 星の翼(Starward) 日本語wiki @ ウィキ
  7. 戦隊・ライダー:怪人まとめ@ ウィキ
  8. 機動戦士ガンダム EXTREME VS. MAXI BOOST ON wiki
  9. モンスター烈伝オレカバトル@wiki
  10. モンスター烈伝オレカバトル2@wiki
もっと見る
人気Wikiランキング

atwikiでよく見られているWikiのランキングです。新しい情報を発見してみよう!

  1. アニヲタWiki(仮)
  2. ゲームカタログ@Wiki ~名作からクソゲーまで~
  3. 初音ミク Wiki
  4. ストグラ まとめ @ウィキ
  5. 機動戦士ガンダム バトルオペレーション2攻略Wiki 3rd Season
  6. 検索してはいけない言葉 @ ウィキ
  7. 発車メロディーwiki
  8. 機動戦士ガンダム EXTREME VS.2 INFINITEBOOST wiki
  9. オレカバトル アプリ版 @ ウィキ
  10. MadTown GTA (Beta) まとめウィキ
もっと見る
新規Wikiランキング

最近作成されたWikiのアクセスランキングです。見るだけでなく加筆してみよう!

  1. MadTown GTA (Beta) まとめウィキ
  2. MADTOWNGTAまとめwiki
  3. まどドラ攻略wiki
  4. ちいぽけ攻略
  5. Shoboid RPまとめwiki
  6. SurrounDead 攻略 (非公式wiki)
  7. シュガードール情報まとめウィキ
  8. 戦国ダイナスティ攻略Wiki@ウィキ
  9. ソニックレーシング クロスワールド 攻略@ ウィキ
  10. Last Z: Survival Shooter @ ウィキ
もっと見る
全体ページランキング

最近アクセスの多かったページランキングです。話題のページを見に行こう!

  1. 参加者一覧 - MADTOWNGTAまとめwiki
  2. 参加者一覧 - MadTown GTA (Beta) まとめウィキ
  3. angler - MADTOWNGTAまとめwiki
  4. 魔獣トゲイラ - バトルロイヤルR+α ファンフィクション(二次創作など)総合wiki
  5. XVI - MADTOWNGTAまとめwiki
  6. 行列のできる法律相談所 - アニヲタWiki(仮)
  7. 白狐 - MADTOWNGTAまとめwiki
  8. 参加者一覧 - ストグラ まとめ @ウィキ
  9. 868 - ストグラ まとめ @ウィキ
  10. 模擬ドラフト結果 - おんJ模擬ドラフトまとめwiki
もっと見る

  • このWikiのTOPへ
  • 全ページ一覧
  • アットウィキTOP
  • 利用規約
  • プライバシーポリシー

2019 AtWiki, Inc.