最終更新日時2011-03-08
■目次
■本文
XPTHERとは
Firefoxのアドオンの一つ。
選択した文字列のXPATHを取得できる。
XPATHを入力すれば、文字列を取得することもできる。
そのため、ちょっとしたスクレイピングのような使い方もできる。
ダウンロード
XTPHERの使い方:公式説明(英語)
XPATHERの使い方:他の人による説明(日本語)
XPATHERの使い方:我流
XPATHの取得
0.XPATHERを有効にしておく。
1.XPATHを知りたい部分をドラッグ。
2.XPATHを知りたいxpatherを起動。右クリックで「XPTHERで表示」を選択。
XPATHを用いて、データの一括取得 1基礎(スクレイピング基礎)
0.多量の繰り返し構造になっているWEBページから定型の情報を抜き出したい。
1.抜き取りたい部分のうち、ページ中盤にあるものをドラッグして選択。
2.「XPATH」欄に表示されたXPATHを変更。
XPATHの書き方詳細はこちら
勉強用メモ - XPATH/XPATHの記述方法
3.「評価」ボタンを押す。
4.「該当ノード」欄に表示されたものをShiftキーやCtrlキーを押しながら選択すると、
下部のテキストタブに表示される。
5.テキストタブからは普通にCtrl+Cなどでコピーできる。
XPATHを用いて、データの一括取得 2応用 正規表現と置換を用いる
テキストタブでの表示に反映される。
クリッピングタブでは変化なし。
以下具体例
結果の一つずつを改行つきでピックアップしたい。
正規表現欄:/$/
置換欄:\ n
結果がjavascriptの場合に、voidの()内だけを、改行付きで抜き出したい
正規表現欄:/javascript:void\('(.*)+'\)/
置換欄:$1\ n
■正規表現の適用結果例
正規表現適用前の文字列:javascript:void('111111')
正規表現適用後の文字列:111111
新規追加用テンプレート
正規表現欄:
置換欄:
■例
正規表現適用前の文字列:
正規表現適用後の文字列:
ページフッタ
このページの1階層上のページ
このページの1階層下のページ
このページに含まれるタグ
このページへのアクセス数
今日: -
昨日: -
これまで合計: -
最終更新:2011年03月08日 14:04