正規表現 - (2011/01/19 (水) 02:07:55) の最新版との変更点
追加された行は緑色になります。
削除された行は赤色になります。
*目次
#contents(fromhere=true)
*正規表現について
正規表現とは、簡単に言えば&bold(){検索や置換をより便利にするもの}です。
**参考リンク
-[[図解でみる正規表現入門>http://funcchan.blog16.fc2.com/]]
-[[Javaの正規表現の仕様>>http://java.sun.com/javase/ja/6/docs/ja/api/java/util/regex/Pattern.html]]
-[[正規表現スレ@2ちゃんねる>http://find.2ch.net/?BBS=ALL&TYPE=TITLE&STR=%C0%B5%B5%AC%C9%BD%B8%BD]]
**正規表現が使われているところ
-[[絞り込み・検索入力欄>検索機能]]
-[[非表示・キーワード]]
--文字列のハイライト
--文字列のNG
-[[外部ブラウザ>http://www39.atwiki.jp/v2cwiki/pages/84.html#id_f1a5fc4d]]の指定
-[[Jane互換ファイル]]
--ImageViewURLReplace.dat
--ReplaceStr.txt
--URLExec.dat
--URLExec2.dat
--URLExec3.dat
**非表示・キーワードの正規表現の仕様・注意点
-初代管理人は正規表現の動作確認をしていません。間違った説明があるかもです
-絶対確実ではなく、目的外にマッチする可能性もあるので注意すること
-レベルをBBSや板など適用範囲を吟味して選択すること
-正規表現をこのページからコピペで登録する場合は、前後に余分な空白文字が付かないよう注意
-ウェイトの+は表示しようとする強さで、-の絶対値は非表示にしようとする強さ。他の登録と競合するときの判断に使われる。難しい
-正規表現を登録しているのに、RE(正規表現)のチェックを忘れる人が多いみたい。チェック外れてないか注意
-Acはactive(有効な)。これもチェック外れてないか注意。使わないときはチェック外す
-ラベルの付いているレスなどは非表示にならない
--ラベルを付けたレスに適用したい場合は、&br()レス番右クリックメニュー→ラベル→ラベルの設定…で&br()全体設定項目の「NGワードを適用する」をチェック
-適用(全タブ)の全タブとはレス表示欄のタブのこと。キーワード・非表示設定ダイアログのタブではない。&br()適用ボタンも適用(全タブ)ボタンもダイアログの全タブを適用する。
-複雑な正規表現NGを大量に活用するとレス表示(レス取得?)が重くなるの?
-このwikiで表示されるエスケープ記号は、半角バックスラッシュまたは半角円マークで表示されますが、どちらになるかは環境依存です。
--本来は半角バックスラッシュが正しいのですが、日本では多くの場合、半角円マークと全く等価です。
--(厳密にはユニコードでそれぞれの表示に別々のコードが割り当てられているそうです。特殊な状況下で思いもよらぬバグの原因になるかも)
--このwikiの文字エンコードはUnicode(UTF-8)
--Webブラウザからコピペで文字列をV2Cに貼り付けるときの文字コード変換は環境依存
--AA厨正規表現など特殊記号を使うコピペが文字化けするかも。よく確認すること
-変な正規表現を登録してしまうとフリーズしてしまうので注意。&br()もしフリーズしたら強制終了してusrprops.txtから注意深く問題の正規表現を削除する。&br()環境によっては、起動前にlockfile の削除が必要になる場合もある。
-書き込み欄のプレビューにも正規表現が適用されるので、試しやすくて便利。プレビューの変化に追従して正規表現が適用される。&br()しかし、非表示・キーワード設定の設定途中で、まだダイアログがある状態ではプレビューのほうには適用されない。&br()ダイアログをOKしプレビューし直すとプレビューにも適用される。この辺りは少し不便かも。
-V2Cはレス表示で見たままの表現に対して正規表現を考えれば良いので、分かり易い。&br()改行は<br>ではなくて、常識的に\nを使う。ほっとするよね。
*非表示・キーワード正規表現登録例
**本文でマッチングした文字をハイライト
-V2Cメニュー→設定→非表示・キーワード→本文KWタブで、以下を追加した後、RE(正規表現)をチェックし、ハイライトにデフォルトなどを選択する
-+[[ハイライトを引用行に適用する]]
-+鉤括弧とその間の文をハイライト
-+-「.*?」
-+-【.*?】
-+-\[.*?\]
**本文でマッチングしたレスを非表示
-V2Cメニュー→設定→非表示・キーワード→本文タブで、以下を追加した後、RE(正規表現)をチェックする
-+一桁ゲット厨&br()本文行頭に"2"や"ひとけた"などを書いているレスを非表示にする&br()^(?:2|ひとけた)$
-+改行厨&br()本文に無意味な連続改行を入れてある改行厨のレスを非表示にする&br()(6行以上で判定の場合)&br()(^|\n)([\s ]*\n){6}
-+ID:ほにゃらら改行&br()本文にID:ほにゃらら[改行]の行を含むレスを非表示にする
-+-投稿端末表示ありスレ専用&br()(^|\n)ID:[\w/\+]{9}
-+-投稿端末表示ありスレとなしスレ兼用&br()(?:^|\n)\s*?ID:[\w/+]{8,9}\s*?(?:\n|$)
-+AA厨&br()AAを書いてあるレスを非表示にする&br()(原理的に100%の確実性はないので注意)&br()正規表現をコピペするときは文字コードに注意&br()以下の内から一つを選ぶ
-+-(\|∪|∩|⌒|从|;;;|:::|\,\,\,|''')
-+-(\|∪|∩|⌒|从|;;;|:::|,,,|'''|□□□|■■■|?|?|?|?|?|?)
-+-(\|∪|∩|⌒|从|;;;|:::|\,\,\,|'''|□□□|■■■|?|?|?|?|?|?)
-+-(\|∪|∩|⌒|从|;;;|:::|,,,|'''|━|┃|┏|┓|┗|┛|■■■|□□□|?|?|?|?|?|?)
-+びっぱー&br()VIPから来た人のレスを非表示にする&br()(^|\W)[VV]\W*[II]\W*[PP](\W|$)&br()
-+ageかsageしか書いてない&br()本文に"age"、"sage"、"あげ"、"さげ"しか書いてないレスを非表示にする&br()^(s?age|あげ|さげ)$
-+安価連続
-+-一行にアンカーを連続で書き込んでいるレスを非表示にする(6回以上)&br()(>>?|>>?)\d+((>>?|>>?|,|-)\d+){5}
-+-アンカーを連続で書き込んでいるレスを非表示にする(31回以上)&br()(>>?|>>?)\d+(\s*(>>?|>>?|,|-)\d+){30,}
-+コピペ厨&br()本文にコピペを連続で書き込んでいるレスを非表示にする
-+-コピペ厨(4文字以上3行以下4回以上)&br()4文字以上の行で始まる3行以下の文字列パターンが4(=1+3)回以上連続コピペされているレスを非表示にする&br()(?:^|\n)(.{5,}\n(.*\n){0,2})\1{3}
-+-コピペ厨(10文字以上5行以上)&br()10文字以上の同じ行が5(=1+4)行以上連続するレスを非表示にする&br()(?:^|\n)(.{10,}\n)\1{4}
-+長文&br()特定の行数以上、特定の文字数以上のレスを非表示
-+-10行以上のレスを非表示&br()(?:.*\n){10}
-+-50文字以上のレスを非表示&br()(?s).{50}
*メール欄でマッチングしたレスを非表示
-V2Cメニュー→設定→非表示・キーワード→メールタブで以下を追加
-+sage無い&br()メール欄に"sage"を含んでいないレスを非表示にする&br()sage&br()!(論理を反転する)をチェックする&br()RE(正規表現)はチェック外して良い
-+空の目欄&br()メール欄が空のレスを非表示にする&br()^$&br()RE(正規表現)をチェックする
-+sageでも空でもない目欄。明らかに故意のアゲ&br()メール欄が空かsageている場合は表示、それ以外はレスを非表示にする&br()空は故意ではなく単に初心者の可能性がある。&br()sage|^$&br()!(論理を反転する)をチェックする&br()RE(正規表現)をチェックする
----
*目次
#contents(fromhere=true)
*正規表現について
正規表現とは、柔軟な文字列の指定を可能にし、文字列の検索、置換、強調等をより便利にするためのものです。
**参考リンク
-[[図解でみる正規表現入門>http://funcchan.blog16.fc2.com/]]※公開停止中
-[[Javaの正規表現の仕様>>http://java.sun.com/javase/ja/6/docs/ja/api/java/util/regex/Pattern.html]]
-[[正規表現スレ@2ちゃんねる>http://find.2ch.net/?BBS=ALL&TYPE=TITLE&STR=%C0%B5%B5%AC%C9%BD%B8%BD]]
**正規表現が使われているところ
-[[絞り込み・検索入力欄>検索機能]]
-[[非表示・キーワード]]
--文字列のハイライト
--文字列のNG
-[[外部ブラウザ>http://www39.atwiki.jp/v2cwiki/pages/84.html#id_f1a5fc4d]]の指定
-[[Jane互換ファイル]]
--ImageViewURLReplace.dat
--ReplaceStr.txt
--URLExec.dat
--URLExec2.dat
--URLExec3.dat
*非表示・キーワードの正規表現の仕様・注意点
-初代管理人は正規表現の動作確認をしていません。間違った説明があるかもです
-絶対確実ではなく、目的外にマッチする可能性もあるので注意すること
-レベルをBBSや板など適用範囲を吟味して選択すること
-正規表現をこのページからコピペで登録する場合は、前後に余分な空白文字が付かないよう注意
-ウェイトの+は表示しようとする強さで、-の絶対値は非表示にしようとする強さ。他の登録と競合するときの判断に使われる。難しい
-正規表現を登録しているのに、RE(正規表現)のチェックを忘れる人が多いみたい。チェック外れてないか注意
-Acはactive(有効な)。これもチェック外れてないか注意。使わないときはチェック外す
-ラベルの付いているレスなどは非表示にならない
--ラベルを付けたレスに適用したい場合は、&br()レス番右クリックメニュー→ラベル→ラベルの設定…で&br()全体設定項目の「NGワードを適用する」をチェック
-適用(全タブ)の全タブとはレス表示欄のタブのこと。キーワード・非表示設定ダイアログのタブではない。&br()適用ボタンも適用(全タブ)ボタンもダイアログの全タブを適用する。
-複雑な正規表現NGを大量に活用するとレス表示(レス取得?)が重くなるの?
-このwikiで表示されるエスケープ記号は、半角バックスラッシュまたは半角円マークで表示されますが、どちらになるかは環境依存です。
--本来は半角バックスラッシュが正しいのですが、日本では多くの場合、半角円マークと全く等価です。
--(厳密にはユニコードでそれぞれの表示に別々のコードが割り当てられているそうです。特殊な状況下で思いもよらぬバグの原因になるかも)
--このwikiの文字エンコードはUnicode(UTF-8)
--Webブラウザからコピペで文字列をV2Cに貼り付けるときの文字コード変換は環境依存
--AA厨正規表現など特殊記号を使うコピペが文字化けするかも。よく確認すること
-変な正規表現を登録してしまうとフリーズしてしまうので注意。&br()もしフリーズしたら強制終了してusrprops.txtから注意深く問題の正規表現を削除する。&br()環境によっては、起動前にlockfile の削除が必要になる場合もある。
-書き込み欄のプレビューにも正規表現が適用されるので、試しやすくて便利。プレビューの変化に追従して正規表現が適用される。&br()しかし、非表示・キーワード設定の設定途中で、まだダイアログがある状態ではプレビューのほうには適用されない。&br()ダイアログをOKしプレビューし直すとプレビューにも適用される。この辺りは少し不便かも。
-V2Cはレス表示で見たままの表現に対して正規表現を考えれば良いので、分かり易い。&br()改行は<br>ではなくて、常識的に\nを使う。ほっとするよね。
関連項目:[[非表示・キーワード]]
----
表示オプション
横に並べて表示:
変化行の前後のみ表示: