プレーンテキスト備忘録
「"」で囲まれたURLのみ抽出
最終更新:
pula
-
view
「"」で囲まれたURLのみ抽出
my $data = '<a href="http://www.a.com">a</a><br><a href="http://www.b.com">b</a><br><a href="http://www.c.com">c</a><br><a href="http://www.d.com">d</a><br>';
my @splitdata = split('"',$data); # 「"」の部分でデータを分割して配列に代入
my @url; # URL格納配列
my @splitdata = split('"',$data); # 「"」の部分でデータを分割して配列に代入
my @url; # URL格納配列
# splitdata配列がNULLになるまでループ
for(my $i = 0; $splitdata[$i]; $i++)
{
# 「http://www」を含む場合URLとみなし、配列@urlに代入
if($splitdata[$i] =~ /http:\/\/www/)
{
push(@url,$splitdata[$i]); # 配列の末尾にURLを挿入
}
}
for(my $i = 0; $splitdata[$i]; $i++)
{
# 「http://www」を含む場合URLとみなし、配列@urlに代入
if($splitdata[$i] =~ /http:\/\/www/)
{
push(@url,$splitdata[$i]); # 配列の末尾にURLを挿入
}
}
# @urlの配列数までループ。「$#配列名」は要素数を返す。
for(my $i = 0; $i <= $#url; $i++)
{
# URLの中身を出力
print("\$url[$i] = `$url[$i]`\n");
}
for(my $i = 0; $i <= $#url; $i++)
{
# URLの中身を出力
print("\$url[$i] = `$url[$i]`\n");
}
実行結果
$url[0] = `http://www.a.com` $url[1] = `http://www.b.com` $url[2] = `http://www.c.com` $url[3] = `http://www.d.com`