プラレールのレイアウトについて記載されたページを集める


  • 旧来のホームページタイプ(ほとんどが更新停止)
  • ブログにより定期的に情報アップしているページ(rss発信あり)

リンクの表示方法
  • 見た目でリンク先が分かりやすいようにサムネイルサービスを利用

コメントは勝手に書いている。
順番は、そのときの気分で特に決めはない。


更新情報の収集


当初はキーワードを指定するだけでかなりの情報をプラグインが勝手に集めて来ていた(Pandaneko様がわざわざ紹介に書くほど)。
いつの間にか、表示されるページが少なくなり、日付の表示もなくなりいまいちな結果に。

とあるページでプラレールのページは更新が止まったページが多いとの記述を見てリンクの更新情報を載せることを決意。

使えそうなサービスの候補
■はてなアンテナ
■google Reader
■Yahoo pipes!

wikiページへの情報表示には、wikiのrss関連プラグインを使用する。

結局全部使うことに。

まず、はてなアンテナにプラレールサイトを全部登録。rssを発信していない旧タイプのページについても更新情報(リンクページに限る)を得られる点がメリット。ブログページについては、広告やカレンダーとおぼしきものが変わっても更新されたとして表示されてしまう。
はてなアンテナの仕様にもとづき更新確認の範囲を設定するも、記事更新以外の更新情報をどうしても拾ってきてしまう。

旧タイプのページをはてなアンテナに登録し更新情報をrssとして発信させる。ブログページはgoogle Readerに登録しまとめた情報をrssで受信。

Google Readerのページから出されるrssが公開用とログイン時にのみ確認できるものと二つあり後者を使おうとして失敗。運営にご迷惑をかける。

ここで課題2つ。プラレール以外の話題の更新情報が混じることと、rssに広告が混じる。

Yahoo Pipes!のフィルターを使って、プラレールを含まない記事と広告を除去。

Yahoo Pipes!でrssをまとめたりフィルターにかけることがかなり自由にできることから、複数の検索エンジンの結果を統合することにする。
なぜか、googleの結果だけ文字化けする。いろいろ試すと、なぜか検索言語を英語に設定すると、rssの日本語が文字化けしないことを確認。

その他Yahoo Pipes!でできたこと。
  • 検索結果rssについている参照IDアドレスを除去し重複して表示される現象を解消
  • wikiのプラグインの仕様でdescriptionの内容しか表示されないため、descriptionが空のデータにはsummaryからコピー。
  • rssを全文配信する仕様のブログの記事が全部参照して表示してしまうので、冒頭だけに情報をカット。
  • 一定期間より古い記事は表示させない。
最終更新:2012年09月21日 18:04