tipsとPipesに関するCherenkovのブックマーク (2)
-
これをご覧になっている方は、”RSSを使ってブログを巡回”している人もいらっしゃるかと思います。 しかしRSS未対応のページや表の特定部分を抜き出して他で利用する場合、どうしたらいいのでしょうか。 以前RSSを提供していないHPからRSSを発行するサービスをご紹介しました。 これはサイトのURLを入力するだけで自動でRSSが発行されるものでした。 ■RSS配信のないホームページからRSS受信をする。 http://haaya.net/1533 しかし、必要のない広告なども一緒に出力されてしまいます。 今回はもう少し進んで、特定部分の抜き出しを﹃Dapper﹄というwebサービスを使って 抽出をしてみようと思います。画像が多いのでご注意ください。 ■今回作ろうと思うもの NHKBSのホームページにある映画情報をRSSとして取得する。 NHKBSオンライン 映画カレンダー http://w
-
このブログで、もう何回も書いているが、Yahoo! Pipesによるスクレイピングが楽しい。やりたいことができなくてRubyで書き始めたこともあったが、Pipesの視認性の良さに慣れてしまうと、後戻りは難しい。 で、触り始めた頃より少し覚えたことが増えたので列挙してみる。 1.PipesにはWeb型RSSリーダよりFirefoxのライブブックマークが似合う RSSと言えば、Livedoor ReaderなどWeb型のRSSリーダーで読む方が楽だという固定観念があったが、Pipesを頻繁に手直ししてると未読や既読が混ざってしまい扱いにくい。また、Fetch PageなどでRSSを生成するとpubDateが付かない︵もしくは付けるのに苦労する︶という点もWeb型と相性が悪い。Firefoxのライブブックマークなど、RSSそのものを単純に表示するようなツールの方が向いている気がする。 2.タイト
-
1