[#47133] [ANN] ulmul-0.4.1 is released with ulmul2html5 and ulmul2xhtml — Takeshi NISHIMATSU <t_nissie@...>
西松と申します。
4 messages
2010/06/06
[#47158] [ANN] RubyKaigi 2010: PGP Keysigning Party — Urabe Shyouhei <shyouhei@...>
みなさんこんにちわ。
5 messages
2010/06/15
[#47173] 小数点以下を切り捨てる方法について — "T.Soejima" <clev@...2.so-net.ne.jp>
お世話になっております。そえじま@勉強中です。
16 messages
2010/06/23
[#47174] Re: 小数点以下を切り捨てる方法について
— "NARUSE, Yui" <naruse@...>
2010/06/23
成瀬です。
[#47180] Re: 小数点以下を切り捨てる方法について
— "T.Soejima" <clev@...2.so-net.ne.jp>
2010/06/24
そえじま@勉強中です。
[#47182] Re: 小数点以下を切り捨てる方法について
— "KISHIMOTO, Makoto" <ksmakoto@...4u.or.jp>
2010/06/24
kなんとか、じゃない、きしもとです
[#47199] [ANN] RubyKaigi2010のライトニングトークスの応募フォームをオープンしました — SHIMADA Koji <snoozer.05@...>
日本Ruby会議2010実行委員のしまだです。
5 messages
2010/06/30
[ruby-list:47127] XMLで全てのエントリーURL取得
From:
Soichi Ishida <zau_777_emacs@...>
Date:
2010-06-03 10:57:42 UTC
List:
ruby-list #47127
こんにちわ。このRubyメーリングリストで質問する内容ではないかもしれませんが、駄目もとで。。。
あるブログのRSSフィードURLから、XMLを取得し、それをパースしてブログの各エントリのURLを取得したいと思います。
こんな感じです。
#----------------------------------------
require "rubygems"
require "open-uri"
require "nokogiri"
blog_feed = 'http://soichi-memos.blogspot.com/feeds/posts/default'
file = "list_url.txt"
filename = File.open(file, "w")
xml = Nokogiri::XML(open(blog_feed))
xml.search("link").each do |tag|
if tag.get_attribute("rel") == "alternate" then
url = tag.get_attribute('href')
filename.write(url)
filename.write("\n")
end
end
filename.close
#----------------------------------------
取得は成功したんですが、問題はブログの新しいものから一部のURLしか取得できません。
RSSフィードをブラウザで開いてみると、やはり一部のURLしか存在しないようです。
「全て」のブログエントリーのURLを取得するにはどうしたら良いでしょうか?
これはRSSやXMLの特性だろうとはだいたいわかるんですが...
soichi