[#47173] 小数点以下を切り捨てる方法について — "T.Soejima" <clev@...2.so-net.ne.jp>

お世話になっております。そえじま@勉強中です。

16 messages 2010/06/23

[ruby-list:47127] XMLで全てのエントリーURL取得

From: Soichi Ishida <zau_777_emacs@...>
Date: 2010-06-03 10:57:42 UTC
List: ruby-list #47127
こんにちわ。このRubyメーリングリストで質問する内容ではないかもしれませんが、駄目もとで。。。

あるブログのRSSフィードURLから、XMLを取得し、それをパースしてブログの各エントリのURLを取得したいと思います。
こんな感じです。
#----------------------------------------
require "rubygems"
require "open-uri"
require "nokogiri"

blog_feed = 'http://soichi-memos.blogspot.com/feeds/posts/default'

file = "list_url.txt"
filename = File.open(file, "w")

xml = Nokogiri::XML(open(blog_feed))

xml.search("link").each do |tag|
  if tag.get_attribute("rel") == "alternate" then
    url = tag.get_attribute('href')
    filename.write(url)
    filename.write("\n")
  end
end

filename.close
#----------------------------------------
取得は成功したんですが、問題はブログの新しいものから一部のURLしか取得できません。
RSSフィードをブラウザで開いてみると、やはり一部のURLしか存在しないようです。

「全て」のブログエントリーのURLを取得するにはどうしたら良いでしょうか?

これはRSSやXMLの特性だろうとはだいたいわかるんですが...

soichi

In This Thread

Prev Next