Nokogiri一次解析多个XML提要并按日期排序

我使用Rails和Nokogiri来解析一些XML提要。

我已经解析了一个XML提要，我想解析多个提要并按日期对项目进行排序。它们是Wordpress提要，因此它们具有相同的结构。

在我的控制器中，我有：

def index doc = Nokogiri::XML(open('http://somewordpressfeed')) @content = doc.xpath('//item').map do |i| {'title' => i.xpath('title').text, 'url' => i.xpath('link').text, 'date' => i.xpath('pubDate').text.to_datetime} end end

在我看来，我有：

   <a href="https://stackoverflow.com/questions/14459907/nokogiri-parsing-multiple-xml-feeds-at-once-and-sort-by-date/"> (  )

上面的代码可以正常工作。我试图解析多个feed并得到404错误：

  feeds = %w(wordpressfeed1, wordpressfeed2) docs = feeds.each { |d| Nokogiri::XML(open(d)) }

如何解析多个提要并将其添加到哈希，就像我使用一个XML提要一样？我需要在页面加载时一次解析大约50个XML feed。

我会以不同的方式写出来。

尝试更改index以接受一个URL数组，然后使用map循环它们，将结果连接到一个数组，然后返回：

 def index(*urls) urls.map do |u| doc = Nokogiri::XML(open(u)) doc.xpath('//item').map do |i| { 'title' => i.xpath('title').text, 'url' => i.xpath('link').text, 'date' => i.xpath('pubDate').text.to_datetime } end end end @content = index('url1', 'url2')

对于您的哈希键，使用符号而不是字符串更像Ruby：

 { :title => i.xpath('title').text, :url => i.xpath('link').text, :date => i.xpath('pubDate').text.to_datetime }

也：

 feeds = %w(wordpressfeed1, wordpressfeed2) docs = feeds.each { |d| Nokogiri::XML(open(d)) }

each都是错误的迭代器。您需要map ，它将返回所有已解析的DOM，并将它们分配给docs 。

这不会修复404错误，这是一个错误的URL，并且是一个不同的问题。您没有正确定义数组：

 %w(wordpressfeed1, wordpressfeed2)

应该：

 %w(wordpressfeed1 wordpressfeed2)

要么：

 ['wordpressfeed1', 'wordpressfeed2']

编辑：

我正在重新访问此页面并注意到：

我需要在页面加载时一次解析大约50个XML feed。

在处理从其他站点获取数据时，这绝对是处理这种情况的错误方法，尤其是其中50个。

WordPress网站通常有新闻（RSS或Atom）提要。 Feed中应该有一个参数说明可以刷新页面的频率。 HONOR，间隔并且不会更频繁地访问其页面，尤其是当您将负载绑定到HTML页面加载或刷新时。

原因有很多，但它会分解为“只是不要这样做”，以免被禁止。如果不出意外，使用网页刷新对您的网站进行DOS攻击是微不足道的，因此它会打败他们的网站，这对您来说都不是一个好的网络开发者。你先保护自己，然后inheritance自己。

那么，当你想要获得50个网站并且响应速度快而不打败其他网站时，你会怎么做？您将数据缓存在数据库中，然后在加载或刷新页面时从中读取数据。并且，在后台，您还有另一个任务，定期触发扫描其他站点，同时尊重其刷新率。

Nokogiri一次解析多个XML提要并按日期排序

如何使用Nokogiri :: XML :: Builder在元素名称中使用连字符创建XML？

无法安装Nokogiri 1.4.3 gem

用Nokogiri解析简单的XML

Sax解析与nokogiri的奇怪的元素

Nokogiri XML导入饲料组织？

如何让Nokogiri了解我的命名空间？

FF Xpather到Nokogiri – 我可以复制和粘贴吗？

Nokogiri要求Ruby版本<2.3

使用nokogiri builder（ruby）设置标记属性并将纯文本内容添加到标记

是否有与Nokogiri类似的解析Ruby代码的东西？