如何使用Nokogiri解析XML并拆分节点值？

我正在使用Nokogiri来解析XML。

doc = Nokogiri::XML("http://www.enhancetv.com.au/tvguide/rss/melbournerss.php")

我不确定如何正确地检索节点值。

我正在追踪item父节点下的title ， link和description节点。

  Toasted TV - TEN - 07:00:00 - 21/12/2011 http://www.enhancetv.com.au/tvguide/ Join the team for the latest in gaming, sport, gadgets, pop culture, movies, music and other seriously fun stuff! Featuring a variety of your favourite cartoons.

我想做的是title.split("-") ，这样我就可以将日期和时间字符串转换为有效的DateTime对象，以便稍后在轨道上使用。

由于这是RSS提要，您可能需要考虑RSS解析器：

 require 'simple-rss' require 'open-uri' feed = 'http://www.enhancetv.com.au/tvguide/rss/melbournerss.php' rss = SimpleRSS.parse open(feed) rss.items.each do |item| puts item.title, item.link, item.description end

对于您提到的示例标题字符串：

 DateTime.parse(s.split(" - ")[-2..-1].join(" "))

这会得到一个DateTime对象： Wed, 21 Dec 2011 07:00:00 +0000

但是你必须留意你可能需要处理的标题变化。修改分割以满足您的需要。

更新：没有注意到您还想了解有关如何解析文档的更多信息。所以这是如何：

 doc = Nokogiri::XML(open("http://www.enhancetv.com.au/tvguide/rss/melbournerss.php")) data = doc.xpath("//item").map do |item| [ item.search("title").first.content, item.search("link").first.content, item.search("description").first.content ] end

这将加载数据数组中项目的所有标题，链接和描述。 Nokogiri :: XML接受一个字符串作为xml文档内容，因此您需要打开该URL然后将结果提供给它。

 def parse_time(text) items = text.split("-") DateTime.strptime("#{items[-2].strip}#{items[-1].strip}", "%H:%M:%S%d/%m/%Y") end content = Net::HTTP.get(URI.parse("http://www.enhancetv.com.au/tvguide/rss/melbournerss.php")) doc = Nokogiri::XML(content){|config| config.noblanks } doc.search("//item").map{ |node| node.children.inject({}) do |hash, node| if node.name == "title" #or another name hash["created_at"] = parse_time(node.text) end hash[node.name] = node.text hash end }

如何使用Nokogiri解析XML并拆分节点值？

gem install nokogiri -v’1.6.8.1’失败了

Nokogiri XML导入饲料组织？

使用Nokogiri将div嵌套在div元素中

nokogiri可以在保存xml时使用单引号属性吗？

Nokogiri与Ruby on Rails有关

在Rails中不能要求’nokogiri’（但在irb中工作）

如何使用nokogiri方法.xpath和.at_xpath

是否可以用Nokogiri解析样式表？

使用Nokogiri :: XML :: Builder附加元素

没有回车的Nokogiri to_xml