Nokogiri文本节点内容
是否有任何干净的方法来获取Nokogiri的文本节点的内容? 现在我正在使用
some_node.at_xpath( "//whatever" ).first.content
这对于获取文本来说似乎非常冗长。
你只想要文字吗?
doc.search('//text()').map(&:text)
也许你不想要所有的空白和噪音。 如果只想要包含单词字符的文本节点,
doc.search('//text()').map(&:text).delete_if{|x| x !~ /\w/}
编辑:您似乎只想要单个节点的文本内容:
some_node.at_xpath( "//whatever" ).text
只需查找文本节点:
require 'nokogiri' doc = Nokogiri::HTML(< This is a text node
This is another text node