我无法从Nokogiri解析的字符串中删除空格
我无法从字符串中删除空格。
我的HTML是:
Cena pro Vás: 139 Kč
我的代码是:
#encoding: utf-8 require 'rubygems' require 'mechanize' agent = Mechanize.new site = agent.get("http://www.astratex.cz/podlozky-pod-raminka/doplnky") price = site.search("//p[@class='your-price']/strong/text()") val = price.first.text => "139 " val.strip => "139 " val.gsub(" ", "") => "139 "
gsub
, strip
等不起作用。 为什么,我该如何解决这个问题?
val.class => String val.dump => "\"139\\u{a0}\"" ! val.encoding => # __ENCODING__ => # Encoding.default_external => #
我正在使用Ruby 1.9.3,因此Unicode不应该是问题。
strip
只删除ASCII
空格,你在这里得到的字符是Unicode不间断空格。
删除角色很容易。 您可以通过提供带有字符代码的正则表达式来使用gsub
: gsub(/\u00a0/, '')
您也可以调用gsub(/[[:space:]]/, '')
删除所有Unicode空格。 有关详细信息,请查看文档