Hpricot – UTF-8问题

运行以下代码时出现以下错误:

invalid byte sequence in UTF-8 (ArgumentError) 

代码:

 require 'hpricot' require 'open-uri' doc = open('http://www.amazon.co.jp/') {|f| Hpricot(f.read) } puts doc.to_html 

Hpricot无法解析日文内容。 有关解决此问题的任何建议吗?

该网站似乎没有使用UTF-8:

试试这个:

 open('http://www.amazon.co.jp/') {|f| Hpricot(f.read.encode("UTF-8")) }