Nokogiri Scraping错过了HTML

Nokogiri并没有抓住iframe标签下的任何东西。

doc.search("iframe")仅返回iframe标记。 doc.search("body.content-frame")返回空。 doc.errors也返回空。 Nokogiri为什么不在iframe下注册HTML？我该怎么抓住它？

     #document     #ETC.......

那是因为iframe的内容不是页面的一部分。实际上，它们位于完全不同的位置（请注意iframe的src属性）。您必须单独获取该内容，这是浏览器执行此操作的方式。

这是处理它的代码：

  page = Mechanize.new.get "http://page_u_need" page.iframe_with(id: 'beatles').content

Interesting Posts

是否可以使用Nokogiri :: XML :: Builder 从XML文档中省略处理指令

由于缺少原生扩展，Nokogiri安装错误

如何使用nokogiri和rubyzip编辑docx

如何使用Nokogiri在NodeSet中添加子节点

Nokogiri XML导入饲料组织？

数据抓取多个数组创建和排序

用Nokogiri解析简单的XML

使用Nokogiri解析大型HTML文件

升级到ruby 1.9.2并在nokogiri中获得Segmentation Fault错误

没有回车的Nokogiri to_xml