Tag: scrubyt

任何单击链接的scrubyt命令都会返回403 Forbidden Error: 我正在尝试使用Scrubyt浏览网站，但每当我使用它来点击任何链接时，它都会给我403 Forbidden错误。该网站不需要登录或任何东西，所以我不明白这一点。可能需要某种会话变量或正确的UserAgent字符串。知道如何解决这个问题吗？

如何与Scrubyt建立“下一页”链接: 我正在尝试使用Scrubyt从这个页面获取详细信息http://www.nuffieldtheatre.co.uk/cn/events/event_listings.php?section=events 。我已经设法从列表中获取标题和详细信息URL，但我无法使用next_page让刮刀转到下一页。我认为这是因为我没有在下一页链接中使用正确的模式。我尝试了字符串“下一页”，我也尝试了XPath。还有其他想法吗？代码如下： require ‘rubygems’ require ‘scrubyt’ nuffield_data = Scrubyt::Extractor.define do fetch ‘http://www.nuffieldtheatre.co.uk/cn/events/event_listings.php?section=events’ event do title ‘The Coast of Mayo’ #url “href”, :type => :attribute link_url end next_page “Next Page”, :limit => 2 end nuffield_data.to_xml.write($stdout,1)

Interesting Posts

无法使套接字接受非阻塞ruby 2.2

Rails中的漂亮（过时）RESTful URL

Class＃allocate及其用途

在iframe – rails中的浏览器中显示附加的pdf

Rails需要RubyGems> = 1.3.2。请安装RubyGems并重试（我有rubygems 1.3.6！）

对于form_tag而不是form_for，date_select的等价物是什么？

rails方式编写复杂的查询

思考Sphinx并搜索多个模型

如何编写正则表达式从字符串中提取数值？

select2-rails gem不能在Rails4上运行

如何使用rspec为具有自定义属性的序列化程序编写unit testing

Ruby“定义？”运算符错误？

“猴子补丁”真的那么糟糕吗？

显示特定用户的post？

Rails，解决这个n + 1的技巧？