Tag: scrubyt

任何单击链接的scrubyt命令都会返回403 Forbidden Error

我正在尝试使用Scrubyt浏览网站,但每当我使用它来点击任何链接时,它都会给我403 Forbidden错误。 该网站不需要登录或任何东西,所以我不明白这一点。 可能需要某种会话变量或正确的UserAgent字符串。 知道如何解决这个问题吗?

如何与Scrubyt建立“下一页”链接

我正在尝试使用Scrubyt从这个页面获取详细信息http://www.nuffieldtheatre.co.uk/cn/events/event_listings.php?section=events 。 我已经设法从列表中获取标题和详细信息URL,但我无法使用next_page让刮刀转到下一页。 我认为这是因为我没有在下一页链接中使用正确的模式。 我尝试了字符串“下一页”,我也尝试了XPath。 还有其他想法吗? 代码如下: require ‘rubygems’ require ‘scrubyt’ nuffield_data = Scrubyt::Extractor.define do fetch ‘http://www.nuffieldtheatre.co.uk/cn/events/event_listings.php?section=events’ event do title ‘The Coast of Mayo’ #url “href”, :type => :attribute link_url end next_page “Next Page”, :limit => 2 end nuffield_data.to_xml.write($stdout,1)