Tag: saxparser

使用SAX Parser获取多个子节点?

我有一个大型本地XML文件(24 GB),其结构如下: **** **** (several times within an id…) 我需要这样的结果: id1;url1 id1;url2 id1;url3 id2;url4 …. 我想将Nokigiri与SAX Parser或Reader一起使用,因为我无法将整个文件加载到内存中。 我正在使用Ruby Rake任务来执行代码。 我的SAX代码是: task :fetch_saxxml => :environment do require ‘nokogiri’ require ‘open-uri’ class MyDocument < Nokogiri::XML::SAX::Document attr_accessor :is_name def initialize @is_name = false end def start_element name, attributes = [] @is_name = name.eql?("id") end def characters string string.strip! […]