Tag: lex

用于解析ERB文件的库

我试图解析,而不是评估,以Hpricot / Nokogiri类型方式导轨ERB文件。 我试图解析的文件包含混合了使用ERB生成的动态内容的HTML片段(标准的rails视图文件)我正在寻找一个不仅会解析周围内容的库,就像Hpricot或Nokogiri那样,但也会对待ERB符号,<%,<%=等,就好像它们是html / xml标签一样。 理想情况下,我会回到DOM结构,其中<%,<%= etc符号将作为自己的节点类型包含在内。 我知道可以使用正则表达式一起破解某些东西,但我正在寻找一些更可靠的东西,因为我正在开发一个工具,我需要在一个非常大的视图代码库上运行,其中包含html内容和erb内容是重要的。 例如,内容如: 等等等等等等 我的精彩文字 将返回一个树结构,如: 根 – text_node(等等等等) – 元素(div) – text_node(我的好文字) – erb_node(<%=)