Tag: 网页

如何从网页下载动态生成的内容?

我正在尝试从动态生成的网页下载一些数据,因此使用wget不起作用。 页面是http://gaceta.diputados.gob.mx/SIL/Legislaturas/Listados.html我想下载显示的每个选项列表,可以在“Legislatura”字段中选择一旦下载我可以处理ruby中的数据。 只是想知道下载这个的最佳方式是什么,如果可以选择每个选项并下载。

比较文本文件的两个版本,并找到Ruby的添加/删除?

我正在使用Ruby跟踪网页中的更改。 删除所有html标签和空白行后,我得到一系列行,需要检查添加/删除,假设可能有重复。 如果已经完成,你能推荐一个好的gem吗? 我可以使arrays线独特,然后避免问题。 但是如果我需要跟踪重复的线条以及它们在文本中的位置呢?