Tag: pdf parsing

寻找有关如何将PDF转换为结构化格式的建议: 我想对即将到来的拍卖中列出的一些房产做一些分析。不幸的是，运营拍卖的城市并没有以结构化格式发布信息，而是提供了700多页的拍卖物业PDF 。我想知道社区是否有任何关于如何解析所述PDF到结构化格式以插入数据库或创建属性的电子表格的想法。这是每个页面代表的图像：这是一个列出一些属性的页面：我对python和ruby很满意所以我没有任何问题编写解决方案，但因为“列”和那些列中的数据没有必要绑在一起，看起来这可能是一个可疑的命题。任何想法将不胜感激。

Interesting Posts

关于ruby系列？

如何删除mysql数据库中的重复记录？

下一个可用的记录ID

如何删除Ruby on Rails 4 beta？

无法在rails控制器上的ruby中设置/使用会话变量

重定向中的Flash消息无法正常工作

Rails – 按复杂排序排序索引

Tokenize（lex？parse？）正则表达式

Rails 3：如何进行Ajax调用？

如何在ruby计算器上添加循环

NoMethodError：未定义的方法`call’

如何简化或清理这个anagram方法？

嵌入式字体渲染然后消失

Ruby on Rails图形化gem？

如何在Ruby on Rails中获取ActiveRecord执行的最后一个SQL查询？