Tag: pdf reader

PDF不包含带有pdf-reader的EOF标记(PDF :: Reader :: MalformedPDFError)

我正在使用’pdf-reader’gem来阅读pdf文档的原始内容,以便我可以将它们发布(http-post)到API。 要确认API实现可以从原始内容创建有效的pdf文档,我写了一个小小的要点来validation我的代码以阅读pdf内容。 出于某种原因,我总是得到’PDF不包含EOF标记(PDF :: Reader :: MalformedPDFError)’。 谁能指出我哪里出错了?

在Ruby中检查PDF是否已损坏(或者只是缺少EOF)的最快方法?

我正在寻找一种方法来检查PDF是否缺少文件结束字符。 到目前为止,我发现我可以使用pdf-reader gem并捕获MalformedPDFErrorexception,当然我只需打开整个文件并检查最后一个字符是否为EOF。 我需要处理许多可能很大的PDF,我想尽可能少地加载内存。 注意:我想要检测的所有文件都缺少EOF标记,所以我觉得这是一个更具体的场景,然后检测一般的PDF“损坏”。 什么是最好,最快的方法呢?