Tag: pdftk

如何将pdftk添加到Heroku Cedar应用程序?

我需要在我的Heroku Cedar Rails应用程序中将多个PDF文件合并为一个,并且已经决定使用pdftk来执行此操作。 我迷失了如何做到这一点。 我认为最好的方法是创建一个自定义buildpack,其中包含pdftk的已编译二进制文件,但我无法弄清楚如何让Vulcan执行此操作。 没有Vulcan,有没有办法做到这一点? 是否有预先存在的ruby buildpack包含我可以使用的pdftk?

Ruby / Rails:遍历文件夹并解析元数据到种子DB

我有一堆文档,我想在Rails应用程序中编制索引。 我想使用各种rake任务来梳理目录层次结构,寻找文件并从这些文件中捕获元数据以在Rails中编制索引。 我不确定如何在Ruby中执行此操作。 我找到了一个名为pdftk的实用程序,它可以从PDF文件中提取元数据(我索引的大部分内容都是PDF),但我不确定如何捕获该数据的各个部分? 例如,要获取下面的ModDate或每个BookmarkTitle和BookmarkPageNumber 。 具体来说,我想遍历文件层次结构,为我找到的每个.pdf执行pdftk $filename dump_data命令,然后将该输出的重要部分捕获到rails模型中。 pdftk的输出: $ pdftk BoringDocument883c2.pdf dump_data InfoKey: Creator InfoValue: Adobe Acrobat 9.3.4 InfoKey: Producer InfoValue: Adobe Acrobat 9.34 Paper Capture Plug-in InfoKey: ModDate InfoValue: D:20110312194536-04’00’ InfoKey: CreationDate InfoValue: D:20110214174733-05’00’ PdfID0: 2f28dcb8474c6849ae8628bc4157df43 PdfID1: 3e13c82c73a9f44bad90eeed137e7a1a NumberOfPages: 126 BookmarkTitle: Alternative Maintenance Techniques BookmarkLevel: 1 BookmarkPageNumber: 3 BookmarkTitle: CONTENTS BookmarkLevel: 1 […]

为Heroku静态编译pdftk。 需要将PDF拆分为单页文件

所以我们使用heroku来托管我们的rails应用程序。 我们搬到了雪松堆里。 此堆栈没有安装pdftk库。 我联系了支持,并被告知静态编译它为amd64 ubuntu并将其包含在我的应用程序中。 事实certificate这比我想象的要困难得多。 最初我下载了ubuntu的包( http://packages.ubuntu.com/natty/pdftk ),将其解压缩,并包含二进制文件和共享库。 我遇到了类似的奇怪错误: Unhandled Java Exception: java.lang.NullPointerException at com.lowagie.text.pdf.PdfCopy.copyIndirect(pdftk) at com.lowagie.text.pdf.PdfCopy.copyObject(pdftk) at com.lowagie.text.pdf.PdfCopy.copyDictionary(pdftk) 我假设这是因为没有安装某些依赖项? 所以这是我的问题: 是否有更简单的静态编译库的方法? 或者我是否需要移动其二进制文件及其所有库和依赖项? 我只是想将多页PDF分成ruby中的单页文件。 有没有办法在没有PDFTK的情况下做到这一点? 还是我坚持尝试静态编译PDFTK? 感谢您的帮助,我知道这不是一个简单的问题,但非常感谢您对这个问题的帮助。 我浪费了近6个小时试图让这个该死的东西上class。

如何在ruby中组合PDF?

这是在2008年被问到的 。 希望现在有更好的答案。 如何在ruby中组合PDF? 我正在使用pdf-stamper gem填写PDF格式的表格。 我想拍摄n个 PDF,在每个PDF中填写一个表单,并将结果保存为n页文档。 你能用像prawn这样的本地库来做到这一点吗? 你能用rjb和iText做到这一点吗? pdf-stamper是iText的包装器。 如果可能的话,我想避免使用两个库(即pdftk和iText)。