Tag: pdf

使用不同文件类型上载Carrierwave文件

我有以下作为我的FileUploader: class FileUploader < CarrierWave::Uploader::Base include CarrierWave::MiniMagick version :thumb, if: :image? do # For images, do stuff here end version :preview, if: :pdf? do # For pdf, do stuff here end protected def image?(new_file) new_file.content_type.start_with? 'image' end def pdf?(new_file) new_file.content_type.start_with? 'application' end end 我从carrierwave github页面得到了这个。 它主要起作用,但如果我不想要不同的版本呢? 我基本上只是想做某些过程,如果它是pdf,或某些过程,如果它是一个图像。 我可能会在将来允许其他类型的文件,所以如果我有一个简单的方法也可以这样做很酷。 举个例子,我可能想要使用imgoptim(如果它是图像),然后使用pdf优化库(如果它是pdf等)。 我试过了: if file.content_type = “application/pdf” # […]

是否可以使用Ruby将一系列PDF合并为一个?

我有一系列像这样顺序命名的PDF: 01_foo.pdf 02_bar.pdf 03_baz.pdf 等等 使用Ruby,是否可以将这些组合成一个大的PDF,同时保持它们的顺序? 我不介意安装任何必要的gem来完成这项工作。 如果在Ruby中不可能这样,那么另一种语言呢? 如果可能,没有商业组件。 更新: Jason Navarrete的建议带来了完美的解决方案: 将PDF文件与pdftk一起放在一个目录中(或确保pdftk在你的PATH中),然后运行以下脚本: pdfs = Dir[“[0-9][0-9]_*”].sort.join(” “) `pdftk #{pdfs} output combined.pdf` 或者我甚至可以从命令行中将其作为一行代码: ruby -e ‘`pdftk #{Dir[“[0-9][0-9]_*”].sort.join(” “)} output combined.pdf`’ 伟大的建议杰森,完美的解决方案,谢谢。 给他一个投票的人 。

寻找有关如何将PDF转换为结构化格式的建议

我想对即将到来的拍卖中列出的一些房产做一些分析。 不幸的是,运营拍卖的城市并没有以结构化格式发布信息,而是提供了700多页的拍卖物业PDF 。 我想知道社区是否有任何关于如何解析所述PDF到结构化格式以插入数据库或创建属性的电子表格的想法。 这是每个页面代表的图像: 这是一个列出一些属性的页面: 我对python和ruby很满意所以我没有任何问题编写解决方案,但因为“列”和那些列中的数据没有必要绑在一起,看起来这可能是一个可疑的命题。 任何想法将不胜感激。

Ruby中现有PDF中的水印

我想添加一个动态生成的文本。 有没有办法在Ruby中为现有PDF添加水印?

使用RMagick和Ruby将.pdf转换为图像

我想拍一张pdf并将其转换成图像……每个pdf页面都成为一个单独的图像。 这里有类似的post: 将.doc或.pdf转换为图像并在Ruby中显示缩略图? 但它没有涵盖如何为每个页面制作单独的图像。

Prawn gem:如何从* existing *文件(.xls)创建.pdf

任何人都可以告诉我(可能复制/粘贴一个简单的代码示例)如何使用Prawn gem从现有 (.xls)文件创建.pdf文件? (基本上,我需要“打开”现有文件的命令。) (我问,因为Prawn文档( http://prawn.majesticseacreature.com/docs/ )似乎已经消失了很长一段时间 – 它甚至无法通过Google缓存使用……) 非常感谢您对此的任何帮助! 汤姆

在Ruby中检查PDF是否已损坏(或者只是缺少EOF)的最快方法?

我正在寻找一种方法来检查PDF是否缺少文件结束字符。 到目前为止,我发现我可以使用pdf-reader gem并捕获MalformedPDFErrorexception,当然我只需打开整个文件并检查最后一个字符是否为EOF。 我需要处理许多可能很大的PDF,我想尽可能少地加载内存。 注意:我想要检测的所有文件都缺少EOF标记,所以我觉得这是一个更具体的场景,然后检测一般的PDF“损坏”。 什么是最好,最快的方法呢?

prawn PDF:我需要生成嵌套表

我需要一个表,其中行实际上是2行表,一个嵌套表是..我怎么能在虾中这样做? 也许我需要一个扩展..但是哪一个?

如何在Rails 4中将PDF转换为Excel或CSV

我搜索了很多。 除非在这里问这个,否则别无选择。 你们知道一个在线转换器,它有API或Gem / s,可以将PDF转换为Excel或CSV文件吗? 我不确定这里是否是最好的地方。 我的应用程序在Rails 4.2中。 PDF文件包含一个标题和一个大约10列的大表。 更多信息:用户通过表单上传PDF然后我需要抓取PDF解析为CSV并阅读内容。 我试着用PDF Reader Gem阅读内容,但结果并不乐观。 我用过: freepdfconvert.com/pdf-excel遗憾的是不提供API。 (我联系了他们) 样本PDF 这段代码将PDF转换为方便的文本。 gem: pdf-reader def self.parse reader = PDF::Reader.new(“pdf_uploaded_by_user.pdf”) reader.pages.each do |page| puts page.text end end 现在,如果您检查附加的PDF示例,您将看到一些字段可能为空,这意味着我无法将文本行与空格分开并将其放入数组中,因为我无法将数组映射到正确的领域。 谢谢。

我可以将哪些服务器端PDF呈现组件与.NET,PHP,Ruby等一起使用?

我需要一个服务器端PDF组件,它允许呈现和流式传输PDF文档,而不依赖于客户端上的附加组件和插件。 该组件需要具有与Adobe Reader类似的function作为打印,旋转,加密等的示例。是否有任何可以廉价使用的解决方案?