Tag: 阿拉伯语

Ruby提取PDF格式的阿拉伯语文本: 我通常使用此代码从PDF中提取文本： require ‘rubygems’ require ‘pdf/reader’ filename = File.expand_path(File.dirname(__FILE__)) + “/myfile.pdf” PDF::Reader.open(filename) do |reader| reader.pages.each do |page| puts page.text end end 这次我想解析阿拉伯语PDF，但是，使用这段代码，我得到了一堆奇怪的字符。例如： ±πNuô ≠ö ¥πbËÊ ´Lö Ë«_°u«» ±GKIW √±U±Nr ËîUÅW √Ê ´bœ Ë≠w «∞LπLuŸ, ¥L 我已经读过那个coding: utf-8对于阿拉伯语很好，所以，有什么解决方案吗？

Interesting Posts

ruby：质量初始化实例变量

Proc.arity与Lambda.arity

在Ruby / Sinatra中解码Facebook签名的请求

将长固定数转换为数组Ruby

如何定义用户角色

在期望Rspec方法中何时使用花括号与括号？

Carrierwave为处理过的图像添加水印

使用XPath查找节点中的最后一行

Rails：simple_form中集合所需的属性

什么时候Mongoid实际上是对MongoDb进行查询

什么时候可以为Comet提供框架？

我应该如何使用RSpec全局存根方法？

使用RSpec测试密码长度validation

声明实例变量迭代哈希！

‘identify’命令无法识别Paperclip :: NotIdentifiedByImageMagickError图像