Tag: tesseract

mac os x上的Tesseract-ocr gem问题

我已经安装了tesseract-ocr(0.1.5)gem。 还安装了依赖项(tesseract / 3.04.00和leptonica / 1.72) Mac OS X Yosemity。 当我执行rake db:migrate出现错误: rake aborted! CompilationError: compile error: see logs at /var/folders/xg/g9n7qvns5z1gsr_yjh09n1nm0000gn/T/.ffi-inline-501/d2f8bb8a1867b800ff8ad69a3b850c91521b3760.log /Users/user/.rvm/gems/ruby-2.2.2@project/gems/ffi-inline-0.0.4.3/lib/ffi/inline/compilers/gcc.rb:35:in `compile’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/ffi-inline-0.0.4.3/lib/ffi/inline/builders/c.rb:114:in `shared_object’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/ffi-inline-0.0.4.3/lib/ffi/inline/builders.rb:90:in `block in build’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/ffi-inline-0.0.4.3/lib/ffi/inline/builders.rb:87:in `instance_eval’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/ffi-inline-0.0.4.3/lib/ffi/inline/builders.rb:87:in `build’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/ffi-inline-0.0.4.3/lib/ffi/inline/inline.rb:54:in `singleton_inline’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/ffi-inline-0.0.4.3/lib/ffi/inline/inline.rb:39:in `inline’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/tesseract-ocr-0.1.5/lib/tesseract/c/baseapi.rb:30:in `’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/tesseract-ocr-0.1.5/lib/tesseract/c/baseapi.rb:27:in `’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/tesseract-ocr-0.1.5/lib/tesseract/c/baseapi.rb:25:in `’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/tesseract-ocr-0.1.5/lib/tesseract/c/baseapi.rb:25:in `’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/activesupport-4.2.3/lib/active_support/dependencies.rb:274:in `require’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/activesupport-4.2.3/lib/active_support/dependencies.rb:274:in `block in require’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/activesupport-4.2.3/lib/active_support/dependencies.rb:240:in `load_dependency’ /Users/user/.rvm/gems/ruby-2.2.2@project/gems/activesupport-4.2.3/lib/active_support/dependencies.rb:274:in `require’ […]

在rails中的gem中设置tesseract OCR时出错

我正在尝试在我的rails环境中设置tesseract-ocr gem。 我已经运行了brew install tesseract ,然后在应用程序上运行了一个bundle install,并且所有运行都没有错误,但是当启动应用程序( rails s )时,抛出以下错误: /Users/xxxx/.rvm/gems/ruby-1.9.2-p290@xxxx/gems/ffi-inline-0.0.4.3/lib/ffi/inline/compilers/gcc.rb:35:in `compile’: compile error: see logs at /var/folders/66/pm_j0lp94gvcj0qnlcnsx9pw0000gn/T/.ffi-inline-501/4239dac38f2a721e0dc5b3750d71ce2e6fa4acb6.log (CompilationError) 它引用了以下日志文​​件: g++ -dynamic -bundle -fPIC -L/usr/local/Cellar/tesseract/3.02.02/lib -I/usr/local/Cellar/tesseract/3.02.02/include -o /var/folders/66/pm_j0lp94gvcj0qnlcnsx9pw0000gn/T/.ffi-inline-501/4239dac38f2a721e0dc5b3750d71ce2e6fa4acb6.dylib /var/folders/66/pm_j0lp94gvcj0qnlcnsx9pw0000gn/T/.ffi-inline-501/4239dac38f2a721e0dc5b3750d71ce2e6fa4acb6.cpp -llept 2>>/var/folders/66/pm_j0lp94gvcj0qnlcnsx9pw0000gn/T/.ffi-inline-501/4239dac38f2a721e0dc5b3750d71ce2e6fa4acb6.log /var/folders/66/pm_j0lp94gvcj0qnlcnsx9pw0000gn/T/.ffi-inline-501/4239dac38f2a721e0dc5b3750d71ce2e6fa4acb6.cpp:1:10: fatal error: ‘leptonica/allheaders.h’ file not found #include 我遵循了以下两个问题: https : //github.com/meh/ruby-tesseract-ocr/issues/3和https://github.com/meh/ruby-tesseract-ocr/issues/21 它谈到了我已经完成的设置ENV变量。 我在initalizers文件夹中创建了一个test.rb文件,其中包含以下变量: ENV[‘CFLAGS’] = ‘-I/usr/local/Cellar/tesseract/3.02.02/include’ ENV[‘LDFLAGS’] = ‘-L/usr/local/Cellar/tesseract/3.02.02/lib’ 但是,这对启动应用程序时的错误没有任何影响。 当它说更新标题时我不明白它意味着什么。 我想知道是否有人能告诉我到底要做些什么才能让这个工作。 谢谢。

使用ImageMagick删除收据图像边框

在使用tesseract-OCR引擎提取文本之前,我正在使用ImageMagick服务预处理收据图像。 我需要删除收据的背景。 我已经通过掩蔽来移除这里的边界。 但是我无法为收据创建掩码。 但是,我试图从收据图像中删除阴影。 初始图像(示例收据) convert input.png -colorspace gray \ \( +clone -blur 0x2 \) +swap -compose divide -composite \ -linear-stretch 5%x0% photocopy.png 应用代码后: 我已经尝试了下面的代码来制作除了白色到黑色的所有颜色,但这似乎并没有完全遮蔽photocopy.png的背景。 convert receipt.jpg -fill black -fuzz 20% +opaque “#ffffff” black_border.jpg 有没有办法删除收据图像的边框? 或者从图像中创建任何类型的蒙版? 注意:我需要删除具有不同背景的多个图像的噪点和边框。