Tag: 相似度

测量两个字符串之间相似性的有效方法是什么? (Levenshtein距离使得堆栈太深)

所以,我从这开始: http : //en.wikibooks.org/wiki/Algorithm_Implementation/Strings/Levenshtein_distance#Ruby 这适用于非常小的字符串。 但是,我的字符串长度超过10,000个字符 – 由于Levenshtein距离是递归的,这导致我的Ruby on Rails应用程序中的堆栈太深错误。 那么,是否有另一种可能较少的堆栈密集方法来查找两个大字符串之间的相似性? 或者,我需要一种方法来使堆栈具有更大的尺寸。 (我不认为这是解决问题的正确方法)

检测不同分辨率下的图像相等性

我正在尝试构建一个脚本来浏览我原来的高分辨率照片,并在我拥有专业帐户之前替换我上传到Flickr的旧的低分辨率照片。 对于他们中的许多人,我可以使用Exif信息,例如确定匹配日期。 但有些人真的很老了,要么原始文件没有Exif信息,要么被我当时使用的任何愚蠢的resize软件所破坏。 因此,无法依赖元数据,我不得不求助于内容本身。 问题是原件的分辨率不同于Flickr上的分辨率(这是这项努力的重点)。 那么有没有办法让我将它们与某种模糊的相似性度量进行比较,这样可以让我设置一个需要人类输入的阈值? 我想知道一个图像是另一个图像的resize版本可以产生比一般相似性更好的结果。 任何语言的解决方案都可以,但Ruby会是一个加分:)