如何规范公司名称

我们有用户生成的雇主名称,各种变化。 例如,人们输入或导入:

谷歌
谷歌公司
谷歌公司
谷歌公司

对数据库进行搜索,看起来就像一个不同的公司。 我们已经改变了一些东西,将每个雇主都映射到“标准化”的名称,但总共有70,000个,这很难手工完成。

有没有人有关于如何规范现有条目的建议,以及如何维护我们对所有传入的名称也这样做?

您可以做两件事来帮助:

  • 当用户添加公司名称时,请为其提供一个自动填充框,以便在已存在的情况下获取建议。 或者建议在添加问题时像stackoverflow这样的现有的。

  • 查询数据库时使用搜索工具,以便您可以汇总所有变体。 你可以在这里找到搜索gemhttps://www.ruby-toolbox.com/categories/rails_search

事实上我认为“正常化”它们不容易也不准确。