如何规范公司名称
我们有用户生成的雇主名称,各种变化。 例如,人们输入或导入:
谷歌
谷歌公司
谷歌公司
谷歌公司
对数据库进行搜索,看起来就像一个不同的公司。 我们已经改变了一些东西,将每个雇主都映射到“标准化”的名称,但总共有70,000个,这很难手工完成。
有没有人有关于如何规范现有条目的建议,以及如何维护我们对所有传入的名称也这样做?
您可以做两件事来帮助:
-
当用户添加公司名称时,请为其提供一个自动填充框,以便在已存在的情况下获取建议。 或者建议在添加问题时像stackoverflow这样的现有的。
-
查询数据库时使用搜索工具,以便您可以汇总所有变体。 你可以在这里找到搜索gemhttps://www.ruby-toolbox.com/categories/rails_search
事实上我认为“正常化”它们不容易也不准确。