Tag: 模糊比较

如何规范公司名称

我们有用户生成的雇主名称,各种变化。 例如,人们输入或导入: 谷歌 谷歌公司 谷歌公司 谷歌公司 对数据库进行搜索,看起来就像一个不同的公司。 我们已经改变了一些东西,将每个雇主都映射到“标准化”的名称,但总共有70,000个,这很难手工完成。 有没有人有关于如何规范现有条目的建议,以及如何维护我们对所有传入的名称也这样做?