使用ruby gsub和regexp更智能地替换字符

我正在尝试为某些文章标题创建类似行为的永久链接,我不想为永久链接添加新的数据库字段。 所以我决定写一个帮助器来转换我的文章标题:

O”focoasă“a pornit cruciada,împotrivabărbaţilorzgârciţi ”to“ o-focoasa-a-pornit-cruciada-impotriva-barbatilor-zgarciti ”。

虽然我想出了如何用连字符替换空格并删除其他特殊字符(除了 – )使用:

title.gsub(/\s/, "-").gsub(/[^\w-]/, '').downcase 

我想知道是否有任何其他方法可以从一个.gsub方法调用替换一个特定的其他字符的字符,所以我不必为所有的方法链接title.gsub(“ă”,“a”)方法我本地化的UTF-8特殊字符。

我正在考虑用所有特殊字符和它们的对应物构建一个哈希,但我还没有弄清楚如何使用regexp的变量。

我在寻找的是:

 title.gsub(/\s/, "-").gsub(*replace character goes here*).gsub(/[^\w-]/, '').downcase 

谢谢!

我使用Unidecoder gem在我的应用程序中解决了这个问题:

 require 'unidecode' def uninternationalize(str) Unidecoder.decode(str).gsub("[?]", "").gsub(/`/, "'").strip end 

如果只想从一个字符音译到另一个字符,可以使用与Unix tr命令完全相同的String#tr方法:将第一个列表中的每个字符替换为第二个列表中相同位置的字符:

 'Ünicöde'.tr('ÄäÖöÜüß', 'AaOoUus') # => "Unicode" 

但是,我同意@Daniel Vandersluis:使用一些更专业的库可能是个好主意。 像这样的东西可以变得非常乏味,非常快。 此外,很多这些角色实际上都有标准化的音译(ä→ae,ö→oe,…,ß→ss),用户可能期望音译正确(我当然不喜欢被称为Jorg) – 如果你真的必须,你可以叫我Joerg但我更喜欢Jörg)如果你有一个图书馆为你提供这些音译,为什么不使用它们呢? 请注意,有很多音译不是单个字符,因此无论如何都不能与String#tr一起使用。