使用Unicode格式化阿拉伯语和日语文本?

有没有人有任何代码用于按字母顺序排列Unicode中的阿拉伯语和日语文本? 如果代码在ruby中会很棒。

Unicode代码点未按字母顺序列出(例如,Z

我不知道Ruby,但是python有一个函数ord(),它将unicode特殊字符转换为它的unicode代码点。 例如,

>>> a = u'ل' >>> ord(a) 0: 1604 >>> b = u'ع' >>> ord(b) 1: 1593 

在Ruby中寻找类似的东西。 我假设阿拉伯符号按字母顺序列在unicode中。

要问一个明显的问题,你对mylist.sort不喜欢什么?

根据您的需要,ruby中的words.sort对日本人来说没问题。 字符在Unicode中出现的顺序是一个相当好的排序顺序。 虽然不能担保阿拉伯语,但我的猜测是它也没问题。

mylist.sort应该在Ruby 1.9中开箱即用(它具有内置的unicode支持)。 在Ruby 1.8中,没有内置Unicode支持,我认为你必须使用character-encodings gem扩展String类与UTF-8字符串比较。 (然后mylist.sort会起作用。)