使用Unicode格式化阿拉伯语和日语文本?
有没有人有任何代码用于按字母顺序排列Unicode中的阿拉伯语和日语文本? 如果代码在ruby中会很棒。
我不知道Ruby,但是python有一个函数ord(),它将unicode特殊字符转换为它的unicode代码点。 例如,
>>> a = u'ل' >>> ord(a) 0: 1604 >>> b = u'ع' >>> ord(b) 1: 1593
在Ruby中寻找类似的东西。 我假设阿拉伯符号按字母顺序列在unicode中。
要问一个明显的问题,你对mylist.sort
不喜欢什么?
根据您的需要,ruby中的words.sort
对日本人来说没问题。 字符在Unicode中出现的顺序是一个相当好的排序顺序。 虽然不能担保阿拉伯语,但我的猜测是它也没问题。
mylist.sort
应该在Ruby 1.9中开箱即用(它具有内置的unicode支持)。 在Ruby 1.8中,没有内置Unicode支持,我认为你必须使用character-encodings
gem扩展String类与UTF-8字符串比较。 (然后mylist.sort
会起作用。)
- Rails 3.2 Postgres保存错误“ActiveRecord :: StatementInvalid:PG ::错误:错误:位置5’T’附近的语法错误”
- 带负数的Ruby modulo 3不直观
- 如何将变量打印到变量而不是STDOUT?
- 如何在Heroku上找到内存泄漏?
- 如果声明里面有Sinatra模板
- ActionController :: RoutingError(UserAccountsController的未定义方法`load_and_authorize_resource’:Class):
- 理解`sort!`块
- 在Rails中的会话中存储对象
- 如何使方法适用于ActiveRecord对象的集合