Tag: unicode

使用ruby将unicode转换为字符

我在unicode中找到了一个汉字字典。 我正在尝试从这个字典中构建一个Character数据库,但我不知道如何将unicode转换为一个字符.. p “国”.unpack(“U*”).first #this gives the unicode 22269 如何将22269转换回与上面一行相反的字符值。

带有RVM的Ruby 1.9.3 IRB中的Unicode字符

更新 :我发现几乎完全相似的问题 ,但它有一些不同的先决条件,因此无济于事。 鉴于: MacOS Lion 10.7.3 rvm 1.14.2 ruby 1.9.3p194 (2012-04-20修订版35410)[x86_64-darwin11.3.0] 使用以下行安装Ruby: rvm install 1.9.3 –with-readline-dir=/usr/local/Cellar/readline/6.2.2/ 当我启动irb或rails c并开始输入unicode字符时,我得到: \U+FFD0\U+FFBF\U+FFD1\U+FFD0\U+FFB8\U+FFD0\U+FFBC\U+FFD0\U+FFB5\U+FFD1 在Ruby / Rails控制台上键入时,如何正确显示unicode字符? PS在终端的bash会话中键入相同的字符会导致正确的输出。 PPS只是要清楚 – 在控制台中我输入俄语字符:它们被认为是unicode符号吗?

如何使用ruby 1.9匹配unicode单词?

我正在使用ruby 1.9并试图找出我需要使用哪个正则表达式: Encoding.default_internal = Encoding.default_external = ‘utf-8’ “föö”.match(/(\w+)/u)[1] == “föö” # => false

Ruby将IDN域从Punycode转换为Unicode

我正在编写一个Rails应用程序,需要将来自Punycode的IDN域名转换为其Unicode等价物。 我尝试安装绑定到GNU LibIDN的idn gem ,但它不会编译本机代码。 显然其他人与Ruby 1.9.x有同样的问题。 我也尝试过纯Ruby SimpleIDN gem ,但我更喜欢原生的东西。

如何将UCS2字符串转换为UTF8?

如何将UCS2中的字符串(每个字符2个字节)转换为Ruby中的UTF8字符串?

如何指定一个适用于英语以外的欧洲语言的正则表达式字符范围?

我正在使用Ruby的正则表达式引擎。 我需要编写一个执行此操作的正则表达式 WIKI_WORD = /\b([az][\w_]+\.)?[AZ][az]+[AZ]\w*\b/ 除了英语之外,还可以使用其他欧洲语言。 我不认为字符范围[az]会覆盖德语等小写字母。

如何使用Ruby处理UTF-8电子邮件标题(如Subject :)?

我是一封电子邮件n00b,但我正在开发一个发送带有Unicode字符的HTML电子邮件的应用程序(正如我的朋友所说“享受编码地狱”)。 Subject:标题来自用户输入,因此可能包含Unicode字符。 一些邮件客户端(如GMail和Outlook 2007)可以正常使用,但从我的阅读中看来,正确的方法是对标头使用MIME编码字编码 。 我找不到一个Ruby库来做这件事。 有吗? 此外,是否有一个标题要添加,告诉邮件客户端在显示邮件时使用UTF-8? 我们发送多部分电子邮件,因此我们的Content-Type是multipart/mixed 。 Apple Mail.app特别没有使用正确的编码,即使它在各个部分中指定为UTF-8。

Ruby脚本中的Unicode字符?

我想写一个Ruby脚本,它将日文字符写入控制台。 例如: puts “こんにちは・今日は” 但是,运行它时会出现exception: jap.rb:1: Invalid char `\377′ in expression jap.rb:1: Invalid char `\376′ in expression 有可能吗? 我正在使用Ruby 1.8.6。

如何打印unicode字符U-1F4A9’堆poo’表情符号

我试图在Ruby中打印一个unicode字符,特别是一堆便便。 它的unicode值为U-1F4A9。 但是当我尝试将“\ u1F4A9”打印到输出或文件时,我什么也看不见。 我是否需要打印到特定类型的文件才能看到一堆便便? 如果是这样,什么类型的文件? 有没有办法将其打印到公共输出? (我正在使用Rubymine)

Ruby 1.9尚不支持Unicode规范化

我正在尝试将一些旧的rails应用程序移植到Ruby 1.9,并且我一直在收到有关“Ruby 1.9如何不支持Unicode规范化”的警告。 我已将其跟踪到此function,但每个请求我收到大约20条警告消息: 导轨-2.3.5 /的ActiveSupport / lib中/ active_support / inflector.rb def transliterate(string) warn “Ruby 1.9 doesn’t support Unicode normalization yet” string.dup end 任何想法我应该如何开始跟踪这些并解决它?