Tag: unicode

如何在Rails控制台中输入Unicode字符?

在使用Rails控制台时,当我输入ä ,会出现\U+FFC3\U+FFA4 。 当然我可以在rails之外输入Unicode字符。 我在Max OS X 10.7.5中使用Ruby 2.0.0p247,Rails 4.0.0。 如何在Rails控制台中输入Unicode字符?

为什么to_json在Rails 4中自动转义unicode?

Rails 3: {“a” => “”}.to_json => “{\”a\”:\”\”}” 导轨4: {“a” => “”}.to_json => “{\”a\”:\”\\u003Cbr/\\u003E\”}” 为什么??? 它似乎导致错误 Encoding::UndefinedConversionError: “\xC3” from ASCII-8BIT to UTF-8 当我的Rails 3应用程序尝试解析我的rails 4应用程序生成的JSON时。

‘𠂉’不是有效的unicode字符,但在unicode字符集中?

简短的故事:我不能通过使用Ruby on Rails应用程序中的文本字段(使用默认的UTF-8编码)或直接使用MySQL GUI输入,将像’𠂉’这样的实体存储在MySQL数据库中应用程序。 据我所知,所有中文字符和字根都可以毫无问题地输入数据库,但不是这些很少输入的“字符组件”。 上面提到的字符是unicode U + 20089和html实体𠂉 我可以通过输入𠂉并删除html转义来在页面上显示它,但我想将其存储为unicode字符并保持html转义到位。 还有许多其他中国“组件”(全部字符的一部分,通常由2或3个笔画组成)导致同样的问题。 根据这个页面,提到的字符在UTF-8字符集中: http : //www.fileformat.info/info/unicode/char/20089/charset_support.htm 但是在邻近的’… 20089 / index.htm’页面上,有一个警告说它不是一个有效的unicode字符。 作为参考,可以在Mac OS X中找到该实体,方法是搜索字符调色板(国际菜单,“显示角色调色板”),通过激进搜索,并查看“丿”激进。 抱歉,如果这太开放了……这样的角色可以存储在基于UTF-8的数据库中吗? 如何支持和不支持此字符,这两个字符都存在于字符集中且无效?

Rails上的UTF8 MySQL问题 – 使用utf8_general_ci编码问题

我有一个在MySQL 5.0.32-Debian上运行的升级Rails站点。 在这个特定的网站上,我的所有表都使用utf8 / utf8_general_ci编码。 在该数据库中,我有一些看起来像这样的数据: mysql> select * from currency_types limit 1,10; +——+—————–+———+ | code | name | symbol | +——+—————–+———+ | CAD | Canadian Dollar | $ | | CNY | Chinese Yuan | å…ƒ | | EUR | Euro | € | | GBP | Pound | £ | | INR | […]

使用Ruby(IRB)打印CP850编码的字符串

我想打开一个包含阿拉伯语文本的文本文件(test.txt)(其编码为CP850),然后将其内容打印到STDOUT: # coding : CP850 STDOUT.set_encoding(Encoding::CP850); # not sure if it’s necessary open(‘G:/test.txt’,?r){|f| f.read.each_char{|c| print c}; # or puts f.read; } gets 但它不打印阿拉伯字符,输出是一些符号和随机字符。 使用Ruby 2.2.3

Ruby regex / {3} / – “太短的转义多字节字符”错误

这个正则表达式适用于PHP: preg_match(‘/[\xF0-\xF7][\x80-\xBF]{3}/’, ‘𤋮’); 我需要将它移植到Ruby: /[\xF0-\xF7][\x80-\xBF]{3}/ =~ ‘𤋮’ 只打印too short escaped multibyte character: /[\xF0-\xF7][\x80-\xBF]{3}/错误。 这有什么不对? 我不明白这个错误在说什么。 试图用\\做更多的逃避,但没有。

Ruby:如何将潜在的unicode字符串分解为字节

我正在编写一个用户输入并在屏幕上呈现它的游戏。 我正在使用的引擎完全是unicode友好的,所以如果可能的话,我想保留它。 问题是渲染循环如下所示: “string”.each_byte do |c| render_this_letter(c) end 我对i18n了解不多,但我知道上面的代码只会对我和说我的语言的人有用。 我更喜欢这样的东西: “unicode string”.each_unicode_letter do |u| render_unicode_letter(u) end 这是否存在于核心分发中? 我有点厌恶为安装添加额外的要求,但如果这是唯一的方法,我会活着。 为了额外的乐趣,我无法知道字符串实际上是否是一个unicode字符串。 编辑:我正在使用的库确实可以渲染整个字符串,但是我让用户编辑动态出现的内容 – 如果它们点击’退格’,基本上,我需要知道要删除多少字节。

修复MySQL不正确的字符串编码

我正在从一个没有为Unicode设置的mysql数据库中读取字符串。 Ruby将字符串作为七大洋但我知道正确的版本应该是七大洋 。 “错误”字符串被编码为UTF-8,因为Ruby不知道它有错误。 我已经尝试在受损的字符串上强制执行每个编码,但没有任何作用。 我有一种感觉,我可以通过摆弄这些位来做到这一点,但我甚至不知道从哪里开始。 我认为没有任何信息丢失,因为错误的字符串实际上比正确的字符串有更多的字节。 我不认为Ruby是这里的罪魁祸首,因为当我在Ruby之外查看表时,字符串看起来也很糟糕 – 所以我希望能够消除MySQL已经造成的损害。

Hpricot – UTF-8问题

运行以下代码时出现以下错误: invalid byte sequence in UTF-8 (ArgumentError) 代码: require ‘hpricot’ require ‘open-uri’ doc = open(‘http://www.amazon.co.jp/’) {|f| Hpricot(f.read) } puts doc.to_html Hpricot无法解析日文内容。 有关解决此问题的任何建议吗?

Prawn:以PDF格式打印unicode字符串

我正在使用Prawn在Rails 3应用程序中生成PDF。 是否可以像在HTML视图中一样将Unicode字符串打印到PDF中? 例如, 在show.html.erb导致字形show.html.erb while pdf.text raw “unicode_for_ཀ” 在show.pdf.prawn中产生字符串”unicode_for_ཀ” 尝试在show.pdf.prawn : pdf.font “#{Prawn::BASEDIR}/data/fonts/TibMachUni-1.901b.ttf” do pdf.text raw “unicode_for_ཀ” end 和 pdf.font_families.update(“TibMachUni” => {:normal => “#{Prawn::BASEDIR}/data/fonts/TibMachUni-1.901b.ttf” }) pdf.font(“TibMachUni”) do pdf.text raw “unicode_for_ཀ” end 这并没有解决问题。