Tag: utf 8

使用Ruby将UTF8转换为ANSI: 我有一个Ruby脚本，可以在Linux机器上远程生成UTF8 CSV文件，然后通过SFTP将文件传输到Windows机器。然后我需要用Excel打开这个文件，但Excel没有得到UTF8，所以我总是需要在文本编辑器中打开文件，该编辑器能够将UTF8转换为ANSI。我希望使用Ruby以编程方式执行此操作并避免手动转换步骤。最简单的方法是什么？ PS：我尝试过使用iconv但没有成功。

如何在Ruby中删除4个字节的utf-8字符？: 由于MySQL的utf8不支持4字节字符，我正在寻找一种方法来检测并消除Ruby中字符串中的任何4字节utf8字符。我知道我可以更新我的表使用utf8m4，但有几个原因是不可能的或所需的解决方案。简单地将字符串编码为ASCII将删除这些字符，但也会删除所有其他非ASCII字符，这是不好的。

Rails 3 – 如何处理PG错误不完整的多字节字符: 在Rails 3.2应用程序（Ruby 1.9.2）中，我收到以下错误在mobile_users＃update中发生PGError：不完整的多字节字符这些是Postgres错误我在开发和测试模式下测试时遇到类似的SQLIte错误导致此错误的参数是（故意省略auth令牌） * Parameters: {“mobile_user”=>{“quiz_id”=>”1”, “auth”=>”xxx”, “name”=>”Joaqu\xEDn”}, “action”=>”update”, “controller”=>”mobile_users”, “id”=>”1”, “format”=>”mobile”} 这是作为JSON HTTP Put请求进行的，处理此问题的更新操作如下所示 # PUT /mobile_users/1 # PUT /mobile_users/1.xml def update @mobile_user = current_mobile_user @mobile_user.attributes = params[:mobile_user] respond_to do |format| if @mobile_user.save format.html { redirect_to(@mobile_user, :notice => ‘Mobile user was successfully updated.’) } format.json { head :ok } format.mobile […]

如何使用Ruby处理UTF-8电子邮件标题（如Subject :)？: 我是一封电子邮件n00b，但我正在开发一个发送带有Unicode字符的HTML电子邮件的应用程序（正如我的朋友所说“享受编码地狱”）。 Subject:标题来自用户输入，因此可能包含Unicode字符。一些邮件客户端（如GMail和Outlook 2007）可以正常使用，但从我的阅读中看来，正确的方法是对标头使用MIME编码字编码。我找不到一个Ruby库来做这件事。有吗？此外，是否有一个标题要添加，告诉邮件客户端在显示邮件时使用UTF-8？我们发送多部分电子邮件，因此我们的Content-Type是multipart/mixed 。 Apple Mail.app特别没有使用正确的编码，即使它在各个部分中指定为UTF-8。

如何将UTF8组合字符转换为ruby中的单个UTF8字符？: 某些字符，如Unicode字符’LATIN SMALL LETTER C WITH CARON’可以编码为0xC4 0x8D ，但也可以用’LATIN SMALL LETTER C’和’COMBINING CARON’的两个代码点表示，即0x63 0xcc 0x8c 。更多信息： http ： //www.fileformat.info/info/unicode/char/10d/index.htm 我想知道是否有一个库可以将“拉丁文小写字母C”+“组合卡伦”转换为“拉丁文小写字母C卡通”。或者是否有包含这些转换的表格？

如何在ruby中使用正则表达式的utf8: 在RoR中，如何使用utf8代码validation中文或日语单词的发布表单。在GBK代码中，它使用[\ u4e00- \ u9fa5] +来validation中文单词。在Php中，它使用/ ^ [\ x {4e00} – \ x {9}} + $ / u来表示utf-8页面。

无法在Ruby 1.9.3 IRB中输入变音符号: 我在使用Mac OS 10.7.3的Ruby 1.9.3的IRB中遇到了非常奇怪的行为当我尝试进入变音符号时，它在提示符中被转义并且看起来像这样（我在键盘上输入”ü” ） irb(main):001:0> “\U+FFC3\U+FFBC” 这有点奇怪： irb(main):001:0> “\U+FFC3\U+FFBC”.length => 0 当然，角色也不会显示： irb(main):001:0> “\U+FFC3\U+FFBC” => “” 有谁知道这里发生了什么或如何解决这个问题？

续集永远不会返回utf-8，只是ascii-8bit: 我正在尝试连接到这个mysql数据库。 DataMapper以UTF-8很好地获取所有内容，但Sequel总是返回ASCII-8bit中的字符串，这会产生.to_json的错误。为了让它发挥作用，我尝试了几件事。 Encoding.default_external = Encoding::UTF_8 Encoding.default_internal = Encoding::UTF_8 DB.run ‘set names utf8’ Sequel.mysql ‘db’, (…), :encoding => ‘utf-8’ 我有gem：mysql（2.9.0）（试过没有），mysql2（0.3.11）和续集（3.42.0）唯一有效的方法是手动强制编码每个字符串，这个字符串比理想情况要差很多。

Ruby to_json问题错误“非法/格式错误的utf-8”: 我收到错误JSON::GeneratorError: source sequence is illegal/malformed utf-8当尝试将哈希转换为json字符串时， JSON::GeneratorError: source sequence is illegal/malformed utf-8 。我想知道这是否与编码有关，我怎么能让to_json只是对待\ xAE？ $ irb 2.0.0-p247 :001 > require ‘json’ => true 2.0.0-p247 :002 > a = {“description”=> “iPhone\xAE”} => {“description”=>”iPhone\xAE”} 2.0.0-p247 :003 > a.to_json JSON::GeneratorError: source sequence is illegal/malformed utf-8 from (irb):3:in `to_json’ from (irb):3 from /Users/cchen21/.rvm/rubies/ruby-2.0.0-p247/bin/irb:16:in `’