Tag: utf 8

使用Ruby将UTF8转换为ANSI

我有一个Ruby脚本,可以在Linux机器上远程生成UTF8 CSV文件,然后通过SFTP将文件传输到Windows机器。 然后我需要用Excel打开这个文件,但Excel没有得到UTF8,所以我总是需要在文本编辑器中打开文件,该编辑器能够将UTF8转换为ANSI。 我希望使用Ruby以编程方式执行此操作并避免手动转换步骤。 最简单的方法是什么? PS:我尝试过使用iconv但没有成功。

如何在Ruby中删除4个字节的utf-8字符?

由于MySQL的utf8不支持4字节字符,我正在寻找一种方法来检测并消除Ruby中字符串中的任何4字节utf8字符。 我知道我可以更新我的表使用utf8m4,但有几个原因是不可能的或所需的解决方案。 简单地将字符串编码为ASCII将删除这些字符,但也会删除所有其他非ASCII字符,这是不好的。

Rails 3 – 如何处理PG错误不完整的多字节字符

在Rails 3.2应用程序(Ruby 1.9.2)中,我收到以下错误 在mobile_users#update中发生PGError: 不完整的多字节字符 这些是Postgres错误我在开发和测试模式下测试时遇到类似的SQLIte错误 导致此错误的参数是(故意省略auth令牌) * Parameters: {“mobile_user”=>{“quiz_id”=>”1”, “auth”=>”xxx”, “name”=>”Joaqu\xEDn”}, “action”=>”update”, “controller”=>”mobile_users”, “id”=>”1”, “format”=>”mobile”} 这是作为JSON HTTP Put请求进行的,处理此问题的更新操作如下所示 # PUT /mobile_users/1 # PUT /mobile_users/1.xml def update @mobile_user = current_mobile_user @mobile_user.attributes = params[:mobile_user] respond_to do |format| if @mobile_user.save format.html { redirect_to(@mobile_user, :notice => ‘Mobile user was successfully updated.’) } format.json { head :ok } format.mobile […]

如何将UCS2字符串转换为UTF8?

如何将UCS2中的字符串(每个字符2个字节)转换为Ruby中的UTF8字符串?

如何使用Ruby处理UTF-8电子邮件标题(如Subject :)?

我是一封电子邮件n00b,但我正在开发一个发送带有Unicode字符的HTML电子邮件的应用程序(正如我的朋友所说“享受编码地狱”)。 Subject:标题来自用户输入,因此可能包含Unicode字符。 一些邮件客户端(如GMail和Outlook 2007)可以正常使用,但从我的阅读中看来,正确的方法是对标头使用MIME编码字编码 。 我找不到一个Ruby库来做这件事。 有吗? 此外,是否有一个标题要添加,告诉邮件客户端在显示邮件时使用UTF-8? 我们发送多部分电子邮件,因此我们的Content-Type是multipart/mixed 。 Apple Mail.app特别没有使用正确的编码,即使它在各个部分中指定为UTF-8。

如何将UTF8组合字符转换为ruby中的单个UTF8字符?

某些字符,如Unicode字符’LATIN SMALL LETTER C WITH CARON’可以编码为0xC4 0x8D ,但也可以用’LATIN SMALL LETTER C’和’COMBINING CARON’的两个代码点表示,即0x63 0xcc 0x8c 。 更多信息: http : //www.fileformat.info/info/unicode/char/10d/index.htm 我想知道是否有一个库可以将“拉丁文小写字母C”+“组合卡伦”转换为“拉丁文小写字母C卡通”。 或者是否有包含这些转换的表格?

如何在ruby中使用正则表达式的utf8

在RoR中,如何使用utf8代码validation中文或日语单词的发布表单。 在GBK代码中,它使用[\ u4e00- \ u9fa5] +来validation中文单词。 在Php中,它使用/ ^ [\ x {4e00} – \ x {9}} + $ / u来表示utf-8页面。

无法在Ruby 1.9.3 IRB中输入变音符号

我在使用Mac OS 10.7.3的Ruby 1.9.3的IRB中遇到了非常奇怪的行为当我尝试进入变音符号时,它在提示符中被转义并且看起来像这样(我在键盘上输入”ü” ) irb(main):001:0> “\U+FFC3\U+FFBC” 这有点奇怪: irb(main):001:0> “\U+FFC3\U+FFBC”.length => 0 当然,角色也不会显示: irb(main):001:0> “\U+FFC3\U+FFBC” => “” 有谁知道这里发生了什么或如何解决这个问题?

续集永远不会返回utf-8,只是ascii-8bit

我正在尝试连接到这个mysql数据库。 DataMapper以UTF-8很好地获取所有内容,但Sequel总是返回ASCII-8bit中的字符串,这会产生.to_json的错误。 为了让它发挥作用,我尝试了几件事。 Encoding.default_external = Encoding::UTF_8 Encoding.default_internal = Encoding::UTF_8 DB.run ‘set names utf8’ Sequel.mysql ‘db’, (…), :encoding => ‘utf-8’ 我有gem:mysql(2.9.0)(试过没有),mysql2(0.3.11)和续集(3.42.0) 唯一有效的方法是手动强制编码每个字符串,这个字符串比理想情况要差很多。

Ruby to_json问题错误“非法/格式错误的utf-8”

我收到错误JSON::GeneratorError: source sequence is illegal/malformed utf-8当尝试将哈希转换为json字符串时, JSON::GeneratorError: source sequence is illegal/malformed utf-8 。 我想知道这是否与编码有关,我怎么能让to_json只是对待\ xAE? $ irb 2.0.0-p247 :001 > require ‘json’ => true 2.0.0-p247 :002 > a = {“description”=> “iPhone\xAE”} => {“description”=>”iPhone\xAE”} 2.0.0-p247 :003 > a.to_json JSON::GeneratorError: source sequence is illegal/malformed utf-8 from (irb):3:in `to_json’ from (irb):3 from /Users/cchen21/.rvm/rubies/ruby-2.0.0-p247/bin/irb:16:in `’