加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

ruby-on-rails – 如何检查字符是否为utf-8

发布时间:2020-12-16 21:26:26 所属栏目:百科 来源:网络整理
导读:如何通过 ruby | ror检查字符集是否采用utf-8编码? 解决方法 在 Ruby和其他任何地方都没有明确的方法可以做到这一点: str = 'foo' # start with a simple string# = "foo" str.encoding# = #Encoding:UTF-8 # which is UTF-8 encodedstr.bytes.to_a# = [10
如何通过 ruby | ror检查字符集是否采用utf-8编码?

解决方法

在 Ruby和其他任何地方都没有明确的方法可以做到这一点:
str = 'foo' # start with a simple string
# => "foo" 
str.encoding
# => #<Encoding:UTF-8> # which is UTF-8 encoded
str.bytes.to_a
# => [102,111,111] # as you can see,it consists of three bytes 102,111 and 111
str.encode!('us-ascii') # now we will recode the string to 8-bit us-ascii encoding
# => "foo" 
str.encoding
# => #<Encoding:US-ASCII> 
str.bytes.to_a
# => [102,111] # see,same three bytes
str.encode!('windows-1251') # let us try some cyrillic
# => "foo" 
str.encoding
# => #<Encoding:Windows-1251> 
str.bytes.to_a
# => [102,the same three again!

当然,您可以对文本进行一些统计分析,并消除文本无效的编码,但从理论上讲,这不是可解决的问题.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读