如何找到WINDOWS-1252字符的内部代码表示?
发布时间:2020-12-14 04:15:13 所属栏目:Windows 来源:网络整理
导读:我正在处理来自问卷的SPSS数据,该问卷必须来自M $Word. Word会自动将连字符更改为长连字符,并转换为无法正确显示的字符,即“ – ”变为“ú”. 我的问题:WINDOWS-1252字符集中的utf8ToInt()相当于什么? utf8ToInt("A")[1] 65 当我使用自己的数据执行此操作
我正在处理来自问卷的SPSS数据,该问卷必须来自M $Word. Word会自动将连字符更改为长连字符,并转换为无法正确显示的字符,即“ – ”变为“ú”.
我的问题:WINDOWS-1252字符集中的utf8ToInt()相当于什么? utf8ToInt("A") [1] 65 当我使用自己的数据执行此操作时,出现错误: x <- str_sub(levels(sd$j1)[1],7,7) print(x) [1] "ú" utf8ToInt(x) Error in utf8ToInt(x) : invalid UTF-8 string 但是,x的内容在grep和gsub表达式中完全可用. > Sys.getlocale() [1] "LC_COLLATE=English_United Kingdom.1252;LC_CTYPE=English_United Kingdom.1252;LC_MONETARY=English_United Kingdom.1252;LC_NUMERIC=C;LC_TIME=English_United Kingdom.1252"
如果通过read.spss form package foreign加载SPSS sav文件,则可以通过指定编码来轻松导入具有正确编码的数据帧:
read.spss("foo.sav",reencode="CP1252") (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
推荐文章
站长推荐
- windows-server-2012 – 如何修复此Windows 2012
- windows-7 – VB6 IDE在Windows 7机器上运行速度
- windows – 同时重命名和域加入机器的风险是什么
- 我可以使用带有Windows域身份验证的html5 Websoc
- Windows 10 Mail应用程序上订阅的日历?
- windows-phone-7 – RestSharp – WP7 – 无法将
- Windows批处理文件中的字符串处理:如何用前导零
- 将DLL注入的代码从Delphi 7转换为Delphi XE2
- 联想win10专业版64位简体中文原版光盘镜像
- active-directory – “匿名登录”vs“NTLM V1”
热点阅读