文章高频词生成词云的方法
最近在学python3一直遇到这个错误,在网上查了很多,说是windows系统的问题云云。 import jieba ? 此程序执行之后出现错误,说是无法转成utf-8。 解决方法: f=open("关于实施乡村振兴战略的意见.txt",‘r+‘,encoding=‘gbk‘) utf-8与gbk的区别与联系: 字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。 至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。 GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。 GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准) UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。 比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。 UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛,GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大--------------------- 作者:wardseptember 来源:CSDN 原文:https://blog.csdn.net/wardseptember/article/details/80198857 版权声明:本文为博主原创文章,转载请附上博文链接! (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- windows-server-2003 – Windows Server群集和奇怪的一天节
- 模拟 – 确定Windows Phone 8.1应用程序是否在模拟器中运行
- 无法在Windows上安装cairo haskell绑定
- windows – Socket.Bind和IP源路由,具有多个本地网络接口
- windows-server-2008 – 如何在Windows Server 2008上禁用N
- Windows应用程序的最佳实践?
- 在windows下使用mysqlbinlog实现数据库增量导出
- 丢失libiconv-2.dll解决办法以及无法定位输入点libiconv-2.
- 在Windows 7上将升级日志1_60与MinGw链接的问题
- Windows – 20Mbps WAN通过IPSec隧道限制为10Mbps
- MDT2013批量升级Win7客户端至Win10
- Windows API一日一练 5 RegisterClass和Register
- 在Windows(.Net)上转换JPEG颜色空间(Adobe RGB到
- 在我的Windows 2008 DNS / DHCP服务器上注册我的
- 测试模式 windows2008 内部版本7601
- windows – SysAllocString / SysFreeString COM
- windows-phone-7 – 如何以编程方式检查Windows设
- Windows – 将批处理文件重定向到文件
- .NET Core 创建Windows服务
- windows-server-2008-r2 – 通过Powershell和Win