加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

postgresql – 用于编码“UTF8”的无效字节序列

发布时间:2020-12-13 16:52:18 所属栏目:百科 来源:网络整理
导读:我 trying to import some data到我的数据库。所以我创建了一个临时表, create temporary table tmp(pc varchar(10),lat decimal(18,12),lon decimal(18,city varchar(100),prov varchar(2)); 现在我想导入the data, copy tmp from '/home/mark/Desktop/Ca
我 trying to import some data到我的数据库。所以我创建了一个临时表,
create temporary table tmp(pc varchar(10),lat decimal(18,12),lon decimal(18,city varchar(100),prov varchar(2));

现在我想导入the data,

copy tmp from '/home/mark/Desktop/Canada.csv' delimiter ',' csv

但后来我得到的错误,

ERROR:  invalid byte sequence for encoding "UTF8": 0xc92c

如何解决这个问题?我需要更改我的整个数据库的编码(如果是,如何?)或者我可以只更改我的tmp表的编码?或者我应该尝试更改文件的编码?

如果需要在数据库中存储UTF8数据,则需要一个接受UTF8的数据库。您可以在pgAdmin中检查数据库的编码。只需右键单击数据库,然后选择“属性”。

但是这个错误似乎告诉你在你的源文件中有一些无效的UTF8数据。这意味着复制实用程序检测到或猜测您正在向其馈送UTF8文件。

如果你运行在Unix的某个变体下,你可以使用文件实用程序检查编码(或多或少)。

$ file yourfilename
yourfilename: UTF-8 Unicode English text

(我认为这将工作在终端中的Macs。)不知道如何在Windows下。

如果对来自Windows系统的文件(即,不是用UTF8编码的文件)使用同一个实用程序,它可能会显示如下:

$ file yourfilename
yourfilename: ASCII text,with CRLF line terminators

如果事情变得怪异,你可以尝试将输入数据转换为已知的编码,更改客户端的编码,或两者。 (我们真的伸展了我对编码的了解的极限。)

您可以使用iconv实用程序更改输入数据的编码。

iconv -f original_charset -t utf-8 originalfile > newfile

您可以按照Character Set Support上的说明更改psql(客户端)编码。在该页面上,搜索短语“启用自动字符集转换”。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读