加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

PostgreSQL 简体中文区域设置性能改进实践

发布时间:2020-12-13 17:37:26 所属栏目:百科 来源:网络整理
导读:相关阅读 《PostgreSQL 字符集下区域设置对性能的影响改进办法》 http://my.oschina.net/quanzl/blog/135721 按照这个思路,将中文排序信息内置于数据库内核之中,如果 locale 选择中文,由此检索排序位置,而不是通过系统API strcoll()。 encoding均为utf-8

相关阅读《PostgreSQL 字符集下区域设置对性能的影响改进办法》
http://my.oschina.net/quanzl/blog/135721

按照这个思路,将中文排序信息内置于数据库内核之中,如果 locale 选择中文,由此检索排序位置,而不是通过系统API strcoll()。

encoding均为utf-8,数据量为54996,中文与ascii换杂,同一硬件平台,openSUSE。
以下为以 pgAdminIII 为客户端创建索引的测试结果:

locale=C,原生PG:查询成功但无结果,耗时: 140 毫秒(ms)。
locale=zh_CN.utf8,原生PG:查询成功但无结果,耗时: 985 毫秒(ms)。
locale=zh_CN.utf8,修改后:查询成功但无结果,耗时: 203 毫秒(ms)。

以上结果都是记录“创建、删除、再创建”过程的第二次创建时间。

同时发现一个问题,Linux下平台的中文排序比较怪:
select * from (values('阿'),('啊'),('腌'),('包'),('')) as a(e) order by e;
返回结果
""
"腌"
"阿"
"啊"
"包"
猜测这里的“腌”,取“a za”发音。不是 yan 音。

不管怎样,后边尝试跟社区沟通一下,看他们能不能接受。以前就PG在不同系统下排序混乱的话题讨论,有位大仙说这样(使用操作系统排序)挺好。

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读