使用Postgresql进行中文分词
使用Postgresql进行中文分词安装 postgresql 数据库解压tar -zxvf postgresql-9.6.6.tar.gz 配置./configure 可能会缺少这个依赖,安装readline开发包yum install readline-devel 编译make 安装make install 添加postgres用户并加入到postgres用户组groupadd postgres 创建数据目录mkdir -p /data/pgdata/ 添加环境变量方法一,在root和postgres用户下分别执行(重启机器后失效)export PATH=/usr/local/pgsql/bin:$PATH 方法二,在root和postgres用户下分别执行(永久生效)vim ~/.bash_profile 修改数据目录和pg程序目录的权限chown postgres:postgres /data/pgdata/ 初始化数据库su - postgres 添加postgresql到系统服务vim postgresql-9.6.6/contrib/start-scripts/linux 用系统服务的方式启动postgresqlservice postgresql start 查看postgresql的端口起来了没有netstat -tlnp | grep 5432 设置开机启动chkconfig postgresql on 安装分词程序tar -jxvf scws-1.2.3.tar.bz2 配置./configure 编译make 安装make install 安装postgresql的分词插件,这个插件依赖scws程序解压unzip zhparser-0.1.4.zip 编译SCWS_HOME=/usr/local make 安装make install 测试进入postgres用户su - postgres 进入pg数据库psql 切换到postgres数据库c postgres 创建扩展CREATE EXTENSION zhparser; 查询分词SELECT to_tsvector(‘testzhcfg’,’南京市长江大桥’); ps:分词的粒度可以从配置中调整。(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |