PostgreSQL Hot-Standby
一、简介 PostgreSQL数据库提供了类似Oracle的standby数据库的功能。PostgreSQL9.0 standby数据库在应用WAL日志的同时,也可以提供只读服务,这是PostgreSQL9.0中最激动人心的功能,这个功能在oracle数据库中也只是最新版本11g中才有的新功能。这个功能在oracle中叫active dataguard,在PostgreSQL中称为hot standby。在利用日志恢复数据的同时可以用只读的方式打开数据库,用户可以在备用数据库上进行查询、报表等操作,也可用做读写分离。在PostgreSQL9.0之前,也可以搭建standby数据库,但standby数据库只能处于恢复状态中,不能打开,也不支持只读打开。而这种情况在9.0之后彻底改变了。 PostgreSQL 9.0中日志传送的方法有两种: 基于文件(base-file)的传送方式,这种方式是PostgreSQL9.0之前就提供的方法。也就是服务器写完一个WAL日志文件后,才把WAL日志文件拷贝到standby数据库上去应用。 流复制(streaming replication)的方法,这是PostgreSQL9.0才提供的新方法。这个方法就是事务提交后,就会把生成的日志异步的传送到standby数据库上应用,这比基本文件的日志传送方法有更低的数据延迟。 二、设置步骤 基于文件(base-file)的传送方式在PostgreSQL8.X中就有的方式,这里不就介绍了,这里主要介绍流复制的standby的搭建方法,设置步骤如下: 对主数据库做一个基础备份,然后把基础备份拷贝到standby机器,把基础备份恢复到standby机器上。 1、在主库上设置wal_level = hot_standby。 2、在主数据库上设置wal_keep_segments为一个足够大的值,以防止主库生成WAL日志太快,日志还没有来得及传送到standby,就会循环覆盖了; 3、在主数据库上设置max_wal_sender参数,这个参数是控制主库可以最多有多少个并发的standby数据库; 4、在主数据库上建一个超级用户,standby数据库会使用这个用户连接到主库上拖WAL日志。 5、在主数据库上的pg_hba.conf中设置listen_addresses和连接验证选项,允许standby数据库连接到主库上来拖WAL日志数据,如下所示: # TYPE DATABASE USER CIDR-ADDRESS METHOD host replication postgres 10.0.0.136/8 md5 6、在备份上建一个recovery.conf,设置以下几项: standby_mode = ‘on‘ primary_conninfo = ‘host=127.0.0.1 port=5432 user=postgres password=123456‘ trigger_file = ‘/opt/pgstb/trigger_standby‘ primary_conninfo上standby连接到主数据库所需要的连接串。
三、系统环境 系统平台:Suse 11.4 PostgreSQL版本:9.0.3 四、实例分析 主数据库: Standby数据库: 主数据库的数据目录为:/var/lib/pgsql/data,standby数据库的数据目录为/var/lib/pgsql/data。 在主数据库的/var/lib/pgsql/data/postgresql.conf文件中设置如下配置项: wal_level = hot_standby max_wal_senders = 2 wal_keep_segments = 32 host replication postgres 10.0.0.136/8 md5 psql -d postgrespostgres=# create user postgres superuser password ‘123456‘; CREATE ROLE 对主数据库做一个基础备份: 先用select pg_start_backup();命令把数据库切换到备份状态。 把主数据库目录拷贝到备库目录就可以了: 查看standby备库目录: 拷贝完成后,结束主库的备份状态: 修改备库的配置文件/var/lib/pgsql/data/postgresql.conf文件中的相关项为如下内容: hot_standby = on 拷贝示例文件/usr/share/postgresql/recovery.conf.sample到/var/lib/pgsql/data目录下,然后改名成recovery.conf,修改相关的配置项为如下内容: 删除原先从主库上过来的/var/lib/pgsql/data/postmaster.pid文件,然后启动备库: 复制代码 linux-david:/var/lib/pgsql/data # export PGDATA=/var/lib/pgsql/data linux-david:/var/lib/pgsql/data # echo $PGDATA /var/lib/pgsql/data linux-david:/var/lib/pgsql/data # service postgresql start server starting linux-david:/var/lib/pgsql/data # LOG: database system was interrupted; last known up at 2010-08-21 22:43:04 CST LOG: entering standby mode LOG: redo starts at 0/1000020 LOG: record with zero length at 0/10000B0 LOG: streaming replication successfully connected to primary LOG: consistent recovery state reached at 0/2000000 LOG: database system is ready to accept read only connections 在主库上做一些操作: 复制代码 psql (9.0beta4) Type "help" for help. postgres=# create table t (id int primary key,name varchar(20)); NOTICE: CREATE TABLE / PRIMARY KEY will create implicit index "t_pkey" for table "t" CREATE TABLE postgres=# insert into t values (1,‘xxxxxxx‘); INSERT 0 1 postgres=# insert into t values (2,‘xxxxxxx‘); INSERT 0 1 postgres=# 然后在备库上看是否同步到了备库: 复制代码 psql (9.0beta4) Type "help" for help. postgres=# d List of relations Schema | Name | Type | Owner --------+------+-------+------- public | t | table | osdba (1 row) postgres=# select * from t; id | name ----+--------- 1 | xxxxxxx 2 | xxxxxxx (2 rows) 复制代码 可以看到数据已经同步到了备库,基本上感觉不到延迟。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |