Voting Disk概述
Oracle Clusterware由2部分组成,分别是Voting Disk和 OCR。Voting Disk里面记录着节点成员的信息。如RAC数据库中有哪些节点成员,节点增加或者删除时也同样会将信息记录进来。Voting Disk必须存放在共享存储上,通常来说是存放在裸设备上。Voting Disk主要为了在出现脑裂时,决定那个Partion获得控制权,其他的Partion必须从集群中剔除。为了保证Voting Disk的安全,需要配置多个Voting Disk,Voting disk使用的是一种“多数可用算法”。当有多个Voting disk时,则必须一半以上的Votedisk同时使用,Clusterware才能正常使用。 比如配置了4个Votedisk,坏一个Votedisk,集群可以正常工作,如果坏了2个,则不能满足半数以上,集群会立即宕掉,所有节点立即重启,所 以如果添加Votedisk,尽量不要只添加一个,而应该添加2个。Oracle建议Voting Disk的个数应该为奇数个,如 1、3、5个,每个Voting Disk的大小约为20MB。关于Voting Disk的更多内容,看参阅笔者的如下博客 http://czmmiao.iteye.com/blog/1577531
维护Voting Disk
注意:对Voting Disk的更改必须用root来进行,添加或删除Voting Disk都必须在crs资源关闭的情况下进行,同时即使在CRS关闭情况下仍然需要使用-force参数 查看Voting Disk
# ./crsctl query css votedisk 0. 0 /dev/raw/raw2
备份Voting Disk #dd if=/dev/raw/raw2 f=/home/oracle/voting_disk.bak 恢复Voting Disk #dd if=/home/oracle/voting_disk.bak f=/dev/raw/raw2
添加和删除Voting Disk
# raw -qa /dev/raw/raw1: bound to major 8,minor 17 /dev/raw/raw2: bound to major 8,minor 33 /dev/raw/raw3: bound to major 8,minor 58
# ./crsctl stop crs Stopping resources. Successfully stopped CRS resources Stopping CSSD. Shutting down CSS daemon. Shutdown request successfully issued.
# ./crsctl add css votedisk /dev/raw/raw4 -force Now formatting voting disk: /dev/raw/raw4 CLSFMT returned with error [4]. failed 9 to initailize votedisk /dev/raw/raw4.
# ./crsctl add css votedisk /dev/raw/raw3 -force Now formatting voting disk: /dev/raw/raw3 successful addition of votedisk /dev/raw/raw3. # ./crsctl query css votedisk 0. 0 /dev/raw/raw2 1. 0 /dev/raw/raw4 2. 0 /dev/raw/raw3 located 3 votedisk(s). # ls -l /dev/raw/raw* crw-rw---- 1 oracle oinstall 162,1 Jan 1 20:19 /dev/raw/raw1 crw-rw---- 1 oracle oinstall 162,2 Jan 1 20:18 /dev/raw/raw2 crw-rw---- 1 oracle oinstall 162,3 Jan 1 20:22 /dev/raw/raw3 -rw-r--r-- 1 root root 10240000 Jan 1 20:18 /dev/raw/raw4
可以看到在没有/dev/raw/raw4设备的情况下执行添加voting disk命令时,报错并在/dev/raw/目录下创建了raw4文件,我们必须删除该文件
# ./crsctl delete css votedisk /dev/raw/raw4 -force successful deletion of votedisk /dev/raw/raw4. # ls -l /dev/raw/raw* crw-rw---- 1 oracle oinstall 162,1 Jan 1 20:34 /dev/raw/raw1 crw-rw---- 1 oracle oinstall 162,3 Jan 1 20:22 /dev/raw/raw3 -rw-r--r-- 1 root root 10240000 Jan 1 20:18 /dev/raw/raw4 # rm -f /dev/raw/raw4 # ./crsctl query css votedisk 0. 0 /dev/raw/raw2 1. 0 /dev/raw/raw3 located 2 votedisk(s).
OCR概述
OCR 负责维护整个集群的配置信息,包括RAC以及Clusterware资源,包括的信息有节点成员、数据库、实例、服务、监听器、应用程序等。为了解决集群 的“健忘”问题,整个集群会有一份配置OCR,最多两分OCR,一个primary OCR和一个mirror OCR互为镜像,以防OCR的单点故障。关于“健忘”可以参阅笔者的
http://czmmiao.iteye.com/admin/blogs/1629166
ORACLE 把集群的配置文件放在共享存储上叫做OCR DISK。 节点通过OCR Process读写OCR。 但只有一个节点能够读写OCR DISK 叫OCR Master节点,其它节点通过本节点的OCR process 向master node的OCR process提交请求,由master OCR Process完成物理读写,并同步所有节点OCR cache中的内容。就OCR而言,每个集群都会有一个Master节点,这个节点一半来说是集群中生存时间最长的那个节点(生存时间最长也就意味着该节 点越稳定)。 我们在安装Clusterware的在选择OCR的存储位置时,如果选择"Normal Redundancy",则会存储两份相互镜像的OCR。如果选择"External Redundancy"则表明存储本身已经坐了冗余配置,不需要创建镜像OCR。该位置会记录在/etc/oracle/ocr.loc(Linux)或 /var/opt/oracle/ocr.loc(Solaris)中。 OCR存储的配置信息是以目录树的形式来记录一系列“键-值”对应信息 的。OCR记录着 CRS进程管理资源的所有配置信息,大小约为100MB。OCR key:有3个大分支,分别是SYSTEM.css,DATABASE 和CRS。每个分支下面又有许多小分支。这些记录的信息只能由root用户修改。
由于 OCR的信息十分重要,Oracle会每4小时队其做一次备份,并且保留最后的3个备份,以及前一天、前一周的最后一个备份。这个备份由Master Node的CRSD进程完成,备份的默认位置为$CRS_HOME/crs/cdata/<cluster_name>目录下。每次备份后, 备份文件的名字会自动变更,以反映备份时间顺序,最近一次备份叫做backup00.ocr。建议DBA除了在本地保留这些备份外,还应在其他存储设备上 保留一份备份,以防止意外的存储故障。
ocrdump 如果想阅读ocr信息,可以使用ocrdump命令将OCR的内容以ASCII的方式打印出,但是这个命令不能用作OCR的备份恢复,只能用作阅读, 命令格式:ocrdump [-stdout] [filename] [-keyname name] [-xml] 参数说明: -stdout:把内容打印输出到屏幕上 Filename:内容输出到文件中 -keyname:只打印某个键及其子健内容 -xml:以xml格式打印输出 示例:把system.css键的内容以.xml格式打印输出到屏幕 #./ocrdump -stdout -keyname SYSTEM.css -xml|more 这个命令在执行过程中,会在$CRS_HOMElog&;node_name>client目录下产生日志文件,文件名ocrdump_<pid>.log,如果命令执行出现问题,可以从这个日志查看问题原因。
ocrcheck Ocrcheck命令用于检查OCR内容的一致性,命令执行过程会在$CRS_HOMElognodenameclient目录下产生ocrcheck_<pid>.log日志文件。 这个命令不需要参数。
#./ocrcheck Status of Oracle Cluster Registry is as follows : Version : 2 Total space (kbytes) : 163668 Used space (kbytes) : 4348 Available space (kbytes) : 159320 ID : 1345945283 Device/File Name : /dev/raw/raw1 Device/File integrity check succeeded Device/File not configured Cluster registry integrity check succeeded
ocrconfig
查看自动备份信息
#./ocrconfig -help
$ ocrconfig -showbackup czmmiao2 2012/12/26 17:26:16 /u01/app/oracle/product/10.2.0/db_1/cdata/crs czmmiao2 2012/12/18 21:12:37 /u01/app/oracle/product/10.2.0/db_1/cdata/crs czmmiao1 2012/12/16 21:54:20 /u01/app/oracle/product/10.2.0/db_1/cdata/crs czmmiao2 2012/12/26 17:26:16 /u01/app/oracle/product/10.2.0/db_1/cdata/crs czmmiao2 2012/12/26 17:26:16 /u01/app/oracle/product/10.2.0/db_1/cdata/crs
$ ls -l /u01/app/oracle/product/10.2.0/db_1/cdata/crs total 29880 -rw-r--r-- 1 root root 5083136 Dec 7 16:05 backup00.ocr -rw-r--r-- 1 root root 5083136 Nov 27 19:14 backup01.ocr -rw-r--r-- 1 oracle dba 5083136 Nov 26 22:32 backup02.ocr -rw-r--r-- 1 oracle dba 5083136 Nov 26 22:32 day.ocr -rw-r--r-- 1 oracle oinstall 22084 Jan 1 20:52 OCRDUMPFILE -rw-r--r-- 1 root root 5083136 Dec 16 21:54 temp.ocr -rw-r--r-- 1 oracle dba 5083136 Nov 26 22:32 week.ocr
使用导出,导入进行备份和恢复 Oracle推荐在对集群做调整时,比如增加,删除节点之前,应该对OCR做一个备份,可以使用export备份到指定文件,如果做了replace或者restore等操作,Oracle建议使用cluvfy comp ocr -n all命令来做一次全面的检查。
# ./ocrconfig -export ocrexp.exp #导出ocr # ls -l ocrexp.exp -rw-r--r-- 1 root root 102935 Jan 1 21:17 ocrexp.exp
# ./crsctl start crs Attempting to start CRS stack The CRS stack will be started shortly
# dd if=/dev/zero of=/dev/raw/raw1 bs=1M #破坏ocr
dd: writing `/dev/raw/raw1': No space left on device 160+0 records in 159+0 records out 167685120 bytes (168 MB) copied,18.0218 seconds,9.3 MB/s # ./ocrcheck PROT-601: Failed to initialize ocrcheck # ./runcluvfy.sh comp ocr -n all Verifying OCR integrity Unable to retrieve nodelist from Oracle clusterware. Verification cannot proceed. # ./ocrconfig -import ocrexp.exp #导入ocr
# ./ocrcheck # ./runcluvfy.sh comp ocr -n all
移动和删除OCR
移动OCR时,不能直接修改OCR,必须要先添加镜像才能修改,否则会报错
# ./ocrconfig -replace ocr /dev/raw/raw3 PROT-1: Failed to initialize ocrconfig
# ./ocrconfig -replace ocrmirror /dev/raw/raw3 #创建镜像ocr
# ./ocrcheck Status of Oracle Cluster Registry is as follows : Version : 2 Total space (kbytes) : 163668 Used space (kbytes) : 4344 Available space (kbytes) : 159324 ID : 38625139 Device/File Name : /dev/raw/raw1 Device/File integrity check succeeded Device/File Name : /dev/raw/raw3 Device/File integrity check succeeded Cluster registry integrity check succeeded
# cat /etc/oracle/ocr.loc #Device/file /dev/raw/raw3 getting replaced by device /dev/raw/raw3 ocrconfig_loc=/dev/raw/raw1 ocrmirrorconfig_loc=/dev/raw/raw3 # ./ocrconfig -replace ocr /dev/raw/raw4 #修改primary ocr位置
# ./ocrcheck
Status of Oracle Cluster Registry is as follows : Version : 2 Total space (kbytes) : 163668 Used space (kbytes) : 4344 Available space (kbytes) : 159324 ID : 38625139 Device/File Name : /dev/raw/raw4 Device/File integrity check succeeded Device/File Name : /dev/raw/raw3 Device/File integrity check succeeded Cluster registry integrity check succeeded
# ./ocrconfig -replace ocrmirror #删除镜像ocr
# cat /etc/oracle/ocr.loc #Device/file /dev/raw/raw3 being deleted ocrconfig_loc=/dev/raw/raw4 (编辑:李大同)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|