技术博客
oracle rac问题排查思路
admin2020-12-28 15:53 586人已围观
简介当oracle rac出问题时,很多人往往不知道从何查起,我根据自己在生产上排查的经验,说一下自己的排查思路。
当oracle rac出问题时,很多人往往不知道从何查起,我根据自己在生产上排查的经验,说一下自己的排查思路。
一、查看系统时间是否同步
1、date
2、不同步的进行同步,在两个节点上执行:
ntpdate -u 1.cn.pool.ntp.org
3、重启有问题的节点
【时间不同步,断电后数据库启动时crs启动失败导致asm启动失败,最后数据库启动失败,asm日志信息报i/o错误、找不到磁盘组等,可能会误导问题的定位,其实只是时间不同步导致的问题,找到问题的根源,重启即可】
二、查看防火墙是否关闭
ping 私有ip,vip,如果不通,先按下面步骤操作:
1、 查看防火墙状态:service iptables status
2、 如果防火墙是开的,就关闭:service iptables stop
3、 设置防火墙不要开机启动:chkconfig iptables off
4、 检查上一步是否设置成功:chkconfig --list iptables
重启有问题节点数据库即可。
三、查看归档日志空间情况
归档日志满的话会导致数据库异常,删除过期日志可解决。
1、 进入grid 用户,asmcmd,输入lsdg查看磁盘情况,删除前和删除后做个对比,就知道腾出多少空间了:
su – grid
asmcmd
lsdg
2、 用rman来删除,不要手动删除
su – oracle
rman target /
crosscheck archivelog all;//检查控制文件和实际物理文件的差别。
//删除7天前日志
delete noprompt archivelog all completed before 'sysdate-7';
//将过期的日志删除:
delete noprompt expired archivelog all;
delete noprompt obsolete【或者delete noprompt obsolete until time 'sysdate-7' ;
】
到这里,归档删除完了
3、 查看腾出多少空间,如果腾出的空间还不够,在ASM管理模式下手工删除方法:【有双实例的,每个实例都进去检查一下是否有过期归档日志】
ASMCMD>cd archivelog
ASMCMD>ls
(ASMCMD>rm -f +data/zgdb/archivelog/2013_10_31/t* 删除2013年10月31日的归档日志)
ASMCMD>rm –rf ./2016* 删除所有2016年文件夹及文件夹下的归档日志文件
把归档日志物理文件删除后,但是还没完全把归档日志删除干净,需要检验同步。登录rman,执行如命令:
su - oracle
rman target /
RMAN> crosscheck archivelog all;
RMAN>delete expired archivelog all;
【补充】
查询每天的归档产生的情况:
SELECT TRUNC(FIRST_TIME) "TIME",SUM(BLOCK_SIZE * BLOCKS) / 1024 / 1024 / 1024 "SIZE(GB)"FROM V$ARCHIVED_LOG GROUP BY TRUNC(FIRST_TIME);
查询最近7天每天归档产生情况,在上条sql中加过滤条件:
SELECT TRUNC(FIRST_TIME) "TIME",SUM(BLOCK_SIZE * BLOCKS) / 1024 / 1024 / 1024 "SIZE(GB)"FROM V$ARCHIVED_LOG GROUP BY TRUNC(FIRST_TIME) having TRUNC(FIRST_TIME) >= TRUNC(sysdate -7);
四、查看crs状态及日志
1、使用系统命令查看相关进程
ps –ef | grep d.bin
2、使用oracle命令查看集群状态
进入oracle 的bin目录下:
cd /u01/app/11.2.0/grid/bin/
执行:
./crsctl stat res -t
或者,进入grid用户,直接执行crsctl stat res -t
3、在每个节点上检查crs状态
[grid@rac1 ~]$ crsctl check cluster
crsctl check crs //只检查本节点
4、crs日志路径
Grid相关日志:
/u01/app/11.2.0/grid/log/node1
5、启动某个节点crs【使用root用户执行】
./crsctl start cluster -n db1 //-n后是节点名
五、查看asm状态及日志
1、检查 ASM状态及配置
[oracle@rac1 ~]$ srvctl status asm
ASM is running on rac1,rac2
2、asm日志路径
Asm相关日志路径:
/u01/app/grid/diag/asm/+asm/+ASM1/trace
重要的日志文件:alert_+ASM1.log
3、查询asm配置
srvctl config asm -a
4、启动asm实例【最好在grid用户下执行】
srvctl start asm -n db1 // -n后是节点名字
还有其他检查,像检查节点应用状态及配置、查看数据库配置、检查scan ip、检查 VIP的状态及配置等,篇幅原因就先不再介绍了。可以关注我,如果以后遇到oracle rac故障需要排查,我们可以进行沟通交流。
- 微信公众号
很赞哦!(0)
相关文章
文章评论
评论0
站点信息
- 微信公众号:扫描二维码,关注我们
标签云
-
php
网页设计
个人博客
JS
个人博客
Html
春节必看: 2020新春红包大战 全攻略
新增详细玩法攻略!
支付宝集五福5亿集分宝招商银行抽现金券抖
抖音 2020 发财中国年 攻略
支付宝集五福5亿集分宝招商银行抽现金券抖
最近购买威尔胜WTB0900复刻版和WT
mysql慢查询和php-fpm慢日志
PSR-2
基础代码规范
Thinkphp
响应式
公司
整站
源码
网络科技网站模板
1024
节日
百度收录
论坛
社区
2020
豆瓣
评分最高
电影
debugger
调试
Python
语法
高德
百度地图
MySQL
追寻
webpack
vue
oracle
服务器搭建
有趣
动物
人体
历史
天文
生活
名人
体育
地理
文化
科学
心理
植物
饮食
自然
图片
JVM
IDEA
Loader
Git
UNIAPP
股票
A股
同花顺
海尔
海天味业
半年报
股市总结
歌尔股份
乐普医疗
涪陵榨菜
餐饮
财报分析
酒店
年报分析
美锦能源
山煤国际
贵州茅台
张坤
腾讯
华鲁恒升
淮北矿业
药明康德
早盘关注
国电电力
北方华创
宝丰能源
TCL中环
兔宝宝
天润乳业
启明星辰
阳光电源
山西汾酒
迈瑞医疗
人福医药
比亚迪
宁德时代
汤臣倍健
伊利股份
通威股份
东鹏饮料
隆基股份
紫金矿业
五粮液
康龙化成
赣锋锂业
爱尔眼科
片仔癀
VR
永新股份
爱美客
美的集团
格力电器
科沃斯
云南白药
同仁堂
洋河股份
白云山
三体
狂飙 原著