• 博客访问: 467604
  • 博文数量: 337
  • 用 户 组: 普通用户
  • 注册时间: 2008-01-01 20:58
个人简介

暂无介绍

ITPUB论坛APP

ITPUB论坛APP



APP发帖 享双倍积分

文章分类

全部博文(337)

文章存档

2011年(1)

2010年(22)

2009年(35)

2008年(41)

2007年(143)

2006年(39)

2005年(56)

我的朋友
微信关注

IT168企业级官微



微信号:IT168qiye



系统架构师大会



微信号:SACC2013

发布时间:2008-07-31 14:18:10

RWSockAddr getpeername() const;Returns the address of the peer connected to this socket.返回连接到这个SOCKET上的peer的地址的时候发生的错误,而网上看到有类似的情况,跟我这里很类似,是系统负载过高的时候发生的。并且我这里,当时因为负载过高,磁盘I/O过大,导致负载狂高的同时,RAC系统的VOTING DISK访问磁盘发生超时,接着就发生了节点被驱逐的情况,导致一个节点被重启。另外系统启动的时候,会启动EV_AGENT,启动时的信息如下:EV_AGENT[4485]: Agent daemon process created, pid 4485EV_AGENT[4485]: Agent has started......【阅读全文】

阅读(3142) | 评论(0) | 转发(0)

发布时间:2008-07-31 11:36:25

系统中有时候会出现如下警告信息: bt1 kernel: warning: many lost ticks.bt1 kernel: Your time source seems to be instable or some driver is hogging interuptsbt1 kernel: rip __do_softirq+0x4d/0xd0bt1 kernel: Falling back to HPET下面简单记录一下搜索出来的相关内容[@more@]在某些系统上,当首次访问一些 IDE 设备时,可能显示信息warning:many lost ticks(警告:丢失许多嘀嗒信号)。当 IDE 设备没有使用 DMA 进行数据传输时,会显示此信息,因为非 DMA 传输所用的时间比计时器嘀嗒信号间隔长很多(在此期间,处理器......【阅读全文】

阅读(5342) | 评论(0) | 转发(0)

发布时间:2008-07-30 15:16:15

linux平台上的Oracle Clusterware 10.2.0.4和以后版本引入了一个新的Oracle Clusterware Process Monitor Daemon (OPROCD)进程来监控系统状态和集群中的每个节点的健康状态,就象已经在不使用第三方的cluster软件的UNIX系统中提供的那样,下面来看看OPROCD到底是何方神圣。[@more@]OPROCD在linux平台上的10.2.0.4版本中和hangcheck-timer一起运行,它和hangcheck-timer模块没有联系和依赖关系,它由init.ccsd进程产生出来并用root用户运行。OPROCD进程被锁定在内存中来监控集群中的每个它自己运行的节点,来检测机器上的硬件或者驱动的fre......【阅读全文】

阅读(2263) | 评论(0) | 转发(0)

发布时间:2008-07-29 15:49:32

此文档摘自METALINK:726833.1,所适用的ORACLE版本为:Oracle Server - Enterprise Edition - Version: 9.2.0.8 to 11.1.0.7从9.2.0.2版本开始,ORACLE RAC环境需要使用一个新的I/O fencing模块,叫做hangcheck-timer模块。这个模块用来代替Watchdog模块,提供类似的fencing功能。Hangcheck-timer模块是标准的linux2.4以上的内核中的一个子功能被发布。Hangcheck-timer应该在系统启动的时候被加载, 并对于能够影响RAC节点稳定性的长时间的系统操作HANG进行内核监控。它运行在内核级别并使用Time Stamp Counter(TSC)来捕捉调度的延迟和节点H......【阅读全文】

阅读(3681) | 评论(0) | 转发(0)

发布时间:2008-07-29 11:16:29

很多时候RAC中的节点宕机的时候,因为CPU或者磁盘等资源的繁忙或者其他问题,导致缓冲区中的日志还没有被写入磁盘上的日志中,节点就已经被重启,给故障诊断带来一定的麻烦,通过适当设置DIAGWAIT的值,使得节点被驱逐到真正OS REBOOT之间的时间适当延长,则可以记录更多有帮助的日志信息。具体操作过程如下(摘自METALINK:559365.1)[@more@]1、停止所有节点的CRS #crsctl stop crs 2.停止10.2.0.3到11.1.0.6版本的RAC中才引入的OPROCD进程 #<CRS_HOME>/bin/oprocd stop 3、检查是否还有CRS相关的进程在运行 ps -ef |egr......【阅读全文】

阅读(2180) | 评论(0) | 转发(0)
给主人留下些什么吧!~~
留言热议
请登录后留言。

登录 注册