20130725 上海OOW第四日
今天终于有空听了一下技术主题。 [@more@] 展台的奖品已经基本上发完了,而且今天是最后一天,人相对少一些,因此上午抽出一些时间去听了一个技术的专题。 这个主题主要介绍了12c性能方面的特性。开篇Oracle先介绍了在各个场景下TPCC的记录都是Oracle保持的,并展示了那张引来无数关注的TPMC测试结果:SUN平台性能超过HP平台的7倍。 主题中的另一个亮点是介绍了Oracle自己用来承载邮件、日历、联系人、聊天、文档以及网络会议的Oracle集群,由9台X2-2组成,一共2376核,2PB数据量,7T内层和48T闪存。这个应该是
20130724 上海OOW第三日
又在OOW的展览大厅打了一回酱油,和Jackie Han、Kamus一起介绍ACE Program。 [@more@] 今天上午本打算一早去听技术的专题,没想到有客户数据库出现了异常,远端诊断和分析用了不少时间,到了OOW现场时,KeyNotes已经结束了。又赶上公司的展台事情比较多,因此一直在展台帮忙。 OOW的午饭从1点开始,而我们的专题从1:20开始,怕吃饭的人多来不及,于是打算等专题结束后再去,没有想到后来提问的人还很多,专题一直持续到了2点以后。跑到楼上发现午饭也结束了。 公司的展台仍然是络绎不绝,连Oracle数据库研发的
20130723 上海OOW第二日
今天在OOW的ACOUG专场分享了Think Different的主题。 [@more@] 今天一天在会场非常的充实。到了会场后先去听了今天的KeyNotes,其中Steve Miranda的云计算的主题以及Andy Mendelsohn的12c数据库对云计算的支持,都是本次大会的重点话题。Oracle 12c中的C指的就是CLOUD,而12c最大的亮点PLUGABLE DB就是Oracle在DB层对云架构的支持。 如果说去年OOW大会只是给出了12c PLUGABLE DATABASE的概念,那么今年OOW上Oracle已经想好要如何用PDB来支持云服务了,甚至我怀疑Oracle来云服务的收费细则都已经定义好了,青铜、白
20130722 上海OOW开幕
期待已久的ORACLE OPEN WORLD终于开幕了。 [@more@] 有了以往OOW的经验,没有一大早就跑去排队注册,而是到了下午才去签到注册地方,几分钟搞定了注册的过程。 今天一早听说马克赫德的飞机由于机械故障,导致中途返航,导致他将无法现场出席本次上海OOW大会,他的演讲将改为远程的方式。我在去年10月不但现场听过他的演讲,而且现场看过Larry的演讲,因此倒也没有什么遗憾,而对于大部分技术人员而言,在现场的时候也会盯着大屏幕,是不是现场真人演讲也没有本质的区别。估计影响最大的应该是媒体的朋友,缺少现场
20130721 OOW媒体发布会
今天抵达了上海,开始开启OOW模式。 [@more@] 这次是第三次参加OOW,和以往不同,本次公司作为参展商参加了OOW,在一层的展览大厅有专门的展台,而且本次公司的6个ACE都到达现场,准备一起参加这次Oracle的盛会。 今天下午原本想去会场先进行注册,但是听说会场还没有开门。本来今天应该没有相关的活动,结果Eygle作为微博特使有一个媒体发布会,被Eygle拉了过去,顺便把Kamus也一起叫上。 这个媒体发布会主要介绍了本次OOW的重点方向,包括软硬件集成的系统、云计算、客户体验和JAVA。另外,本次会议的规模在国
密码延迟验证导致的系统HANG住
又是一个11g新特性导致的问题。 [@more@] 这个新特性很早之前就研究过,也在其他客户处碰到过类似的问题。从11g开始,如果一个用户使用不正确的密码尝试登录数据库,那么随着登录失败次数的增加,每次登录验证前延迟等待的时间也会增加: SQL> set time on 18:30:54 SQL> 18:30:58 SQL> conn test/test Connected. 18:31:25 SQL> 18:31:25 SQL> conn test/a conn test/a conn test/a conn test/a conn test/a conn test/a conn test/a conn test/test conn test/a ERROR: ORA-010
IP地址被清空导致实例重启
客户10.2.0.4 RAC for Solaris 10环境突然出现了实例重启的现象。 [@more@] 数据库正常运行到下午3点左右,随后两个节点分别重启,其中一个节点上的实例无法自动启动。检查两个实例的告警日志发现,在节点重启前,两个节点都出现了明显的ORA-27504错误: Wed Apr 10 15:00:05 2013 Errors in file /oracle/admin/orcl/udump/orcl1_ora_10997.trc: ORA-00603: ORACLE server session terminated by fatal error ORA-27504: IPC error creating OSD context ORA-27300: OS system dependent operation:if_not_f
ORA-7445(kjbcrcomplete)错误
客户10.2.0.5 RAC在验证表的逻辑结构是出现ORA-7445错误。 [@more@] 错误信息如下: Sun Mar 31 03:45:16 EAT 2013 Errors in file /oracle/app/admin/orcl/udump/orcl2_ora_4039.trc: ORA-07445: 出现异常错误: 核心转储 [kjbcrcomplete()+5521] [SIGSEGV] [Invalid permissions for mapped object] [0x00000002A] [] [] 详细TRACE信息为: Ioctl ASYNC_CONFIG error, errno = 1 *** 2013-03-31 02:20:45.846 *** ACTION NAME:() 2013-03-31 02:20:45.846 *** MODULE NAME:(sqlplus@db2 (TNS V1-V3)
Streams AQ: qmn coordinator waiting for slave to start等待
一个客户的10.2.0.5数据库的TOP 5等待出现了这个等待事件。 [@more@] 其实导致这个Streams AQ: qmn coordinator waiting for slave to start等待出现的原因除了参数设置不合理外,最主要的原因还是数据库太闲了: Event Waits Time(s) Avg Wait(ms) % Total Call Time
ORA-600(13310)错误
客户10.2.0.4 RAC环境出现ORA-600[13310]错误。 [@more@] 错误信息如下: Sun Aug 1 04:08:24 2010 Errors in file /oracle/admin/ORCL/udump/orcl1_ora_14964.trc: ORA-00603: ORACLE server session terminated by fatal error ORA-27544: Failed to map memory region for export ORA-27300: OS system dependent operation:socket failed with status: 23 ORA-27301: OS failure message: File table overflow ORA-27302: failure occurred at: sskgxpcre1 Sun Aug 1 04:08:24 2010 Trace dumpin
ORA-600(17147)和ORA-7445(__lwp_kill)错误
客户10.2.0.4 RAC环境出现ORA-600[17147]和ORA-7445[__lwp_kill]错误。 [@more@] 错误信息为: Fri Dec 14 16:05:56 2012 Errors in file /oraclelog/admin/orcl/bdump/orcl2_diag_27263.trc: ORA-07445: exception encountered: core dump [__lwp_kill()+48] [SIGIOT] [unknown code] [0x000006A7F] [] [] ORA-00600: internal error code, arguments: [17147], [0x9FFFFFFFFD3E6BB8], [], [], [], [], [], [] Fri Dec 14 16:06:06 2012 Restarting dead background process DIAG DIAG started with pid
ORA-600(17059)错误
客户10.2.0.4 RAC出现大量的ORA-600[17059]错误。 [@more@] 错误信息如下: Tue May 21 09:55:30 2013 Errors in file /oraclelog/admin/orcl/bdump/orcl1_j000_307.trc: ORA-00600: 内部错误代码, 参数: [17059], [0xC000001346657EB8], [], [], [], [], [], [] Tue May 21 09:55:32 2013 Errors in file /oraclelog/admin/orcl/bdump/orcl1_j000_307.trc: ORA-00600: 内部错误代码, 参数: [17059], [0xC000001346657EB8], [], [], [], [], [], [] Tue May 21 09:55:33 2013 Errors in file /oraclelog/
系统存在严重的latch: undo global data等待
客户10.2.0.5 RAC环境出现了严重的latch: undo global data等待。 [@more@] 问题时刻AWR的TOP如下: Event Waits Time(s) Avg Wait(ms) % Total Call Time Wait Class latch: undo global data 6,245,400 1,372,583 220 22.0 Other gc buffer busy 114,190,782 1,329,749 12 21.3
20130712 LSI渠道启动峰会
参加了LSI渠道启动峰会,还碰到了沃趣科技的CEO。 [@more@] 原则上讲云和恩墨不算是LSI的渠道商,不过之前与LSI合作对Nytro WarpDrive卡和Nytro MegaRAID对于Oracle数据库性能的提升。因此LSI把我们作为合作伙伴也邀请到了今天的渠道峰会的会场。 最近恰好也在一个客户处进行LSI的POC,客户的数据库和SQL都进行了优化,优化后数据库的主要压力落在IO上,因此考虑通过缓存的方式来进行优化。如果缓存的测试效果非常明显,到时候会将对比效果公布出来。 而沃趣科技之前一直和FusionIO合作,本次来参加LSI的会议,
Oracle DBA实战攻略:运维管理、诊断优化、高可用与最佳实践——序
印象中很少帮人写序,提笔后才发现这也不是件轻松的事情。 [@more@] 初识周亮应该是2012年10月到杭州出差,经一个杭州的同事介绍认识的,虽然是第一次见面,但是聊得却很投机:一方面大家都是这个圈子里的人,虽然之前没有打过交道,但是有着很多共同的朋友,因此感觉比较亲切;另一方面是我们两个的相似点非常多,因此共同语言也就比较多。大家都是Oracle的DBA,都对Oracle技术感兴趣,也都在Oracle的圈子内积累了不少年头,即便是只聊技术,也能找到说不完的话题。更何况我们两个人的工作性质几乎完全一样。我们两个
ORA-600(ktrgcm_3)错误
客户10.2.0.5 RAC数据库出现ORA-600[ktrgcm_3]错误。 [@more@] 错误信息如下: Sun Jul 07 01:06:00 EAT 2013 Errors in file /oracle/admin/orcl/udump/orcl1_ora_28947.trc: ORA-00600: internal error code, arguments: [ktrgcm_3], [], [], [], [], [], [], [] 详细TRACE如下: *** ACTION NAME:() 2013-07-07 00:49:57.500 *** MODULE NAME:(g@orcl (TNS V1-V3)) 2013-07-07 00:49:57.500 *** SERVICE NAME:(orcl) 2013-07-07 00:49:57.500 *** SESSION ID:(3332.36419) 2013-07-07 00:49:57.50
ORA-600(krbb2ec_stamp_mismtach)错误
备份归档日志导致的ORA-600错误。 [@more@] 错误信息如下: Tue Aug 16 02:43:58 2011 ALTER SYSTEM ARCHIVE LOG Tue Aug 16 02:44:01 2011 Thread 1 advanced to log sequence 5940 (LGWR switch) Current log# 7 seq# 5940 mem# 0: /dev/orcl3vg1/rdb3vg1_1_redo71 Current log# 7 seq# 5940 mem# 1: /dev/orcl3vg2/rdb3vg2_1_redo72 Tue Aug 16 03:43:44 2011 Thread 1 advanced to log sequence 5941 (LGWR switch) Current log# 8 seq# 5941 mem# 0: /dev/orcl3vg2/rdb3vg2_1_redo81 Curren
ORA-600(koksadqb1)错误
使用utlrp.sql编译失效对象引发的ORA-600错误。 [@more@] 错误信息如下: Sat Dec 19 05:29:59 2009 Completed: ALTER DATABASE OPEN Sat Dec 19 05:30:20 2009 SERVER COMPONENT id=UTLRP_BGN: timestamp=2009-12-19 05:30:20 Sat Dec 19 05:31:09 2009 Errors in file /oraclelog/admin/orcl3/bdump/orcl31_cjq0_24952.trc: ORA-00604: error occurred at recursive SQL level 1 ORA-04031: unable to allocate 576 bytes of shared memory ("shared pool","update seq$ set increment$=
统计信息收集出现DFS等待导致实例HANG死
客户10.2.0.4 RAC环境,出现大量的library cache lock和cursor: pin S wait on X等待,经分析是由于统计信息收集僵死导致的。 [@more@] 数据库在8点到9点期间,数据库两个节点都存在明显的cursor: pin S wait on X和library cache lock的等待: Event Waits Time(s) Avg Wait(ms) % Total Call Time Wait Class cursor: pin S wait on X 1,573,056 30,651 19
ORA-600(kposcws-2)错误
客户11.2.0.2 RAC环境出现ORA-600[kposcws-2]错误。 [@more@] 错误信息为: Thu Sep 27 10:48:15 2012 Errors in file /u01/app/oracle/diag/rdbms/orcl/orcl1/trace/orcl1_ora_34145026.trc (incident=682292): ORA-00600: 内部错误代码, 参数: [kposcws-2], [], [], [], [], [], [], [], [], [], [], [] Incident details in: /u01/app/oracle/diag/rdbms/orcl/orcl1/incident/incdir_682292/orcl1_ora_34145026_i682292.trc 根据MOS文档Bug 6615409 - ORA-600 [kposcws-2] on scrollable cursor [ID 6