ITPub博客

首页 > Linux操作系统 > Linux操作系统 > IT运维浅见

IT运维浅见

原创 Linux操作系统 作者:thinkpada31p 时间:2012-07-06 11:10:44 16777215 删除 编辑

  一.大家来谈谈自己在IT运维中所遇见的倒霉事;

       半夜遇到公司的服务器或是电脑故障,,然后远程登陆也无法处理,打车去公司,突然它自己好用了!

    有一台LAMPP的服务器在托管机房,不定期的dns就挂掉了,1年就那么几次,只能重新启动network服务和httpd服务,最近那一次过五一时候还在外地玩呢,接到电话短信,
 幸好带着ipad,找个无线信号,远程登陆处理一下。


  
 二.说说自己分析公司运维中遇见的问题;

   随着集团各种应用扩大及业务部门对于IT服务要求提高

 我们现有的IT维护方式不能达到业务部门的需求,目前主要存在以下几个实质问题:

    1.处理问题和答复的及时性不够,。
     2.因服务质量问题而转发收到业务部门的投诉。
           3.缺乏运维问题的统计信息,没有统一的服务台,电话/手工记录。
        4.不能度量运维管理绩效。
           5.  监控工具拓扑展现差,监控和流程没有集成 。   


     通过如上分析,缺乏有效的故障预警机制、缺乏快速有效的故障分析处理方式、没有清晰的业务服务影响模型、缺乏IT运维管理流程的支持。
      这些最多的问题,我们小组通过几次电话会议及汇总资料进行一次分析。

   IT系统运维中的具体困难点


 1         出现故障后处理流程不清晰。
 2        看到IT运维的实际效果难,低水平的一些管理人员使用IT系统有困难。
 3.        各数据多而杂,变成运维决策信息比较难。
 4.        IT运维过程中缺乏必需的培训、知识转移难,关键人员离职,找错会变异常的困难。
 5.        各种系统没有得到监控和预警,处理问题时期都是忙于救火。


 在2011年末的时候,我们在公司内部实施了IT运维管理简易平台,采用一个开源软件,基于linux+mysql+php的架构,自己修改一一些字段和流程,把人员、运维、流程都包含进去。服务器监控方面: 目前使用Nagios 软件监控各种网络服务。
 今年计划把实时web网络监控和设备配置变更融入运维系统,当然希望公司预算增加套专业IT运维软件来集中管理云计算服务器、存储设备和网络等基础架构。

 三:采用云计算对于IT运维的帮助。

     云计算紧密依托稳定的网络基础,这点是让IT运维人员最头疼的,
     如果一旦有网络问题,这些云啊,雨啊,都不行了。

 

     比如我们现在生产和研发部门是集团级别虚拟桌面来办公做分布式的计算,
 (主要考虑安全性和实时的沟通)
    这个私有云的应用如果网络不通,就不能及时的做公司各种研发业务。
    这个应用使得研发部门的网络保障变得最高优先级别。

 

 

 目前刀片服务器上面虚拟3个系统+EMC存储扩容,是我们2010年的一个新增设备,出发点是减少功耗,减少运维负担,可以根据系统实际的需求重新系统的配置。


 邮件,OA,ERP,研发等关键业务都已经移植到了云计算的平台,实现了数据大集中,将来会逐渐的各分支公司网络基础,IT都外包出去。管理软件和硬件的传统IT角色在新的云环境世界将不再需要。

 

 

 

 

 我们的云计算时代改善之一

 统一运维Portal(门户),设置公司运维管理服务平台,这个平台提供公司各IT服务的基础(软件硬件):

 1.        对于IT系统进行整体监控,事前分析、运行监控、事后恢复。
 2.        协调IT部门不同团队(例如,不同厂家的存储设备,不同应用模块,各系统等团队)紧密配合、顺畅运转。
 3.        支持IT和ERP知识库、FAQ,积累运维经验,降低解决大量重复问题的成本。
 4.        能够对各种服务进行准确的KPI考核。
 5.        对各种业务需求、运行事故进行分类统计。

 改善之二,ITIL运维流程管理                    

       创业艰难,守成也不易。只有IT系统永续运行才能向用户有效地证明IT的价值。
 1.        快速响应客户服务申请及故障的定位和排除,提高IT服务的可用性和客户满意度。
 2.        那问题管理就是要达到“治本”的效果。问题管理是要找到故障的根本原因、排除隐患.
 3.        保持ERP与IT环境的运行稳定;

 改善之三,知识管理是IT运维重要基础

 1.        项目组采用规范的文档管理,实施中做各种整理收集、归类,问题解决的知识库。
 2.        对于日常使用问题及变更业务需求,分类记录并实时更新文件知识库。
 3.        吸收各种IT网站资料,作为外部资料进行管理归档。
 4.        强化我们公司内部关键用户的知识培训。


 2013年内部数据中心发展趋势

 1、由低密度(50%机柜,5KW)走向高密度,云数据中心的设备发展:由能够休眠的IT硬件,走向智能化、能休眠的机房硬件;2
 2、制冷:从空气制冷到水冷。
 3、IT硬件由散热到耐热;
 4。服务器无人及自动化管理;

转帖一个IT运维价值理论


1. 确保IT流程有效地支持业务发展
 2. 提高企业业务运营的质量和生产率
 3. 有效地保障了业务的连续性
 4. 使IT资源得到集约型应用
 5. 避免资源重复使用和浪费

 云计算时代的到来,为这些价值实现提供了最佳实践。

 


 因为我们公司为上市企业,每年境外事务所的安全审计在IT基础运维中所占的比重会越来越大,而且随着行业技术的不断积累和探索,用于审计的理念、模型、工具、软件等产品也会越来越多。我们也很重视各种运维日志的维护和制度建设,把云计算的安全作为优先考虑的管理目标。

 


 四:不好好学习体。


 晚上被研发部门投诉无法登陆公司的虚拟桌面系统,加班在公司排查网络原因,查完网络路由再查VPN服务器,查完VPN服务器再去查交换机,这一夜吃了2个方便面,电影也不能去看了,女朋友也生气啦,还好凌晨找到罪魁祸首,小时候不好好学习,长大就得干这个IT运维。领导不知道你辛苦,还得挨收拾。

 五、总结

    标准化——基于ITIL流程框架,构建最佳的运维流程和管理平台。 流程化——提供可视化的流程及表单设计工具,将工单、表单、邮件、短信等与流程相绑定,确保IT和SAP运维工作流程均可99.99%可用,提升运维工作效率。


 最后引用史记典故大家共勉,“夫运筹帷幄之中,决胜千里之外”。
 为达成我们的企业快速成长之目标,各位运维小组成员携手,共同与ITPUB创造优质IT运维服务。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/658077/viewspace-734768/,如需转载,请注明出处,否则将追究法律责任。

上一篇: 没有了~
请登录后发表评论 登录
全部评论

注册时间:2012-07-06

  • 博文量
    4
  • 访问量
    8620