XXXX有限公司
—IT系统运维服务解决方案
四川XX科技有限公司
2015年 4月
目 录
概述 ........................................................................................................................................................ 1 市信息办IT系统运行现状 ................................................................................................................. 2
运行的系统及设施 ....................................................................................................................... 2 非正常或不稳定运行系统 ........................................................................................................... 2 目前系统维护现状和存在的问题 .............................................................................................. 3 现状总结重点需求 ....................................................................................................................... 3 XXXXIT运维服务优势 ........................................................................................................................ 4 IT系统运维服务项目指导原则 .......................................................................................................... 5
总体目标 ........................................................................................................................................ 5 基于 IT 服务管理模式(ITSM) .................................................................................................. 6
人员、资源、技术和过程四者平衡的运行维护服务模型 ............................................ 6 快速响应及时解决 ............................................................................................................... 7 以预防为主的方针 ............................................................................................................... 7 量化的服务级别管理 ........................................................................................................... 8 IT运维服务项目阶段划分设计 .................................................................................................. 8
启动阶段 ............................................................................................................................... 9
正常服务阶段 ..................................................................................................................... 10 总结阶段 ............................................................................................................................. 10
IT系统运维服务项目的范围 ............................................................................................................ 11
服务范围 ...................................................................................................................................... 11 运维服务项目服务时间、服务方式 ........................................................................................ 11 运维服务项目涉及的产品范围 ................................................................................................ 12
硬件范围清单 ..................................................................................................................... 12 软件范围清单 ..................................................................................................................... 15 项目运维预算 ............................................................................................................................. 15 IT系统运维服务项目组成员及职责 ................................................................................................ 16
运维服务项目组成员 ................................................................................................................. 16 IT系统运维服务项目服务级别管理 ....................................................................................... 19
故障级别定义 ..................................................................................................................... 19 关键指标定义 ..................................................................................................................... 20 SLA服务协议 ..................................................................................................................... 20 运营级别协议 ..................................................................................................................... 21 支持合同 ............................................................................................................................. 21
IT系统运维服务项目配置管理 ........................................................................................................ 22
目的 .............................................................................................................................................. 22 范围 .............................................................................................................................................. 22 配置管理项目 ............................................................................................................................. 23 配置管理表 .................................................................................................................................. 23 流程说明 ...................................................................................................................................... 23
定义配置管理对象和配置管理项 .................................................................................... 23 收集初始数据 ..................................................................................................................... 23 更新配置管理表 ................................................................................................................. 23 填写配置变更记录表 ......................................................................................................... 24 定期核查配置管理表 ......................................................................................................... 24
IT系统运维服务项目事件管理 ........................................................................................................ 24
目的 .............................................................................................................................................. 24 事件管理流程 ............................................................................................................................. 26
服务台事件受理 ................................................................................................................. 26 请求记录和分类 ................................................................................................................. 26 热线电话尝试解决 ............................................................................................................. 26 远程解决 ............................................................................................................................. 26 现场解决 ............................................................................................................................. 27
二线支持 ............................................................................................................................. 27 服务响应 ............................................................................................................................. 27 调查诊断 ............................................................................................................................. 27 确定解决方案 ..................................................................................................................... 27 客户确认 ............................................................................................................................. 28 资料归档 ............................................................................................................................. 28 配置核对更新 ..................................................................................................................... 28 热线关闭 ............................................................................................................................. 28 服务报告 ............................................................................................................................. 28
IT系统运维服务项目问题管理 ........................................................................................................ 29
目的 .............................................................................................................................................. 29 过程测量指标 ............................................................................................................................. 29 问题管理流程 ............................................................................................................................. 30
问题确认与受理 ................................................................................................................. 30 问题登记和归类 ................................................................................................................. 30 派单 ...................................................................................................................................... 30 问题调研和分析诊断 ......................................................................................................... 30 确定临时措施 ..................................................................................................................... 31
确定解决方案 ..................................................................................................................... 31 问题回顾和评审 ................................................................................................................. 31 问题归档 ............................................................................................................................. 32 问题关闭 ............................................................................................................................. 32 问题报告 ............................................................................................................................. 32
IT系统运维服务项目变更管理 ........................................................................................................ 32
目的 .............................................................................................................................................. 32 变更级别及定义 ......................................................................................................................... 33 变更流程描述 ............................................................................................................................. 33
变更确认受理 ..................................................................................................................... 33 变更记录和分类 ................................................................................................................. 34 变更分类执行 ..................................................................................................................... 34 变更关闭 ............................................................................................................................. 34 变更报告 ............................................................................................................................. 34
IT系统运维服务项目发布管理 ........................................................................................................ 35
目的 .............................................................................................................................................. 35 发布过程 ...................................................................................................................................... 35
制定发布方案 ..................................................................................................................... 35
发布方案评审 ..................................................................................................................... 36 构建测试环境、测试和验收 ............................................................................................ 36 沟通和培训 ......................................................................................................................... 36 分发和部署 ......................................................................................................................... 36 更新配置库 ......................................................................................................................... 37 发布关闭 ............................................................................................................................. 37 发布报告 ............................................................................................................................. 37
IT系统运维服务项目服务信息安全管理 ....................................................................................... 37
目的 .............................................................................................................................................. 37 确定安全实施范围 ..................................................................................................................... 38 实施安全规范 ............................................................................................................................. 38 IT系统运维服务项目服务可用性管理 ............................................................................................ 39
目的 .............................................................................................................................................. 39 范围 .............................................................................................................................................. 39 过程测量指标 ............................................................................................................................. 39 服务组件设计 ............................................................................................................................. 40
服务组件监控设计 ............................................................................................................. 40 服务组件维护设计 ............................................................................................................. 40
服务组件恢复设计 ............................................................................................................. 41
IT系统运维服务项目服务能力管理 ................................................................................................ 41 IT系统运维服务项目服务持续性管理 ............................................................................................ 42 IT系统运维服务项目服务成本管理 ................................................................................................ 42 IT系统运维服务项目服务报告 ........................................................................................................ 42 IT系统运维服务项目客户沟通管理 ................................................................................................ 43 IT系统运维服务项目项目质量检查 ................................................................................................ 43
概述
随着济源市政府信息化工作重点已经从基础设施建设向深化应用逐步转移,信息技术应用与业务之间已形成良性互动发展的趋势。
济源市政府服务平台信息化系统建设,具有特别的重要性和特殊性,尤其以行政权力系统为核心,扩展到相应的关键业务子系统及集成项目,其运行环境多系统、多数据库、多应用平台、多厂商网络及系统设备,多业务应用等复杂的管理环境。
在此背景下,市信息办信息系统的运行维护和建设对比,已经变得同等重要,信息系统建设后的有效应用更依赖于高质量的IT运行维护服务。
因各应用系统的维护难度和专业度的不断加深,目前现有的传统维护方式已经无法满足信息应用系统的维护需求,如何提高信息化应用系统的持续可用时间,从而有效提高业务部门的工作效率,已经成为越来越迫切需要解决的问题。
河南冠宇网络建设有限公司作为专业的软、硬件系统建设厂家,为政府信息化系统提供了具有针对性和科学性的运行维护服务解决方案。
1
市信息办IT系统运行现状
运行的系统及设施
机柜序号1234567812345678910111212345678910123456设备HP服务器认证网关认证网关证书注册中心身份认证服务器行政权力运行服务器行政权力运行服务器行政权力运行服务器抗DDOS负载均衡A负载均衡B山石VPNWEB防火墙交换机交换机深信服AF-1520交换机交换机深信服1550华三路由器交换枢纽办件查询前置信息公开前置数据库/备份服务器WEB服务器WEB服务器WEB服务器IP59.213.184.5159.213.184.6859.213.184.6959.213.184.7059.213.184.6459.213.184.6659.213.184.6659.213.184.65型号DL388 GenB吉大正元G3000-E吉大正元G3000-E吉大正元LRA2000曙光A420r-G曙光A420r-G曙光A420r-G曙光A840-G10傲盾KFW-2000华夏APPEX华夏APPEXHILLSTONESG-6000M3100国舜科技H3C S5500H3C S5500深信服AF-1520H3C S5120-28P-SIH3C S5120-28P-SIH3C MSR36-20IBM system X3650m4IBM system X3650m4IBM system X3650m4IBM system X3850X5IBM system X3850X5IBM system X3850X5IBM system X3850X5IBM 2498-B24IBM DS3512IBM system storage N3240IBM system X3650HP DL580HP DL380G6IBM X3610IBM X3610H3C S7506E6-06柜172.16.1.1006-05柜172.16.1.252172.16.2.3172.16.2.4172.16.1.25310.17.24.32172.16.1.109/10.17.24.31172.16.1.108/10.17.24.30172.16.1.104172.16.1.103172.16.1.102172.16.1.1016-04柜6-03柜NAS存储172.16.1.106数据库/备份服务器172.16.1.105企业和部门服务器172.16.1.106网页防篡改服务器172.16.1.108电子政务流转服务器电子政务公章服务器/防病毒服务器政务外网市级核心交换机 非正常或不稳定运行系统
1. 2.
系统名称: 运行情况:
2
3. 系统名称: 4.
运行情况:
目前系统维护现状和存在的问题
1. 系统厂家多,售后服务分散,容易形成技术孤岛,造成资源浪费。 2.
各系统厂家遇到系统边界线问题时,相互推卸责任,影响系统整体运行效果。 3. 当遇到紧急重大故障时,无法得到及时的恢复服务。 4.
对于安全隐患或隐性故障没有有效的技术防患措施。
现状总结重点需求
1. 具有全年365天,7 x 24小时无间隙服务 2. 需要加强机房设施及核心设备的日检管理方式 3. 需有系统硬件、软件全面维护服务的整体解决方案 4. 需常驻资深运维工程师提供快速技术支持 5. 需设备备件保障及设备硬件保修 6. 需本地现场技术及软件业务操作培训 7.
通过相关措施,完善非正常或不稳定运行系统
3
冠宇网络运维服务优势
河南冠宇网络建设有限公司可为济源市电子政务系统提供涵盖主流IT设备厂商从核心服务器、主机、存储、网络、视频、集成设备到软件系统等全线IT基础构架的维保服务产品,为电子政务的IT系统提供跨厂商的技术支持,以专业的工程师队伍和规范的服务流程为电子政务办及时解决软、硬件系统故障、恢复系统故障、恢复系统运行,降低系统故障率,提高IT系统可用性,提升电子政务系统的IT运维管理能力。
1) 严格按照ISO/IEC 20000的IT服务管理体系标准,实施运维管理; 2) 冠宇网络高层管理对IT运维服务管理体系的实施非常重视,完善的管
理体系平台,包括方针和框架,保障有效管理和实施;
3) 核心系统(三台合一接处警调度通讯指挥系统)技术故障快速处理能力; 4) 针对济源市电子政务办IT运维服务项目的服务策划管理、SLA服务级
别管理、业务关系管理、事件管理、问题管理、配置管理、变更管理、服务报告、服务能力管理、服务可持续性管理、服务可用性管理、服务成本管理、发布管理有一套完整的体系建立;
5) 涵盖主流IT厂商软、硬件产品的服务能力,已电子政务系统为核心,
统一服务接口,简化服务管理流程;
6) 灵活的SLA服务级别选择,便于客户根据自身需求情况定制服务; 7) 全天侯服务、全过程监督,通过各关键指标监控实现服务过程可测量;
4
8) 提供从数据、硬件平台、软件平台、网络平台和基础平台的全面维护服
务的整体解决方案;
9) 现场常驻资深工程师提供快速技术支持和故障排除; 10) 建立确定可行的保修设备备件保障机制;
11) 通过例行操作服务、响应支持服务、咨询评估服务和优化改善服务,多
角度多层次立体式保障客户系统的运行稳定,拓展客户信息化建设思路;
IT系统运维服务项目指导原则
总体目标
引入先进的IT运行维护服务理念和方法,建立并完善基于ISO/IEC 20000 IT 服务流程管理体系,从传统的项目售后服务向基于服务水平管理和流程导向的IT运维服务管理转型,以期达到:
1. 建立规范的服务流程,提高服务接受方与服务提供方运营效率; 2. 建立持续一致的服务,提高服务接受方满意度,确保客户满意度; 3. 有效及高效地整合和利用信息、基础架构、应用、人员等 IT 资源; 4. 以最低的成本、最大的效率来利用、管理和维护资产和设备;
5.
提高一线服务台解决率,改善服务流程,快速响应服务接受方的需求。在SLA服务
5
级别协议约定的事件处理时间内,事件处理完成率达到100%;
基于 IT 服务管理模式(ITSM)
ITSM 管理模式通过业务-IT相结合,服务内容定位和管理,服务的实施和开展以及服务运作的管理四个方面将业务和IT服务密切的结合起来。根据业务需求制定出相应的IT策略,并将IT策略转换为具体的IT服务计划和定义出服务级别。服务的建立和实施将IT策略贯穿始终,使IT最大程度的满足业务的需要。
人员、资源、技术和过程四者平衡的运行维护服务模型
策划 人员 资源 人员管理 岗位结构 运行维护工具 知识 技能 经验 服务台 备件库 知识库 改进 关键指标 实施 技术 过程 研发 服务级别管理 服务报告 发现问题 事件管理 问题管理 解决问题 配置管理 变更管理 发布管理 安全管理 检查 1. 人员:为确保服务提供方的相关人员具备应有的运行维护服务能力。为
保证故障响应、解决问题和交付结果可控,冠宇科技在人员管理、岗位结构和人员的知识、技能、经验、安全意识等方面建立了完善的管理和考核体系,从而保证服务人员能够具备和达到应有的水平。
2. 资源:为确保具备提供足够资源的能力,以满足与服务接受方约定的及
未来的运行维护服务需求。冠宇网络将合理建立和配置运行维护工具、
6
服务台、备件库和知识库等相关服务资源,从而保障服务资源的及时、有效投入。
3. 技术:为确保具备与运行维护服务策划相适应的技术和手段。在运行维
护服务实施过程中,可能面临各种问题(如硬件故障)、风险(如安全漏洞)以及新技术和前沿技术应用所提出的新要求,冠宇网络根据客户方的相关要求或技术发展趋势,能够发现和解决问题、风险控制、技术储备以及研发、应用新技术和前沿技术。
4. 过程:通过对ITIL最佳服务实践模型的理解,冠宇网络将建立以下服务
过程:服务级别管理、服务报告、事件管理、问题管理、配置管理、变更管理、发布管理、安全管理,通过对各个服务过程的流程化、标准化管理对整个服务过程实现可监控,从而保障服务提供的可控和持续可靠。快速响应及时解决
冠宇网络将为济源市电子政务运行维护服务对象提供快捷便利的服务方式,根据客户运行维护服务对象不同阶段的业务需求和内部人员结构客户化我们的服务。冠宇网络丰富的经验和庞大的服务体系,以运维团队驻场方式服务,使我们的服务具有快速响应和及时解决事件的能力。
以预防为主的方针
冠宇网络的IT运行维护服务改变了传统保修服务只是被动的接受问题并解决问题的特点,而是从预防为主,通过实时的监控和分析发现IT应用系统中潜在的问题和风险,及时采取相应的措施以避免问题的发生。这样的做法最大程度的减少了IT应用系统事故的发生,保证客户 IT 应用系统最大时间的持续工作。
7
量化的服务级别管理
服务质量的评估不再是一种模糊的概念,通过对服务过程中各项关键指标的持续监控,以关键指标量化方式定期按照建立的内部测评审核机制对关键指标达成度进行测量,从而实现服务过程的持续改进,保障服务质量的稳定和持续提高。经合同双方同意的服务级别将作为服务质量管理的依据。清晰明确的服务质量要求使得服务的管理最有效。
IT运维服务项目阶段划分设计
为了整个IT运维服务项目提供良好的管理监控,并对项目中各管理组织之间的持续运作建立恰当联系,我们把整个项目执行分为四个阶段:
1) 启动阶段:服务实施过程前期的准备工作和计划,包括运维服务管理制
度的建立、项目团队人力资源的到位。
2) 过渡阶段:完善支持服务流程,服务磨合逐渐成熟。 3) 正常服务阶段:正常地执行运维服务全过程。 4) 总结阶段:项目的总结移交并达到有序的结束。
时间跨度如图所示:
8
启动阶段2周 过渡阶段2周 常规服务阶段48周 总结阶段2周
管理制度、流程建立 项 项 管理制度、流程建立 目 目 SLA 确定 SLA确定 管 管 过渡阶段的宣传 理 理 项目启动会项目启动会 过渡阶段的宣传 接管第三方服务渠道 接管第三方服务渠道 管理制度、流程改进 管理制度、流程改进 服务级别管理、质量控制 服务级别管理、质量控制 定期的沟通协调会,报告 定期的沟通协调会,报告 对第三方的服务监督、评估管理 对第三方的服务监督、评估管理 资产评估、接管和标准化 资产评估、接管和标准化 资 资 产 产 管 管 理 理 资产信息数据库建立 资产信息数据库建立 资产配置的标准化管理 资产配置的标准化管理 日常的资产管理服务 日常的资产管理服务 资产的采购和租赁 资产的采购和租赁 资产数据移交 现场人员到位 运 运 现场人员到位 运维服务磨合 运维服务磨合 (无服务级别承 维 维 服务台到位 诺) 服务台到位 管 管 理 理 提供正常的运维服务(有服务级别承诺) 服务总结汇报 合同签定后 合同生效日
在每一个阶段过程中都有相应的工作安排及阶段成果输出,启动阶段、正常服务阶段和总结阶段三个不同的主要阶段构成完整的服务过程。
启动阶段
与济源市电子政务IT运维合同正式生效后,作为整个项目的启动阶段。在此阶段中,主要执行前期的准备工作,为尽快提供高质量的服务打好基础。(启动阶段估计需要2周时间)。该阶段主要工作如下:
1) 成立IT运维项目组,确定济源市电子政务办为运维服务接受方,冠宇
网络为运维服务提供方,并确定双方的职责分配; 2) 相关人员到位,提供IT运维服务项目的准备工作;
9
3) 召开项目启动会议,制定各现场支持服务计划沟通会,明确工作范围,
制定启动阶段计划;
4) 双方互动协调出台SLA服务等级协议细节,报请双方上级部门或领导审
核,并明确SLA服务等级协议;
5) 项目管理、运营维护等规章制度流程的确定; 6) 双方人员一起讨论有关的工作计划和需求; 7) 系统维护服务实施计划的出台和审核; 8) 针对服务范围涉及的硬件设备进行预检服务;
正常服务阶段
项目启动后,新的服务系统可以实现IT运维服务范围所承诺的服务后,即进入正常的服务阶段。在正常服务阶段,所有的工作将按照制定的计划进行,并提供服务级别的承诺。具体的工作如下:
1) 运维服务管理体系和流程的改进; 2) 正常的运维管理; 3) 季度服务例会的召开; 4) 设备运行风险评估;
总结阶段
此阶段开始于合同规定服务时间即将结束前2周。这个阶段的主要工作是和济源市电子政务办充分沟通,移交服务本年的工作。并从项目的服务实施过程中
10
积累总结经验,以促进提高在后续运维项目中的工作质量和绩效。
1) 收集服务期中各部分的服务文档资料及相关报告; 2) 汇总、装订,提交用户并存档; 3) 项目评估、总结;
4) 召开年度服务回顾总结会形成项目总结报告;
IT系统运维服务项目的范围
服务范围
资产托管服务、技术咨询服务、故障处理服务、系统升级改造服务、系统搬迁服务、培训服务、巡检服务、回访服务、硬件维修更换服务、定期系统健康检查服务、系统演练服务、重大会议保障服务、厂家支撑服务;
运维服务项目服务时间、服务方式
1) 运维服务项目服务期:从XXXX年XX月XX日起——XXXX年XX月
XX日止,共计XX年;
运维服务项目服务方式:河南冠宇网络建设有限公司的运维项目组在济源市现场驻点式服务;
11
运维服务项目涉及的产品范围
1.
硬件维护服务范围清单
根据硬件维护服务范围清单,确定对运维项目中提供服务产品的界定更加准确; 2.
软件维护范围清单
根据软件维护范围清单,确定对运维项目中软件维护范围更加清晰;
硬件范围清单
机柜 序号 设备 型号 1 HP服务器 DL388 GenB 2 认证网关 吉大正元G3000-E 3 认证网关 吉大正元G3000-E 4 证书注册中心 吉大正元LRA2000 6-06柜 5 身份认证服务器 曙光A420r-G 6 行政权力运行服务器 曙光A420r-G 7 行政权力运行服务器 曙光A420r-G 8 行政权力运行服务器 曙光A840-G10 12
1 抗DDOS 傲盾KFW-2000 2 负载均衡A 华夏APPEX 3 负载均衡B 华夏APPEX 4 山石VPN HILLSTONESG-6000M3100 5 WEB防火墙 国舜科技 6 交换机 H3C S5500 6-05柜 7 交换机 H3C S5500 8 深信服AF-1520 深信服AF-1520 9 交换机 H3C S5120-28P-SI 10 交换机 H3C S5120-28P-SI 11 深信服1550 12 华三路由器 H3C MSR36-20 1 交换枢纽 IBM system X3650m4 6-04柜 2 办件查询前置 IBM system X3650m4 13
3 信息公开前置 IBM system X3650m4 4 数据库/备份服务器 IBM system X3850X5 5 WEB服务器 IBM system X3850X5 6 WEB服务器 IBM system X3850X5 7 WEB服务器 IBM system X3850X5 8 IBM 2498-B24 9 IBM DS3512 10 NAS存储 IBM system storage N3240 1 数据库/备份服务器 IBM system X3650 2 企业和部门服务器 HP DL580 3 网页防篡改服务器 HP DL380G6 6-03柜 4 电子政务流转服务器 IBM X3610 电子政务公章服务器/防病毒服务5 IBM X3610 器 14
6 政务外网市级核心交换机 H3C S7506E
软件范围清单
项目运维预算
序号 收费项 预算计算方式 金额 备注 一 软件服务成本预算 1、 2、 二 硬件服务成本预算 1、 2、 三 硬件保修成本预算 1、 2、 四 备品备件库建设预算 1、 2、
15
五 场地成本预算 1、办公室 2、测试环境 3、办公设施 六 项目组组织成本预算 1、薪水: 2、培训费: 3、交通费: 4、差旅: 七 公司管理成本预算 3. 4. 项目的管理成本 税金 运维服务项目预算合计:
IT系统运维服务项目组成员及职责
运维服务项目组成员
针对运维服务项目,双方建立项目组成员,设计合适的事情管理接口,便于正确有效快速的管理运维项目工作事物。
16
运 维 项 目 小 组 成 员 项目负责人 项目决策 运维项目接口人 项目管理 业务关系负责人 运维项目经理 运维项目协调人 运维工作 运维项目待命运维工程师 应用系统使用部门 事件处理 服务台值班运维工程师 冠宇网络科技运维服务项目组人员配置及职责
运维项目经理(多年IT运维服务项目管理经验)
河南冠宇网络建设有限公司指派一名具有良好技术背景和丰富项目经验的项目经理,作为项目的总接口人和项目负责人。
1. 负责协调内部人员、软硬件资源,及时对市局运维项目范围提供服务、
保证各项指标的完成情况;
2. 负责整个服务项目的具体组织和管理,召集季度例会和工作协调会; 3. 制作、完善详细的服务项目方案和服务级别计划,在服务过程中及时动
态地调整方案,提高工作效率,保证服务质量;
17
4. 给管理小组成员分配任务,随时监控每个成员的服务管理情况,控制服
务质量;
5. 负责整个服务项目中的问题管理、变更管理;
6. 作为与市局指挥系统间的唯一接口,负责向济源市电子政务办汇报服务
情况、变更需求等情况,并及时将有关要求反馈给管理小组; 7. 接受市局指挥系统投诉和协调市局指挥系统需求的变化,及时反馈制订
应急计划,报告项目领导小组和市局指挥系统负责人;
驻场运维工程师(二年IT运维服务项目实施工作经验)
1. 负责计划内服务内容的实施; 2. 负责第一时间响应客户故障报告; 3. 负责主动性监控,及时发现故障隐患; 4. 负责现场故障修复;
5. 关键、疑难故障及时上报项目经理和热线中心; 6. 负责实施其它主动式服务及其它专业服务; 7. 负责解决现场和服务台无法解决的客户问题;
8. 负责在技术问题方面的与总部支持团队和原厂服务商的联系沟通;
项目接口人
1. 代表电子政务办,负责运行维护服务项目管理,与冠宇网络接口人;
18
2. 在运行维护过程中,负责变更管理等需要协调、确定之事宜; 3. 突发事件处理的管理协调;
4. 与冠宇网络运维组的定期交流沟通;
项目协调人
1. 运行维护服务中用户方具体维护协助人员;
2. 在运行维护过程中,负责协助运维工程师处理日常故障事宜; 3. 突发事件的相关协助工作; 4. 日常与运维组人员的交流沟通;
IT系统运维服务项目服务级别管理
针对济源市电子政务IT系统运行情况及需求,识别编写具体的服务需求和绩效并形成服务目录和服务级别协议;
对服务需求进行商定、定义、编制、监控、变更和评审等;
故障级别定义
故障级别 定义 因核心系统设备或服务端软件导致系统瘫痪,造成整个业务系统功能丧失性故障重大故障 (如:交换机瘫痪造成数据库瘫痪、核心服务程序故障、整个系统无法进行受理等);
19
辅助子系统在运行过程中发生的不影响基础业务系统使用或间接性故障(如:服务一般故障 器故障)
关键指标定义
关键指标 定义 响应时间 从接到客户故障申报时间起,到工程师电话反馈给客户止,所使用的时间。 到场时间 故障响应时间起,到工程师抵达故障现场之时止,所使用的时间。 解决时间 故障响应时间起,到工程师完成故障处置之时止,所使用的时间。 主动式服务 结合项目实施周期,制定服务计划,并规定具体的时间阶段,长期执行的过程。 规定时间
SLA服务协议
服务项目 故障级别 SLA-1 重大故障 响应时间 一般故障 7天*24小时 0-10分钟响应; 7天*24小时 0-10分钟响应;
20
重大故障 到场时间 一般故障 7天*24小时 1小时内工程师到场处置; 5天*8小时 2小时内工程师到场处置; 4小时内工程师处置完毕,核心系统恢复,基本业务重大故障 解决时间 一般故障 系统恢复使用; 24小时内工程师处置完毕业务系统恢复使用; 主动式服务 根据服务计划时间,保证时间的不偏离 规定时间 运营级别协议
运营级别协议(OLA)是IT运维组与公司研发部门和采购供应部门就济源市电子政务IT系统运维服务项目所签订的协议。(如服务台或项目组有受理故障升级、软件修改需求时,公司内部需严格遵守与项目组的OLA协议约定,保障运维项目服务执行效果)OLA支持运维组提供的各种服务。
支持合同
支持合同(UC)是与外部提供商就运维项目中部分服务的供应所签订的合同。(如通信运营商、专用服务器厂商、DLP大屏厂商、其它专用设备厂商等第三方厂商支持保障)
21
IT系统运维服务项目配置管理
目的
配置管理流程的总体目的是提供一个统一的、一致的流程来管理IT系统运维服务项目环境中的所有组成部分,以确保: 1) 所有配置项被识别和记录下来; 2) 配置项当前和历史状态得到汇报; 3) 配置项记录的完整性得到维护和确认; 4) 客户服务环境的稳定性; 5)
实现资产管理的目的;
范围
配置管理的范围是冠宇网络开发的管理信息系统的运行和服务环境下所包含的配置项,包括接处警调度指挥通讯系统、其它各子系统运行环境的部署环境设备、系统软件等,及服务环境中涉及的客户信息配置。具体活动包括识别、控制、汇报和审核等行为。包括: 1) 客户信息:企业客户信息;
2) 软件信息:参考软件服务范围清单的全部系统软件,建立配置信息; 3) 硬件信息:参考硬件服务范围清单的全部系统硬件,建立配置信息; 4)
服务文档:服务项目文档、服务记录、用户手册等;
22
配置管理项目
各配置管理对象需记录的具体配置参数项,例如服务器的物理位置、计算机名称、服务器品牌型号、IP地址、CPU型号、内存量、操作系统版本号、安装的业务系统软件名称等。
配置管理表
记录配置管理对象的各项配置信息。每个配置管理对象建立一张配置管理表,表
内记录该对象的每个配置管理项目的具体值。
流程说明
定义配置管理对象和配置管理项
在初次建立配置管理系统或增加新的软硬件资源时,运维经理需要对管理对象和配置参数进行定义,建立相应的配置管理表,并提交给运维工程师。
收集初始数据
配置维护预案按照配置管理表收集系统数据,并核查其数据的准确性。
更新配置管理表
在确认配置数据的准确性后,由运维工程师将新的配置信息写入配置管理表,配置维护预案需要在接到配置变更单后24小时内完成配置管理表的更新。
23
填写配置变更记录表
运维工程师在完成配置管理表更新,并通知运维经理后,需要将本次配置变更情况记录在配置变更记录表中。
定期核查配置管理表
1)
当由于系统变更导致配置变更时,在变更完成后1日内填写配置信息变更通知,并提交配置管理员。 2)
配置管理员在接到配置变更单后,根据配置变更单的内容进行配置变更派单,由配置操作员进行配置变更操作。若需要增删配置对象或配置项目,则由配置管理员进行相应的增删操作后,通知维护员更新配置信息。 3)
配置维护预案在接到配置信息变更单后的24小时内,需要按照流程规定完成配置信息的更新,并在变更单中写明处理人、处理时间和处理结果,并回送至配置管理员。 4) 配置管理员在配置变更记录表中记录本次变更行为
IT系统运维服务项目事件管理
目的
事件管理是一个被动性的任务,为了减少或消除存在或可能存在于IT服务中的干扰因素给IT服务带来的影响,以确保用户可以尽快恢复自己的正常工作。
24
因此,将事件记录下来并分类,再分配给适当的专业人员处理,同时监控事件的发展,并在事件得到解决之后将其关闭。
事件管理流程主要功能是尽快解决日常工作环境中出现的事件,保持IT服务的稳定性,其目的包括: 1) 建立统一的事件受理机制;
2)
事件处理流程中设立升级机制,与其它流程之间关联接口,设置优先级别和业务影响划分; 3) 建立重大事件流程管理;
4) 保证事件统计内容全面,保证流程的输入; 5) 在成本允许的范围内尽快恢复服务。 6) 快速响应服务请求。 7) 跟踪事件处理的状态。 8) 确认事件的解决和用户满意度。 9) 进行事件控制。 10) 按规范记录事件。 11) 监视并结束事件。 12) 进行定期服务回顾。 13)
提供一个日常服务接口。
25
事件管理流程
服务台事件受理
客户通过服务台报告事件,收集好相关信息,受理并进入事件处理流程。服务台需要收集以下信息: 1. 来电客户的单位名称、联系人、电话号码等基本信息。 2.
影响业务的具体原因、故障现象以及所属优先级。
请求记录和分类
根据事件报告的信息,一线支持记录《客户服务受理单》,通过电话方式需要询问客户详细的事件描述,然后根据用户的描述判断事件的分类、优先级等信息。
如果事件是关于供应商的问题,根据合同协议,直接转三线支持。若事件比较重大且优先级为重要紧急,则需要报告项目经理。
热线电话尝试解决
一线支持人员受理事件后,首先根据用户所描述故障情况,参照《知识库》,对用户进行相应的指导解决。
远程解决
一线支持人员无法通过电话指导客户解决的事件,在征得客户同意的情况下,可以采用远程工具,登录客户计算机来操作解决。
26
现场解决
一线支持人员无法通过电话或远程协助客户解决的事件,需要到现场协助用户解决问题。
二线支持
经一线支持人员尝试解决无果或经判断不属于一线支持能力范围内的,提交二线支持解决。
工程技术部和软件开发部:负责解决客服工作遇到的疑难问题,并分析其问题原因。
公司管理层:负责客服人员新增、各种配套服务设备添加的审批,并牵头解决重大的故障或者服务中产生的纠纷问题。
服务响应
参照SLA服务协议执行。
调查诊断
现场服务人员(一线、二线、三线)在现场通过标准配置进行比对等方法对故障进行分析,查找出故障原因。
确定解决方案
技术服务人员根据故障分析结果确定解决方案,并与客户沟通执行解决方案所需要的时间,确定解决方案的可行性。若发生的事件一时解决不了, 需要与客户约定解决时间。对于重大故障(故障等级为高或中)须做好数据备份。
27
若故障处理时涉及一般、重大、紧急的变更,转变更管理流程,参考《变更管理程序》。
事件解决后,故障现场负责人分析若属于影响重大或经常出现的问题,需要通过问题管理进行彻底解决的,转问题管理流程,参考《问题管理程序》。
客户确认
待事件处理完毕,需要与客户确认,并以抽样形式进行用户满意度调查。
资料归档
技术支持人员将《客户服务受理单》进行归档。将《客户服务受理单》存档。配置核对更新
当事件处理后配置项属性需要变更时,则由一线支持提交配置管理负责人进行配置项修改,修改该支持项目的应用系统配置信息,参考《配置管理程序》。
热线关闭
当产生新的解决方案时,需要提交到知识库,对知识库进行相关的维护,该技术服务结束。
服务报告
事件管理负责人按每月对事件进行总结并分类,并将报告发给项目经理。 事件报告内容包括:
1. 本月事件总数。 2. 本月服务响应总数。
28
3. 二线支持解决事件总数。 4. 三线支持解决事件总数。
IT系统运维服务项目问题管理
目的
1. 问题管理流程的根本目的是消除或减少系统运行环境和客户服务过程
中事件发生的数量和严重程度,防止相同事件的再次发生,从而为济源市电子政务办建立一个稳定的系统运行环境,提高客户服务的可用性。 2. 分析并确定事件的根本原因,找到最终解决方案,以防止此类事件再次
发生;
3. 确保问题分派了正确支持人员,提高解决率; 4. 根据问题优先级合理分派IT资源;
5. 对事件记录做趋势性分析,主动提供预防性措施。
过程测量指标
1. 问题数量 2. 问题解决率
运维项目经理每月对问题处理进行监控和度量,收集问题处理数据,分析统计问题数据,编写《问题报告》。
29
问题管理流程
问题确认与受理
问题来源:
1. 不能查找出原因的事件需要上升到问题管理; 2. 以往没有发生过的事件需要上升到问题管理;
3. 通过对事件的趋势分析得出需要彻底解决的问题,如重复发生的事件; 4. 通过监控或巡检得出的问题。
问题可以从事件管理流程、售后服务和趋势分析等方面发现问题,可以通过事件提交与其相关联的问题记录。
问题登记和归类
一线运维工程师发现问题后,经过分类整理,及时填写《问题记录表》,提交到问题管理负责人。
派单
问题管理负责人接到《问题记录表》后,分派问题负责人,问题负责人员成立问题分析小组。问题负责人必须保持问题的跟踪,直到问题关闭。
问题调研和分析诊断
问题负责人召集问题分析小组对问题进行调查研究,尝试让问题重现,找出问题产生的根本原因并制定解决方案,或采用变通方法,或采取相关的预防措施等,将问题的影响降至最小。
30
确定临时措施
1. 当问题查找出原因以后,可以作为已知错误,同样的故障就可以作为事
件管理来处理,事件处理过程参照《事件管理程序》。
2. 当相同的故障连续不断地发生的时候,并且严重影响应用系统的不可用
性时,问题负责人必须首先采取临时解决措施,首先恢复系统的可用性,以降低影响。
3. 问题负责人经过分析判断,如果由于资源不足, 不能解决问题(包括软
件资源、硬件资源、技术资源等方面),则把问题提交到三线支持(内部或外部供应商)解决。问题负责人把问题提交三线支持后,还必须负责继续跟踪问题状态,直到问题关闭。
确定解决方案
1. 问题负责人及问题分析小组通过问题分析,有了解决方案后,补充完善
《问题记录表》,并进行评估,确定是否需要通过变更管理实施该解决方案,变更实施完成后回到问题管理进行问题回顾和评审。 2. 变更管理参照《变更管理程序》。
问题回顾和评审
问题管理负责人召集问题负责人及相关人员对整个问题的解决过程和结果进行回顾和评审,验证问题解决的效果。如果是属于重大问题的,还要组织评审会议,可能还需要邀请用户代表参加。补充《问题记录表》,形成《会议纪要》。
31
问题归档
问题负责人对问题解决过程中涉及的资料进行归档,并把问题解决方案加入到知识库中。
问题关闭
确认问题已经得到解决,所有资料已经归档后,问题负责人员负责关闭问题。
问题报告
问题解决后,一个月内收集如下信息,形成服务报告: 1. 本月问题总数量; 2. 本月已解决的问题数量; 3. 本月未解决问题数; 4. 本月问题分类情况;
5. 分析本月问题所造成的影响及范围。
IT系统运维服务项目变更管理
目的
变更管理的目的是保证变更在受控方式下正确评估,批准和实施。减少和杜绝非授权变更,降低变更风险和对业务的影响。
32
变更级别及定义
变更级别 定义 简易变更 简易变更是指在维护过程中对系统或服务所做出的各种改变,包括增补、移除和其他修改。说的再具体一点,变更的对象是两个,一个是IT基础架构,一个是IT服务(包括与流程和文档),与这两个对象相关的改变都要归入变更的范围。 标准变更 一线支持接到客户热线,直接作为事件处理,事件解决过程中涉及变更,直接实施。 重大变更 重大变更类似:服务器设施变更、通讯组网结构变化、批量数据的更改、系统大版本升级等 这类影响面广,系统一旦不可用,用户反映强烈。要有详细的变更方案、步骤、计划、时间安排以及回退步骤等,而且方案需要经过部门经理、公司主管领导的审批。 重大变更需在提交变更记录,经过各级审批后,由运维组根据方案执行变更。 紧急变更 紧急变更包括:指影响关键业务系统正常运行的紧急事件、实施时间紧急的重大变更。由于时间紧迫,变更方案由双方领导直接审核后执行。 变更流程描述
变更确认受理
由事件管理流程、问题管理流程、第三方提出变更请求,变更负责人确定是
33
否需要受理变更。
变更记录和分类
若接受标准、重大变更申请,变更负责人或申请人填写《变更记录表》。 变更负责人必须确定该变更请求的类别和优先级以便按照不同的流程执行后续变更动作。
变更分类执行
根据变更的不同类型,分别执行不同的变更流程,有标准变更、重大变更。 变更回顾
实施变更后需要作变更回顾,要由变更管理负责人从技术和流程角度去回顾变更,确保变更得到了预期效果,对变更加以评定,并寻找流程的改进机会。
变更关闭
变更实施人员关闭变更请求。
变更报告
变更管理负责人每月对变更数量进行统计,对变更过程存在的问题进行分析,形成变更服务报告。变更的度量指标包括: 1. 各种类型变更的数量; 2. 变更期间的服务中断时间;
3.
计划时间内完成的重大变更百分率;
34
4. 未达到预期结果的变更数量。
IT系统运维服务项目发布管理
目的
1.
确保与运维服务项目中软件系统的发布是可追溯的和安全的,确保只有正确的、经过批准和测试的版本才能被安装; 2.
在发布的规划和试运行期间与济源市电子政务办进行沟通并考虑他们的期望; 3.
确认所有最终发布软件正本的拷贝是安全可靠的,确保软件的原始拷贝被安全地存放在固定位置以及配置管理数据库得到及时的更新; 4.
确保所有的软件变更都得到发布,而且发布过程是安全和可追踪的。
发布过程
制定发布方案
发布负责人根据变更计划制定《发布方案》,发布方案一般包括: 1. 描述发布的目的和背景; 2. 描述发布影响范围; 3. 确定参与发布的部门及人员;
4. 对客户和服务支持人员的交流、准备、备案和培训; 5.
确定测试、培训、客服支持、现场部署等工作计划;
35
6. 安排部署完成的后续工作计划; 7. 确定在发布失败情况下的退回方案; 8. 可预见问题以及相应的解决方法; 9.
确定与软、硬件有关的配置基线。
发布方案评审
由发布负责人牵头,各发布有关部门负责人参与评审发布方案,评审通过后实施。
构建测试环境、测试和验收
根据方案,在实施之前如果需要内部测试,需要测试人员根据发布方案搭建测试环境。内部测试,包括软件功能测试以及安装流程等方面的测试。测试完成后则完成系统程序的验收。测试和验收结果将在《发布测试报告》中体现。
沟通和培训
系统版本升级部署前,需要对服务支持人员进行沟通、知识更新培训,保障发布后的客服支持工作;需要对企业用户相关人员进行沟通和培训,发布上线通知,使得用户明确软件上线后对其工作有何影响,必要时对用户进行培训。
分发和部署
经过环境构建、测试和试运行后,可进行软件的上线部署工作。系统升级时填写《升级记录表》。
36
更新配置库
发布实施完成后,发布人员更新配置库的配置项信息。 参照《配置管理程序》。
发布关闭
发布实施人员整理发布资料,对资料归档给配置管理员,最后由发布管理负责人关闭。
发布报告
发布完成后,对济源市电子政务办提出的因为升级导致的错误或问题,由济源市电子政务运维组负责人填写《升级反馈表》,收集如下的信息: 1. 发布引起的事件或问题数量; 2.
发布的数量。
对发布数据进行分析,找出存在的问题,并提出纠正或预防措施,编写出《发布报告》,成为服务报告的一部分。
IT系统运维服务项目服务信息安全管理
目的
本程序的目的是在IT运维服务项目中有效管理信息安全。 1.
满足IT系统运行和客户服务中的安全性需求以及合同、法律和外部政策等外部要求;
37
2. 提供一个满足需求的基本的信息系统安全基线;
3.
确保有效的信息安全措施在客户、公司、项组成员三个层面都得到贯彻。
确定安全实施范围
根据安全需求的识别情况确定安全实施范围。安全实施范围包括列为相应安全等级的数据、人员、机房、设备、系统等。
实施安全规范
在设计好安全规范后,日常运维服务项目中需按照安全规范来实施安全管理。
1.
在人员安全方面的实施: 1. 职位说明中的任务和职责; 2. 安全防护;
3.
针对个人的保密协议;
2. 责任划分的实施,以及岗位分离的实施; 3. 书面的操作指示,内部规章;
4.
安全问题涉及整个生命周期,应针对系统开发、测试、验收、运营、维护和终止制定安全指南;
5. 将开发和测试环境与实际的运营环境分离开来; 6. 处理事件的程序(由事件管理负责处理); 7.
恢复设施的实施;
38
8. 为变更管理提供信息输入,病毒防护措施的实施; 9.
针对计算机、操作系统、应用系统、数据、网络和网络服务的安全管理措施的实施;
10. 数据媒介的处理和安全。
IT系统运维服务项目服务可用性管理
定义可用性管理的具体范围、异常判断、维护措施、日常检查、运行操作、巡检、监控、度量和诊断技能等内容及过程;
目的
提供符合预定可用性级别且成本合理的IT服务,以帮助运维组实现其业务目标;确保已经取得的可用性级别能够得以评价和计量,以及在必要时进行持续改进。
范围
1. 软件信息:参考软件服务范围清单的核心系统软件; 2.
硬件信息:参考硬件服务范围清单的核心系统硬件;
过程测量指标
1.
平均无故障时间(MTBF);
39
2. 平均系统事件间隔时间(MTBSI)表示的可用率(或不可用率); 3. 总体正常运作时间和宕机时间; 4. 故障的次数;
5.
平均修复时间(MTTR);
服务组件设计
服务组件监控设计
所有IT组件都必须按照计划进行有关监控活动。有计划的监控活动可以: 1. 及时发现IT组件的健康状况。
2.
找出系统运行存在的薄弱点和风险隐患。
服务组件维护设计
1. 所有IT组件都必须按照计划进行有关维护活动。有计划的维护活动可以使IT
运维组能够: i.
实施预防性维护以避免故障的发生。(如运行系统的日检查制度、月检查制度、巡检制度等方面制度文件建立) ii. 及时进行软件和硬件升级以提供新的功能和额外的服务能力。 iii.
根据业务需求对IT基础设施实施必要的变更。(如业务数据库容量随着数据量的增加,遇到相关瓶颈,需要超范围的购买相关设备解决,需走变更管理)
2. 计划性维护活动涉及的首要问题是计划停机时间。
40
3. 在确定新增或改进后的IT服务的可用性需求时,需要明确计划性维护所需的
停机时间以及由此导致的收入方面的损失。
4. 在IT服务1天24小时或一周7天都必须正常运作的情况下,可用性管理就必须
在权衡计划停机时间需求和相应的业务损失之后确定最优的维护方案。
服务组件恢复设计
1. 确保IT服务故障发生后,IT服务能在最短的时间内得以恢复以使正常的业务
运营继续进行。
2. 构建一个对故障具有高度弹性的IT基础设施即使不是不太可能,也可能会造
成成本过于高昂。因此,在给定的成本约束下,IT基础设施满足可用性需求的能力常常取决于可以对IT服务故障进行及时有效恢复的能力。 3. 设计恢复计划考虑因素:
a) 确保业务与技术恢复流程是正确的。 b) 清晰定义负责主要事件的员工的职责。
IT系统运维服务项目服务能力管理
1. 对资源性能指标进行监控、分析和通报,并能识别改进措施;
2.
根据监控的资源提供能力数据资源的预测,提出升级计划及备件采购计划;
41
3. 对系统响应时间等能力指标进行监控,建立基线进行对比分析;
IT系统运维服务项目服务持续性管理
1.
建立持续性管理流程,包括业务影响分析、风险评估、应急方案建立、实施、运行和监控等活动; 2.
对业务持续性实施方案进行测试、演练和评价,并保持有关记录;
IT系统运维服务项目服务成本管理
1. 建立服务项目的预算和核算程序; 2. 制定服务成本的分类方法和标准;
3. 对项目财务支出进行监控、分析、评价和报告;
IT系统运维服务项目服务报告
1. 制定服务报告管理流程;
2. 识别服务报告的频度、内容等有关要求; 3. 服务报告中体现服务得绩效指标;
42
IT系统运维服务项目客户沟通管理
1. 制定与客户沟通的策划和执行;
2. 对客户的建议采取有效措施,并跟踪记录实施; 3. 与客户沟通建立正式的记录表;
4.
与客户一起评审SLA服务级别的达成情况;
IT系统运维服务项目项目质量检查
1. 项目组内部建立项目质量检查机制; 2. 根据检查结果执行服务过程改进;
43
因篇幅问题不能全部显示,请点此查看更多更全内容