电信运维管理发展研究出处:泰尔网 作者:鲁春丛2005-02-03 18:10评论为保障电信网络与业务运行而采取的生产纽?织管理活动称为运行维护管理,简称运维管为保障电信网络与业务正常、女全、冇效运行而采取的生产组织管理活动称为运行 维护管理,简称运维管理或OAM。运行管理侧重于:监视、控制、指挥、协调、调度。 血向网络与业务,璽在实时;维护管理侧巫于软件与便件维护、测试、管理。主要血向 网元,支持业务运行;是非实时性的维护管理。运维管理的基本含义见图I。通网络/条辑网直、 业务壳立 业务保护 路由组织网络瓷源j通网络/条辑网直、 业务壳立 业务保护 路由组织网络瓷源j^tt I. corpC/物理网络!交换网信令网数搦网..传输网 接入网网络运行管理cn网络业务簷理网络资沥爸理业务监视业务保护网络控制网络维护笞理网元监控管理设备燥作维护故陰处理何行测试与维护图1运维管理的基本含义电信运维管理体制与选择电信运维管理体制是根据电信网络运行?维护生产管理需求,结合现冇网管技术条 件,遵循运营整体要求而建立的运维组织机构、人员配置、职责划分、运作流程等各方 血运营要素的管理方式与管理制度的集合。
不同的电信运营公司基于自身经营业务的是 位、网络技术方式、公司治理结构可以采用不同的电信运维管理体制。对电信运维管理 体制的认识和理解可从以卞几个方面出发。1、维护需求运维作业层次人员配直Tier 3重大.疑难问題技术支援网络维护现场维护层技术 支援层U故障处爰 2?维护监控配备非核心 运维人员现场维护:日常巡检?谀件更换尊1.运维作业层次人员配直Tier 3重大.疑难问題技术支援网络维护现场维护层技术 支援层U故障处爰 2?维护监控配备非核心 运维人员现场维护:日常巡检?谀件更换尊1.茨源管理2、3、数据配賈4、5?性能管理“T icr 乙/、/ 网管监控层缶心维员 配核运人各层的职能划分 wwwrcttI;Ti运行监视 数据管理 故饉管理Ti图2维护管理需求?第一层:区域[现场]作业层为运维生产作业层次结构屮的最低层,直接受网管监控层部门的领导与指挥。负责 所辖区域网络设备及基础设施[动力电源、环境、局房等]的现场值守、维护、巡检,接 受网管监控层的调呢指令实施相关故障修复、资源调配的具体实施为操作,对于移动网 络,还包括现场的COT、DT测试等。该层要求人员要具备一定的综合维护技能,乞区 域要保证配备一定数量高技能的人员,指导综合维护人员开展维护工作。
该层的技术人 员为公司运维部门的非核心能力层,视实际情况可以采取一定范围内的外包维护形式。 如:用户线路的代维、光缆线路与管道的代维、基站主体设备与配套设备等的代维、机 房环境的代维等等,网管监控层的部门对其进行?考核。?第二层:网管监控层网管监控层是电信运营公司运维生产作业环节中唯一实施7天x24小时实时监视、 操作、控制的部门,ifli对所管理区域内的各种网络设备进行集中操作维护和网络管理, 対网络资源实施配置调度等。全网绝大部分的故障处理基本在这个层次完成,只有通过 网管监控手段不能完成的生产作业才由区域[现场]作业部门完成。该层的技术人员为公 司运维的核心能力层技术人员。该层次分为网络管理、网络维护两大基本职能。网络管理Hi向网络业务,职能是资 源管理、运行监视、数据配置、数据管理、性能管理、故障管理,必要时对网络进行控 制,保证业务不可用时间(MTBF-mean time between failure)降低到最低程度,体现“集 中监控”原则。网络维护面向网络设备,职能是故障处理、维护监控,保征设备的可用 性,体现“集中维护”原则。?第三层:技术支援层技术支援层是整个生产作业层中技术层次最高的部门,负责对全网备个专业网络运 维中出现的热点难点问题进行技术支援,还可负责面向客户的系统集成等。
技术支援层 内可以按照专业设置分为交换专业、传输专业、数据专业、备品备件等等。该层的技术 人员为公司运维的核心能力层技术人员。该层也可以是设备供应商的技术支持人员。2、运维管理体制形成与演进运营公司的网络涉及交换、传输、数据等多个专业,每一专业网络分成省际层、省 内层、本地层。对于运维组织机构的设置,有两种方式:一种是按照专业组织,即:按 照网络专业划分若干维护管理部门;一种是按照功能层次(网络管理层、网络维护层、 现场维护层)组织;按照功能层次组织比较适合通信网络全程全网的特点,从国内外运 维组织建设的丿力程來看,后一种运维组织方式是普遍推崇采用的方式。针对维护需求在 集团、省、地】]j公司运维部门的不同分配形式,就相应产生了运维管理体制。考虑到集团公司、子公司、分公司体现出不同的管理职责,电信企业的运行-维护管 理体制主要可以分为三种类型,BP:传统型、过渡型、现代型,其主要区别在于维护作 业的集中程度有差异。以上体制中,现代型体制在业务提供能力、业务保障能力、成本 控制能力、综合竞争能力等方iHi具有明显的优势,成为国外较先进电信企业所广泛推崇 采用的模式。运行维护管理体制既受制于电信企业的整体管理体制,又受制于网络及网 络管理技术条件的发展程度以及土管领导的战略思想。
因此在实际电信企业的管理实践 中,不同的电信企业形成了不同的运行维护管理体制,即使在一个电信企业集团内部, 也可能由于各种因索的影响,而采取不同的维护管理体制。国内电信企业基本以分散型 体制为主,这是山我国电信企业特定的发展历史、网络和网管技术现状以及企业整体上 的传统管理体制造成的。三、影响运维管理体制选择的因素1、技术因素首先是通信网络技术,数字化程度提升。其次是网管技术,与计算机技术、通信扌支术同步发展。电信管理网 是一个跨多个屯信管理部门、要管理基础网和多种电信业务网、管理多个网络层次和子网、具有多种网管功能的 综合的网络。这个网络要包括多种与网管冇关的-?系列标准和规范。所以,不同级别的电信管理部门、不同种类 的基础网和业务网(如:电话交换网、IP数据网、移动通信网、SDH传输网等)、不同网络层次和子网(如传输网 中的一、二级干线网、同-?种厂家设备构成的子网)、不同的网管层次(如:网元管理层、网络管理层、业务管理 层、事务管理层)都可以按照TMN的概念、原则、标准和规范来设计网管系统或管理子网。由这些网管系统或管 理子网构成电信管理网。网管管理方迪,比较知名的国际研究组织有TMF(电信管理论坛)和ITU-T SG4 (包括TMN在内的网络管理), 就目前的研究进展速度,ITU?TSG4已经落后于实际运背企业的发展耍求。
TMF的优势在于立足于运营过程提出 相应的管理框架、管理支掠系统建设标准,其提出的eTOM、NGOSS模型在业界产牛了较大的影响。2003年10 月27日71月7 □, ITU-TSG4在日内瓦召开,会议邀请了 TMF组织的成员进行相关的介绍。2、管理因素管理因索,涉及公司治理结构、组织结构的变化、流程的调整筹等。电信运维管理组织是电信运营过程的有 机组织部分,受制于公司大环境的发展。领导的意识、公司管理机制、网络实际宿况、支撑系统能力都会对运维 管理体制的选择产生重要影响。四、国内电信运维管理回顾与展望1、历史冋顾1992年原邮电部提出维护体制改苹思路,中国电信随着网络规模、装备水平、服务水平的迅速提升,本地网 运行维护管理体制逐步宙分散维护向集中维护方式转变,特别是95年以本地网网管中心为代表、97年以本地网 网管维护中心为代表的电话网新型维护体制开始在全国建立,在电话网运行维护方面提出“以网管为龙头、以运 行维护为保证、以提髙接通率为中心、实现集中监控、集中维护、集中管理”为工作指导方针,95年开始,各本 地网陆续开始了以数据局(多媒体局)的成立为代表的数据网维护体制改革,至98年底邮电分营,各本地网基本形 成了以电信处(科)为职能管理、以网管维护中心、数据局(多媒体局)为现场维护作业单位的本地网运行维护架构, 本地网机房基本实现无人或少人综合值守。
1998年底,中国电信全面完成了邮电分营工作,本地网运行维护工作在管理层面发牛-了较大变化,本地电话 网、数据网集中维护管理的基本格局未发牛?变化。在网管系统建设h, 1998年后集中在接入网网管系统、七号信 令监测系统、动力环境监测系统、数据网管系统方血,其它网管监控系统主要是系统功能的完善,未从根本上进 行监控系统整合。2000年,中国电信完成重组,实施政企分开、公司化运作,在运行维护观念上,逐步从被动维护向主动维护 转变,从以前的面向网络设备、网络运行质量向面向网络服务转变,产生了大客户等级维护的方式,开始加强网 络资源管理。总体说来,二十世纪九十年代,全国本地网的运行维护及管理方式一?直处于“变中求进”的状态,通 过摸索和实践,基本形成了“集中监控、集中维护、集中管理”的运行维护格局,网络管理从无到有,基本适应了 网络设备维护的需求。下面是关于中国移动运维管理的悄况;2000年以前,中国移动网管系统的建设思路与网络管理工作基本沿袭 传统的三级管理模式与“分散、分权、分级”的运作机制,所有通信设备的维护工作实体集中在地市分公司这-?层 次上,现业局承担了大鼠的运行维护工作。即:设备维护的第一责任人是地市分公司。
集团公司、省级移动公司 对维护工作只是偏F行政性质的管理;对于网络管理工作,主耍是基本的统计分析、报表等工作。该网络管理模 式已经落后于现代化的移动通信网络环境、网络管理技术的发展,落后于国际上同类的运营公司。网络管理的效 率和优势远远没有发挥出来。总结起来,中国移动在当时的网络管理方面的差距体现在两个方血:一是网络管理 级网管系统的乎段还不够健全;另-方面是网络管理模式相对落后。网管系统是实现网络资源的优化、网络集中 监控管理和调度的必耍手段,是保证通信网络高效、可靠、经济和安全运行的支撑系统2—。结合移动网络的自 身特点,20()0年8月,在全国网络运行维护工作会议上,中国移动提出了建设集中化的两级网管建设方案,即集团公司和省公司两级集中化的网管模式,地市公司级不再另行开发建设相应的网管系统。2000年,中国移动集团公司及各省公司开始建设集中化两级话务网管系统,集中化两级网管系统建设人大推 动了网络运维的集中化管理,为快速生产指挥调度管理提供了保障手段。很多省移动公司将省网管中心与省会公 司集中操作维护中心融合,并赋予省网管中心的生产指挥调度职责,提高了网络的应急反应速度,缩短了故障丿力 时,为全网在紧急情况下快速疏通受阻及拥塞话务打下了良好的基础。
总体发展形势上看,中国移动集团公司、省公司网管中心的职能在发牛变化,网管中心由传统的辅助行政管 理的角色止在转向以牛一产职能为主的角色转变,网管中心已经不再局限于话务分析、报表的范围,而逐步向网络 运行全过程实时的维护、监控、管理过渡,摆脱了原冇的逐级上报方式所固有的低效率,便于及时发现问题和解 决问题,并FL与客户、市场、业务的开展建立起越来越密切不可分割的关系。集团公司、省网管中心正在逐步实 现对各专业网络进行集中监控、性能统-分析、数据统一制作、资源统一调度、网优方案集中制定等为核心内容 的网络牛产指挥调度管理。使得网络管理机构相对集中,减少了管理层次,实现了网络快速的牛产指挥调度管理。 中国移动两级集中化网管系统建设的提出,符合集团公司的支撑系统集中化战略耍求,符合中国移动网络实际悄 况。集中化两级网管系统的建设运行,为中国移动建设现代化、集中化的运维管理体系奠定了坚实的基础。2、展望脱胎于传统的国有大型企业,在迈向现代化运营管理的过程中,中国电信、中国移动、中国网通这些规模庞 大的集团企业,在网络运维管理工作上存在不同程度的问题,有些是战略层血的,有些是管理层面的,笛理层血 的影响有时是致命的。
有的运营公司所提出的发展战略、实施情况已经接近国际先进水平:有的相对落后一些。 但可以认同的一点是:适应公司长远发展的需要,建立现代化的、集约型的运维管理体制是必需的。伴随着体制 变革的不断深入,国内电信运维管理的综合能力也必将进入到另一个新的发展阶段。电信网络借箭综合网管www 电信网络借箭综合网管www .on ly 11 .cn电信行业的发展与变化实实在在的体现在我们牛活屮。io年前,电 信行业处于垄断吋期,电信运营商只局限于将产品摆上货架,等着 客户一抢而空,既没有服务的概念,也没有IT运维的概念。没有 竞争的压力,也就没有进步,10年后的今天,屮国电信、屮国移动、 屮国联通、屮国网通国内四大电信运营商的市场竞争空前,国外沃 达丰这样的世界级运营商也要来屮国分JL 一碗羹,激烈的市场竞争 使得客户服务成为商家的必争之地,灵活多面的资费套餐,遍地开 花的营业厅,花样繁多的增殖业务等等,电信运营商挖空心思”讨 好”消费者。在服务提升到A+水平后,IT运维水平也被提升到了 前所未有的高度。事实证明,在激烈的市场竞争中,IT运维成为了业务收入,发 展潜力的重要保障。试想一下,如果运营商的运维工作不到位,不 够稳定的电信网络将会给您带来多大的不便和怵I扰。
所以,IT运维 是保证电信服务的基础,是提高电信运营商核心竞争力的有效武 器。电信运营商网络运行中心(NOO,普遍采用的结构层次。电信网络的运行维护管理具有全程全网性,每个层次的运行维 护管理部门对应负责不同的运行维护管理行为,按照功能可划分为 以下三层:第一层:现场作业层现场作业层是网络运维结构屮的最底层,直接受网管监控层部 门的领导与指挥。负责所辖区域网络设备及基础设施(动力电源、 环境、局房等)的现场值守、维护、巡检,接受网管监控层的调配 指令实施相关故障修复、资源调配的具体实施与操作,对于移动网 络,还包括现场的COT、DT测试等,分布地域广,跨地域是这一层 的特点之一。我们常见的电信营业厅就属于这一层。现场作业层的网络运维需求主要集屮在对基础设备的报警报表 功能,以及对营业厅营销人员操作系统BOSS, CFM的运行保障。第二层:网管监控层网管监控层是电信运营公司运维牛产作业环节屮唯一实施7天 X 24小吋实时监视、操作、控制的部门,面对所管理区域内的各种 网络设备进行集屮操作维护和网络管理,对网络资源实施配置调度 等。全网绝大部分的故障处理基本在这个层次完成,只有通过网管 监控手段不能完成的牛产作业才由现场作业部门完成。
该层次分为网络管理、网络维护两大基本职能。网络管理面向 网络业务,职能是资源管理、运行监视、数据配置、数据管理、性 能管理、故障管理,必要时对网络进行控制,保证业务不可用时间 降低到最低程度,体现喋小监控”原则。网络维护面向网络设备, 职能是故障处理、维护监控,保征设备的可用性,体现”集屮维护 原则。我们常说的电信机房就属于这一层。网络管理层的网络运维需求比较迫切,需要综合网络运维系统 的支持,來缓解网络工程师的运维压力第三层:技术支援层技术支援层是整个牛产作业层屮技术层次最高的部门,负责对 全网各个专业网络运维屮出现的热点难点问题进行技术支援,还可 负责面向客户的系统集成等。技术支援层的人员主要是设备供应商 的技术支持人员。设备管理是这一层次的重屮之重IT运维管理应该针对不同的分层需求提供相应的功能。现场作业层的IT运维管理需求集屮在桌面管理层面,通过桌面 管理工具来实现,及时发现故障所在进行解决,减少了排查的工作 量和听从上级调配的被动工作模式,有效提高工作效率,降低人为 性故障可能。网管监控层的运维压力最大,取决于电信网络的特殊性,需要 按照需求定制真正面向业务层的网络管理,一般的电信运维工程师 都会口己针对关键业务写一些脚本,加载于系统屮,进行简单的预 警监测工作,但是问题出现在没有集屮的管理平台,容易出现混乱 零散的局面,工作量也没有真正的降低。
技术支援层的运维工作,H前主要还是由设备供应商的技术支 持人员进行,比如千兆的带宽,这种监测水平H前国内的技术还不 能很好的实现,这就需要网络管理的开放性配合。从以上分析可以看出,电信运营商商IT技术密集,但是后台的 网络运维工作还是存在或多或少,或急或缓的问题。在小国现在的 情况,大多数运营商的注意力集中在保证牛产的oss系统上,强调 面向系统的管理。一个电信运营商的后台可能出现儿十个系统,系 统的建设也是支离破碎的。屮国移动成立了 CRM小组,专门运维前 台操作系统,这一点无疑是重要的,业务保障过程的工单流程化, 这个也是网络管理系统得发展趋势。但是FI前比较缺乏的,是面向 运维人员的H常工作的调度,管理,也就是网络管理系统。而对繁 复的网络系统,电信运维人员的工作量是十分沉重的,一套按照需 求定制,帮助后台工作人员完成7X24小时的监测,报警工作的网 络管理系统,无疑是电信网络运维的利剑。针对这个局面,游龙科技的综合网管系统,通过一系列的客户 化定制,将工程师的监测脚本集屮整合在一个管理系统屮,并提供 多个开放性接口。搭建一个平台,将监测、报警、报表整合实现7 X 24小时的IT运维管理,大大降低了业务不可用时间和运维人员 的工作量。
那么怎么才能选好网络管理系统,行之有效的解决目前电信行 业IT运维的问题,成为了摆在每个电信运营商CIO面前的问题。从上文提到的三个层面我们可以看出,电信行业的网络特点比 较明显,它最为显著的特点就是网络规模大且复杂。相应的,电信 行业需要的网管系统对跨地域网络的管理要求非常明显。网管系统 是要帮助网络管理人员实现集屮化监控,集屮化管理,从而保证业 务系统的正常运行。所以我们认为,全国联网,集屮菲代理是关键。集屮非代理式监测将是网管软件今后发展的方向,因为其无需 在被监测对象上安装任何代理软件,对被监测对象的性能影响甚 微,系统的维护和升级都十分方便。克服B/S应用系统的界面操作 以及传输性能低的缺点,采用增量传输和局部刷新的技术,最高降 低应用程序的网络传输压力,达到用户满意的响应速度,轻松实现 对多种操作平台的网络环境进行统一集屮管理。SiteView ECC早在 前几版本就具备了该功能特性。从一台监测主机同时监测几台到几百台服务器,在被监测的服 务器上无需安装任何代理软件即可全而监测服务器的各种资源,包 括CPU内存、服务进程、文件和磁盘分区等。这种监测方式对被 监测服务器的性能儿乎没有任何影响,也可以避免使用代理软件而 引起的一系列潜在安全问题。相对于需要安装代理软件的其他网管 工具来说,可以节省大量的软件安装和配置时间,并节省平时对











