你的位置:论文发表 >> 论文下载 >> 理学论文 >> 数学论文 >> 详细内容 在线投稿

通信网管系统性能预警的一种改进方法

浏览309次 时间:2014年8月07日 16:10

/靳轶

通过分析目前性能预警中使用的门限阈值判断法及其变种的原理和缺陷,提出一种崭新的性能预警方法,有效降低门限阈值判断法的误告警率。

摘 要

【关键词】性能预警 相关性 门限阈值

目前通信网络网管工作逐渐由被动关注显性的故障告警,逐渐向主动关注网络性能监控发展,通过监控性能变化可以避免出现显性故障,将故障消灭在萌芽状态。但通信网络的复杂度和规模逐渐变大,逻辑关系复杂,给网管监控人员发现网络异常造成了很大的障碍。目前所采用的门限阈值判断法,误判漏判情况较多,极大地制约了性能预警监控的有效性,本文提出一种解决方案,有效提升了性能预警的效果。

1 目前性能预警技术现状

性能数据可以一定程度上表征系统对象的运行状态,对性能数据进行分析并预警也是网络管理的重要工作,出现性能预警并不一定是出现了故障,但能一定程度反映设备提供服务的能力,但过多的无效预警会降低网管监控人员的警惕性,从而使性能预警失去了意义。目前性能预警多采用门限判决的方法,门限包括两种:静态门限算法,趋势算法。不同指标适用于其中一种或者多种算法。“静态门限”是指根据实际指标情况,设定的指标正常范围,它的值是一个固定的值,根据这个固定值设定的边界就是门限。静态门限设置完成后,随着业务的发展变化,是需要进行调整的,但如果人工设置修改,可能会有不及时的情况。一般是采用上周的参考数据算出本周的上下门限。如果超过正常的容忍范围,就会进行告警。那么这种门限本质上依然是静态的。

如图1 所示,对一个指标在24 小时监控周期内设置同一水平的阈值,仅仅适用于波动不大的指标。对于在不同的时间段波峰、波谷差别较大的指标来说,必须针对不同时段设定不同的门限,这种根据不同时段设定合理变化区域的方法被称为“基于历史统计数据的动态基线算法(dynamic baseline algorithm)”。由于这个算法也体现了指标在不同时段的规律性变化趋势,因此,我们又称之为“趋势算法”。趋势告警适应于有一定规律、指标值随时间波动较大、需要通过根据不同时段分别设置门限、进行精确异常发现的指标,但需要网管非常熟悉网络变化规律,及时修正门限值和容忍范围。

2 基于相关性算法的性能预警方法

从上文可以看出,对于变化幅度较大的性能指标,对网管维护人员的要求很高,需要预见未来发生的很多情况,难度较高,因此实际效果大打折扣。为此,本文提出针对每种性能指标,分别算出参数三元组。用这些指标的各自参数三元组一起作为输入,就可以使用门限判决器进行告警判定。

2.1 整体相关性系数M计算

实际上是分析两天对应时间段内的采样数据的相关性(例如使用5 分钟粒度全天共有288 个点,取100 个点的曲线比较)。假设有两组采样值,一组为当前的N5 个采样点(数据集合定义为m),一组为N7 天前的对应时间点的N5 个采样点( 数据集合定义为m'), 计算m m' 的相关系数M(可利用excel 中的CORREL 函数进行相关系数计算),如果相关系数M> 门限, 说明两天对应时段的整体指标特性没有发生明显变化,否则发生了明显变化。设定参考值:N5=100N7=1。当质量长期比较稳定在一个水平的质量恶化,即整体下降,但相关性高的指标下降,系数M 无法发现。

2.2 动态平均差值系数L计算

当质量整体下降一个等级并且变化趋势相同的情况,系数L 能很好地发现。对于指标受用户行为的影响较大,在一天的不同时间点上波动较大。为了较准确的评估,必须有足够的采样点进行平均。考虑到及时性的问题,频度也采用每5 分钟一次。采用本日最新的100 个采样点平均L1 N7 天前的对应100 个采样点平均值L2 进行相减,输出值为指标平均值的差值L

2.3 动态预测系数N计算

当指标瞬时出现波动,接着又恢复正常,前两种比较法无法发现,而这样的监控发现在组数据。N7 天前的数据集合去掉最新的值q,N5个采样点,作为历史x 值的一组数据,使用N7 天前的N5 个采样点的值作为x 值进行线性回归拟合线计算一个y 预测值q'(可使用EXCEL FORECAST 函数进行运算)。本次的采样值q 和计算的预测值q' 相减,得出N。设定值参考:N5=100,N7=1。本系数的引入是为了能实现评估当前时间点的目的,较整体相关性更及时一些,作为一个更快的参考值,但本值的误差可能较大,必须结合其他参数得出的值,进行门限比较组合条件告警。三种预警算法计算出的值,作为输入值,进入门限判决器。对于每个指标分别计算出的三元组,门限判决器对多个指标的系数三元组的MNL 分别设置门限,可根据需要选择和组合,进行组合告警。举例:如彩信中心的监控,设备本身没有告警,业务量相关性三系数均在正常范围之内,端到端成功率的相关性三系数超出正常范围,综合起来,彩信中心本身没有问题,一定是其他经过的网元出现了问题,影响了彩信业务。

3 小结

经过改进的性能预警方法,避免了人工频繁设置门限的缺点,能够自适应网络性能的变化,并且因为输出的是系数三元组,对于系数三元组可以直接使用静态门限判决器,因此与目前的门限判决器有效兼容,降低了实现难度。经过测试,对于像彩信业务这种被动接收式的复杂业务,性能预警的误告警率下降了50% 左右,多次发现隐性业务故障,而传统方式未能有效发现,证明本预警方法达到了预期的效果。

作者单位

河北移动通信公司网管中心 河北石家庄市050035

TAG: 通信网
上一篇 下一篇

论文发表与咨询

论文发表 写作指导 职称论文 毕业论文 客服联系方式:
投稿信箱:lunww@126.com
在线咨询客服QQ:站点合作85782530
在线咨询客服QQ:站点合作82534308
联系电话:18262951856
点击进入支付宝支付(支付宝认可网络诚信商家)
点击进入财付通支付(财付通认可网络诚信商家)
点击进入支付方式---->>>>

论文发表 诚信说明

论文发表 论文投稿 热点图片