0


新质生产力人工智能+系列1:无线故障根因定位(含任务、数据集、代码、解题思路PPT资源)

在新质生产力高质量发展的要求下,中国移动在“人工智能+”和 “数据要素X”方面不断发力,持续发布高质量电信数据集。围绕网元智能、运维智能、服务智能三大方向建设,涵盖无线信道、基站、云网、核心网、哑资源等多领域,支持感知、诊断、预测、决策、大模型等多类网络AI能力研发的标志性数据集。相关数据集均由智慧网络开放创新平台承载。

中国移动 - 智慧网络新一代人工智能开放创新平台https://jiutian.10086.cn/open/

无线故障根因定位

现网丰富的无线网络运维告警数据和故障工单数据,涵盖130类告警及23类故障原因,数据量级达到460万条。该数据集可用于训练故障根因分析模型,高效快速地定位故障问题,从而减少实际派单数量,优化派单策略,节约人工成本。

下面详细介绍引自智慧网络开放创新平台官网无线故障根因定位介绍页面

任务、数据集、代码资源

特色优势

无线侧故障根因定位任务为研究者提供了丰富的现网历史告警数据和故障工单数据,涵盖了传输系统、动力环境、主设备等 23 类故障原因,为研究者挖掘数据中的模式与规律提供了广泛而全面的视角,这将为无线通信领域带来重要的突破,推动行业的创新和进步!

背景介绍

网络发生故障后运营商将收到大量告警消息,并根据告警消息级别选择性派发故障工单,维护人员根据故障工单到现场进行故障排查及维修。由于告警消息和产生的工单量巨大,传统方式依靠工程师个人经验进行问题定位效率较低,且不同原因的故障往往需要不同的处理措施,如:停电原因造成的设备退服,较大比例可以自动恢复供电,可采取适当的延迟派单策略;软件配置错误导致的故障则需要后台进行处理等。

主题任务

本任务针对现网告警、工单数量大,故障原因定位困难的痛点,希望研究者通过机器学习手段建立模型,将现网历史告警数据和故障工单数据相关联,使用告警数据作为输入特征,使用工单中的故障原因定位数据作为标签,训练一个可以分类传输系统-光缆故障、动力环境-电源线路故障、人为操作-告警测试、主设备-硬件故障、主设备-参数配置异常等 23 类故障原因的模型。研究者需要对给定测试工单的故障原因进行预测,从而减少实际派单数量并进行优化策略派单。

数据来源

本任务提供某省市 2019 年 2-3 月份的告警数据和故障定位工单数据,部分字段已脱敏编码。

数据文件说明

数据集文件名称为 无线侧故障根因分析数据集.zip,包括训练告警数据(3401351 条)、训练故障工单数据(60346 条)、测试告警数据(1212175 条)、测试故障工单数据(6696 条)和提交样例数据。

无线侧故障根因分析数据集.zip/

  • 训练告警.csv
  • 训练故障工单.csv
  • 测试告警.csv
  • 测试故障工单.csv
  • 提交sample.csv

样例数据说明

1、告警数据

涉及告警基站或小区名称告警标题告警发生时间8ce01e5dd92a9ea2da306571bc504c4c射频单元IR接口异常告警2019-3-1 23:27:13a93680044c7aa0634af2b7b924df0055射频单元交流掉电告警2019-3-1 23:27:13a93680044c7aa0634af2b7b924df0055射频单元业务不可用告警2019-3-1 23:27:138ce01e5dd92a9ea2da306571bc504c4c射频单元驻波告警2019-3-1 23:27:13.........

2、故障工单数据

工单编号涉及告警基站或小区名称故障发生时间故障原因定位(大类)1a93680044c7aa0634af2b7b924df00552019-3-1 23:27:13传输系统-光缆故障28ce01e5dd92a9ea2da306571bc504c4c2019-3-1 23:27:13主设备-参数配置异常3c06a4356533941683a67e3e6d20d9eaf2019-3-1 23:27:13动力环境-环境............

数据统计分析

训练告警数据中共出现 18393 个不同的小区,告警数量 Top10 的小区及其告警频次统计如下图:

训练告警数据中共出现 129 个不同的告警标题,告警数量 Top10 的告警标题及其频次统计如下图:

训练告警数据中平均每小时告警频次变化趋势的统计如下图:

训练故障工单数据中共出现 23 种不同的故障原因,各故障原因及其频次统计如下表:
故障原因定位(大类)频次故障原因定位(大类)频次主设备-硬件故障19252动力环境-高低压设备350其他-误告警或自动恢复14320动力环境-电源线路故障259动力环境-电力部门供电8698动力环境-环境199主设备-参数配置异常4794传输系统-传输设备193主设备-设备复位问题3998动力环境-UPS174主设备-软件故障2760动力环境-动环监控系统151动力环境-开关电源1400主设备-其他140主设备-设备连线故障1365人为操作-告警测试136动力环境-动力环境故障536人为操作-工程施工132主设备-信源问题495人为操作-物业原因95传输系统-光缆故障428主设备-天馈线故障85传输系统-其他原因386

运行环境

本任务运行环境主要包括 Python 3.7.6、numpy 1.21.2、pandas 1.0.4 和 scikit-learn 0.24.2 等。

 代码示例

1. 原始数据读取

使用第三方库 pandas 读取本任务提供的 .csv 格式数据,示例代码如下:

import os
import pandas as pd

data_path = '/root/mydata/无线侧故障根因分析数据集'
train_alarm_data_path, train_work_order_data_path = r'训练告警.csv', r'训练故障工单.csv'
train_alarm_data = pd.read_csv(os.path.join(data_path, train_alarm_data_path), encoding='gb2312')
train_work_order_data = pd.read_csv(os.path.join(data_path, train_work_order_data_path), encoding='gb2312')
test_alarm_data_path, test_work_order_data_path = r'测试告警.csv', r'测试故障工单.csv'
test_alarm_data = pd.read_csv(os.path.join(data_path, test_alarm_data_path), encoding='gb2312')
test_work_order_data = pd.read_csv(os.path.join(data_path, test_work_order_data_path), encoding='gb2312')

读入告警和故障工单数据的具体格式请参考数据介绍中的样例数据说明部分。

2. 告警数据和故障工单数据关联

基于一定时间窗(以 1hour 为例)将同一小区的告警数据进行聚合,根据小区名称将聚合后的告警数据与工单数据关联,并对关联结果进行过滤,代码示例如下:

alarm_window = pd.Timedelta('1hour')
train_alarm_data = train_alarm_data.groupby(['涉及告警基站或小区名称', pd.Grouper(key='alarm_occ_time', freq=alarm_window)], as_index=False).max().reset_index(drop=True)
train_alarm_data['alarm_occ_time'] = pd.to_datetime(train_alarm_data['告警发生时间'])
train_work_order_data['fault_occ_time'] = pd.to_datetime(train_work_order_data['故障发生时间'])
train_alarm_work_order_data = pd.merge(train_alarm_data, train_work_order_data, on='涉及告警基站或小区名称', how='inner')

train_alarm_work_order_data = train_alarm_work_order_data.loc[abs(train_alarm_work_order_data['fault_occ_time'] - train_alarm_work_order_data['alarm_occ_time']) < pd.Timedelta('2hour')]
train_alarm_work_order_data = train_alarm_work_order_data.groupby(['工单编号'], as_index=False).max().reset_index(drop=True)

3. 模型训练

基于决策树模型对构建的 X_train 和 y_train 数据进行训练,代码示例如下:

from sklearn.tree import DecisionTreeClassifier

dtc = DecisionTreeClassifier(random_state=2023)
dtc.fit(X_train, y_train)

4. 预测结果输出

输出模型预测结果的样例,代码示例和预测结果样例如下:

import pandas as pd

pred_path = '/root/teamshare/result.csv'
pred_res = pd.read_csv(pred_path, encoding='gb2312')
print(f"example of pred_res:\n{pred_res.head(5)}")

解题思路

有关任务的讨论欢迎大家在评论区交流

有任何问题可添加平台小助手微信 cmri_open 交流

开放创新平台小助手


本文转载自: https://blog.csdn.net/TELCOM17AI4NET/article/details/136715792
版权归原作者 网智圈--一起AI赋能网络 所有, 如有侵权,请联系我们删除。

“新质生产力人工智能+系列1:无线故障根因定位(含任务、数据集、代码、解题思路PPT资源)”的评论:

还没有评论