近日,中国移动智慧网络人工智能开放创新平台新发布了 8 项 AI 精品数据集,为网络 +AI 能力研发孵化提供亿级规模核心资源。本次上新的系列数据集包含了中国移动自建的现网特色数据,以及携手新华三、北京邮电大学等产学研合作伙伴共同打造的网智精品数据,涵盖了网络规建维优营多场景和网络智能化 4+X 能力体系,为促进网络“AI+”转型创新研究持续提供强有力的数据支撑。
围绕网元智能、运维智能、服务智能三大领域,新增开放 8 项上亿规模网智精品数据集,支撑网络 AI 能力研发。
安全事件态势****感知
科学数据 DOI 编号:10.12448/5e0p-cr72
数据集为新华三技术有限公司提供,包括日志分析、机器学习、UEBA(用户和实体行为分析)和云端情报等领域 2 个月、近 15000 条样本,涵盖事件名称、事件描述、源目 IP、事件等级、发生时间、攻击阶段等重要信息。该数据集可用于训练主机安全状态预测模型,有助于帮助识别安全风险、提高安全防护能力,并采取适当的响应措施,以保护网络和系统的安全。
CSI 实测数据
科学数据 DOI 编号:10.12448/3cc1-w648
原始信道矩阵数据通过真实终端设备在现网商用场景(以室外空旷场景为基础,囊括自由空间场景和通话场景两种不同模式)中采集得到,通过设置多测试点位、多旋转角度,拓展数据的全面性、多样性和实用性。该数据集样本量近 7500 条,填补了现有理论模型和仿真工具无法涵盖的现实场景中的信息空白,为通信技术的研究和应用提供更准确、更全面的数据支持。
上行干扰识别
科学数据 DOI 编号:10.12448/3d9r-w746
数据集基于现网多月份的北向网管干扰数据,结合一线工单生成小区天级平均上行干扰值和相应的干扰类型。该数据集包含近 15000 条样本,涵盖 273 个 PRB 干扰特征和 13 种干扰类型(一个样本可以对应多个不同的干扰类型),可用于训练识别干扰的分类模型,从而针对性地优化网络资源配置、提升通信质量、保障信息安全。
容器网络性能指标
科学数据 DOI 编号:10.12448/7ki5-c838
数据集基于 5G 云原生仿真网络生成,通过向 5G 网元注入多类型的网络故障,模拟了多网元多类型的故障场景,覆盖了 AMF/SMF 等 7 种不同网元,网络延迟、CPU 负载等 6 种不同故障类型,共计 42 种故障、1000 多个故障实例。该数据集包含 27 个通用性能指标和 12 个网络性能指标,数据量级达 106 万。
网络长期流量预测
科学数据 DOI 编号:10.12448/3fp4-w20j
数据集提供了现网 3 个地市、超过 800 天的详细小时级网络流量数据,样本量超 10 万条,同时提供节假日时间信息,为揭示网络流量变化的规律和趋势提供辅助信息。该数据集可以用于训练长期流量预测模型,基于对网络流量的精准预测,为网络规划、容量规划、资源配置、业务优化等决策提供有力支持。
网络路由智能选择
科学数据 DOI 编号:10.12448/5sr3-w63j
数据集为北京邮电大学《智能信息网络》课程组提供,包括网络拓扑数据和业务数据,前者详述了一个包含 14 个节点的 WDM 网络拓扑, 后者中包含基于现网真实基站数据生成的业务源、目的节点以及业务带宽需求数据。该数据集可用于训练智能路由算法模型,帮助灵活适应各种类型业务时空特性的变化,降低开启波长数,提升传输网络资源利用率。
网络流量智能分类
科学数据 DOI 编号:10.12448/5tc2-t826
数据集为北京邮电大学《智能信息网络》课程组提供,包含近 3000 条业务流量数据,覆盖P2P、FTP-DATA、MAIL、WWW 四种流量类型,每条记录都包含诸如服务器和客户端端口号、IP数据包间隔时间统计特征等十个关键属性。该数据集可用于训练业务智能分类模型,为网络管理提供有力的工具。
AI 空口信道仿真数据
科学数据 DOI 编号:中国移动智慧网络人工智能开放创新平台
数据集为北京邮电大学 - 中国移动研究院联合创新中心提供,面向 6G、支持 6G 大规模 MIMO 近场、高速移动等新特性,可实现多区域、多天线、多频段、多链路等灵活配置,根据不同需求为用户灵活提供相应信道参数,目前覆盖了 3.5GHz、28GHz 和 60GHz 频段,数据量级超上亿,为无线通信领域提供丰富的信道数据资源。数据集包含两种类型文件,ds 文件和 power 文件。
样例数据如下:
小结
本次开放的多方联动共建的系列 AI 数据集,充分展现了中国移动在推动行业数据沉淀及共享上的专注与努力。截止目前已累计开放 15 项数据集,带动 50+ 高校和企业、300+ 团队开展 AI 算法创新活动。未来,中国移动将携手更多产学研合作伙伴,依托智慧网络开放创新平台持续建设并开放更多优质网智数据集,为网络“AI+”转型创新研究奠定坚实的数据基础。
历史开放数据集介绍
数据集
标签
数据规模
科学数据 DOI 编号
无线侧故障根因分析
诊断、维护
346万
10.12448/3ts8-w739
无线小区多指标时空序列预测
预测、运营、优化
上亿
10.12448/3s6s-w713
无线链路质量预测
预测、感知、优化
4万
10.12448/3l3e-w818
算网异常检测及故障定位
感知、诊断、维护
49万
10.12448/3cd8-n921
光网络哑资源合规检测
感知、维护、资源
2万
10.12448/3dd9-t410
网络拓扑优化
决策、优化
10万
10.12448/3tt2-t806
CSI压缩反馈
预测、优化
60万
10.12448/3cf5-w835
中国移动发布 7 个高质量网络智能化开放数据集
10.12448/3cf5-w835
开放网智数据集服务入口:
https://jiutian.10086.cn/open/#/setlistplatform=OpenInnovation
版权归原作者 网智圈--一起AI赋能网络 所有, 如有侵权,请联系我们删除。