吴邦毅
摘要:随着数字经济的发展,各行各业对低时延的需求场景日益增多,在这种情况下,传输业务时延的准确性和完整性愈加重要。文章基于OTN光传送网络特性,提出了一种利用人工智能算法优化OTN时延数据与路径规划的方法。该方法通过对历史数据的深入学习和分析,构建预测网络时延变化趋势的回归模型,实现时延数据的快速补全。同时,文章依托完善的资源数据,结合人工智能搜索算法进行最优时延路径规划,为资源优化及路径规划应用提供了广泛而实用的解决方案。
关键词:OTN;
时延估算;
决策树回归;
路由规划;
启发式搜索
中图分类号:TP393 文献标志码:A
0 引言
随着数字经济的发展,客户对于高速率、低时延的网络需求愈加重视,例如自动驾驶、远程医疗、直播带货等。光传送网络(Optical Transport Network,OTN)作为目前主流的通信网络传输技术,可以满足高品质的网络需求。然而,OTN的时延数据缺失情况较突出,无法在售前为客户设计低时延的路径规划,客户的感知度不佳。为了提高OTN时延数据的完整性,更好地优化OTN网络体验,本文通过分析OTN业务的数据关系,提炼影响OTN业务时延的核心特征变量,结合有效的时延数据,提出基于人工智能算法训练OTN业务时延估算模型,来解决OTN业务时延数据缺失及准确性低的情况。系统利用完善的时延数据,研究搜索算法技术,为客户展示并推荐最优的时延路径,推动OTN网络时延可视化、路由智能随选,助力提升通信运营的业务感知。
1 传统的OTN业务时延数据测量及分析方法
1.1 OTN业务时延测量
OTN网络经过近几年的商业化发展,网络规模越来越大,组网场景越来越复杂,业务形态越来越多,逐渐形成了多厂家、多设备、多业务组成的异构型超大规模网络,对于其承载的业务时延测量越来越困难。目前,常用的OTN业务时延测量方法有2种,一种是基于外接仪表的OTN业务时延测量,通过挂接测试仪表实现,该方法存在成本高、效率低等问题,难以在工程现网中规模化使用。另一种是光通道数据单元(Optical Data Unit,ODU)在通道监控(Path Monitoring,PM)、串联连接监控(Tandem Connection Monitoring,TCM)开销中设计了时延测量字节,以随路开销的方式测量业务时延[1]。该方法具有成本低、效率高、风险小等特点,但是较依赖于设备的硬件能力,部分设备不支持该测试方法。
1.2 OTN业务时延估算
鉴于现有OTN业务时延测量方法难以完全实时、全面、准确地进行测量,时延估算成为获取OTN业务时延数据的有效补充方法,常见的时延估算方式有通过匹配同属于一个区域段落或光缆段线路相同的资源,将其通路上承载的业务时延值作为参考,进行时延数据的补全,该方法忽略了不同设备、不同技术的影响。时延估算也可以通过光子网连接(Sub-network Connection,SNC)拼接而成,如图1所示经过的光缆段由SNC1、SNC2和SNC3组合匹配而成,可以利用SNC1、SNC2和SNC3的时延测算出SNCx的时延。
2 基于回归算法实现OTN业务时延数据优化
2.1 OTN业务时延特征
样本数据的质量直接决定了模型训练的效果,特征变量的选取对于数据采集、模型训练和验证至关重要,在OTN网络中,影响OTN业务时延的因素主要为网元间的传输距离,因为光在均匀介质中的传输速率是恒定的[2],所以传输时延与传输距离呈线性关系。光信号在传输系统中进行光交换或光电交换,交换和处理会增加传输的时延,交换芯片的处理性能与设备类型相关,所以时延也受到设备类型的影响。
2.2 构建模型算法
OTN业务时延数据的优化是一个典型的回归预测问题,本文基于决策树算法的回归模型实现时延估算,这种模型凭借其诸多优点在数据预测领域展现出非常好的实用性。决策树回归算法作为一种监督学习算法,不仅可解释性强,能够处理复杂的非线性关系和高维数据,而且训练代价相对较小,运算速度快,这使得模型能够快速迭代和优化[3]。
本文在构建时延估算决策树模型时,关键点在于确定哪些变量对预测时延数据具有显著影响,这些变量在模型中扮演着重要角色,它们将特征空间划分成若干个单元,每个单元对应一个特定的输出值。通过这种方式,模型能够更准确地捕捉时延数据的内在规律和模式。在样本集的处理上,模型通过精心选择输入空间的分割点,将每个区域进一步细分为特征子域。这种划分方式使得模型能够更好地适应数据的分布特性。更为关键的是,模型以每个子域内的样本均值作为该区域的输出值,这一做法充分考虑了样本的集中趋势,从而提高了预测的准确性。
2.3 模型训练与测试
系统在进行模型训练的初期,对样本数据进行加工和整理,局站、机房、设备网元等数据均做标准化的数据转换,将标签值统一转换成机器可以识别的数值。样本数据被精心划分为训练集和验证集,其中三分之二的数据用作机器训练以构建和优化模型;
剩余的数据则作为验证集用于提升验证模型的泛化能力。模型在验证集上的性能评估,主要采用均方误差(Mean Squared Error,MSE)这一指标。除了MSE外,R平方(R-squared,R2)和平均绝对误差(Mean Absolute Error,MAE)等指标也可以同时辅助评估模型[4]。通过多指标的评估,提升模型的预测精度和稳定性。
模型在对训练集进行训练的过程中,会学习如何根据特征预测目标变量的值。模型训练过程中通过生成随机数,灵活地调整树的最大深度、最小叶子节点样本数等,使得模型尽可能地拟合测试集的结果[5],同时还可以通过集成学习来提高模型的性能。经过多轮迭代验证,系统自动选取最优的结果,保存预测模型,预测模型可以不断地更新,提升缺失及异常的时延数据预测准确性。
3 基于启发式搜索算法实现OTN业务时延路径规划
3.1 常见的搜索算法比较
深度优先搜索(Depth-First Search,DFS)和广度优先搜索(Breadth-First Search,BFS)是2种常用的遍历算法[6]。DFS会沿着树的深度遍历树的节点,尽可能深地搜索树的分支,直到找到目标为止。而BFS则从起始节点开始,首先访问所有相邻的节点,然后逐层向外扩散,最后直到找到目标。本文在OTN时延路径规划的搜索研究中发现,当节点较多时,这些搜索算法生成的时延路径非常多,算路时间较长,会消耗大量的计算资源。
启发式搜索则是一种利用问题本身的特性在搜索过程中产生的一些信息,这些信息可以引导寻路搜索更加精准和高效。启发式搜索根据问题的特点和寻路过程中的经验,选择最有希望的方向进行搜索,从而加速问题的求解,并找到最优解。本文在OTN时延路径规划的搜索研究中发现,系统在用启发式搜索时延路径的过程中,可以结合时延业务自身特点,不断地调整时延路径的搜索方向,提升搜索效率。综合以上情况,启发式搜索在路径规划的实现上会更加适用。
3.2 数据采集与数据衍生
系统为了实现OTN业务时延算路,需要做数据样本的采集和衍生。
(1)SNC的基本信息,包括:SNC的ID、A、Z端口、层速率等基本信息;
SNC经过的网元、链路、交叉等数据。
(2)SNC的时延测量值,该值通过挂表测试及网管获得,也可以通过文中所述基于人工智能算法模型预测获得。
(3)地理位置信息,系统根据链路首尾站点的经纬度信息,借助于GIS工具估算站点间直线距离,生成衍生数据。
(4)物理路由数据,包括:通信站点信息;
端到端的站点、机房、ODF成端等基本信息;
光缆、光缆段、局内中继数据。
3.3 启发式搜索解决时延路径规划
启发式搜索算法不同于传统的搜索方式只能盲目地依次搜索路径,而是类似于人类的思维方式,智慧地探索最优的方向,即每次找下一个站点都是评估的所有站点中离目标最近的那个节点,在下一次搜索时,依然选取最优的节点进行搜索,直到找到目标,启发式搜索算法是静态路由网搜索问题中求解最短路径非常有效的搜索方法。因此,为了能省略大量无谓的搜索时延路径,提高搜索效率,本文的时延路径算法是基于启发式算法进行设计,构造搜索算法函数f(x)=h(x)+g(x)。其中,f(x)为评价函数,评价该站点的时延选路优先值。h(n)为启发函数,从当前站点到目标站点的估计时延代价。这个值需要进行估算,本文引入了与目标站点经纬度差值×系数作为公式,估算出从该站点到目标站点的启发时延代价值。g(n)为损失函数,从起始站点到当前站点的时延值,即到达该站点已经产生的时延。
本文在实现规划路径的过程中,首先进行资源数据的清理,筛选符合要求且有空闲通道的站点,这些具备条件的站点组成寻路拓扑网络地图。系统从起始站点出发,寻找周边路径可达的关联站点,将这些站点全部进行时延选路优先值f(x)的计算并保存入堆栈,在堆栈里根据时延选路优先值的大小进行排序,选择时延选路优先值最优的站点,作为新的起点继续进行下一次的搜索,寻找该站点周边路径可达且不重复的关联站点,将这些新增的关联站点进行时延选路优先值的计算并保存入堆栈,系统对更新后的堆栈再次进行时延选路优先值排序,选择时延选路优先值f(x)最佳且不重复的站点作为新起点。不断重复该过程,直到搜索到目标站点。启发式算法的优点就是尽可能高效快速地引导时延选路找到目标。
4 结语
随着数字经济的崛起,传送网络的时延测量面临更高要求,传统方法已无法满足需求。本文提出基于人工智能的OTN时延数据与路径规划优化方法,通过机器学习建立高精度时延估算模型,保障时延数据的完整性和准确性,结合启发式搜索算法实现高效的时延路径规划,不仅提升了客户体验,还为运营商提供了灵活的网络优化手段。未来,笔者将继续深入研究OTN技术,随着技术的不断进步和应用场景的不断拓展,这一研究领域必将迎来更加广阔的发展前景。
参考文献
[1]吴上,邓浩江,盛益强.基于门控循环神经网络的网络时延预测模型[J].网络新媒体技术,2021(6):29-37.
[2]李世峰.基于改进BP网络的时延预测建模与仿真[J].唐山师范学院学报,2022(6):56-69.
[3]苏旭东,衷璐洁.基于BPNN端到端时延预测的多路传输调度[J].计算机工程与设计,2022(1):66-72.
[4]李航.统计学习方法[M].北京:清华大学出版社,2012.
[5]周志华.机器学习[M].北京:清华大学出版社,2016.
[6]肖汉光,王勇.人工智能概论[M].北京:清华大学出版社,2020.
(编辑 沈 强)
Research on OTN delay data optimization and path planning based on AI algorithm
WU Bangyi
(China Telecom Fujian Branch, Fuzhou 350001, China)
Abstract: With the development of the digital economy, the demand for low latency scenarios is increasing in various industries. In this case, the accuracy and integrity of transmission business latency are becoming more important. Based on the characteristics of OTN optical transport network, this paper proposes a method to optimize OTN latency data and path planning using artificial intelligence algorithms. This method constructs a regression model to predict the trend of network latency changes through deep learning and analysis of historical data, so as to achieve rapid completion of latency data. At the same time, this paper relies on complete resource data and combines artificial intelligence search algorithms to carry out optimal latency path planning, providing a wide range of practical solutions for resource optimization and path planning applications.
Key words:
OTN; delay estimation; decision tree regression; routing planning; heuristic search