杨澈洲 王斯 张国浩
摘要:针对模型的输入数据优化问题,本文提出一种基于互补集总经验模态分解(complementary ensemble empirical mode decomposition,CEEMD)小波联合去噪的神经网络碳排放预测方法。首先,采用CEEMD小波联合去噪对数据进行去噪提纯;其次,运用优化后的训练样本和输入数据建立碳排放量预测模型;最后,以“一带一路”主要经济体碳排放量为例,运用改进模型和传统模型分别进行试验仿真。仿真结果表明:经CEEMD小波联合去噪后的时序数据纯度更高,更加平稳;改进后的模型预测拟合效果更优、误差更小。此外,本文进行碳排放外推预测,结果表明:使用CEEMD小波联合去噪联合反向传播(back propagation algorithm,BP)神经网络、模糊神经网络模型在预测中具有可观的容错性能及精确度。
关键词:CEEMD小波去噪;BP;模糊神经网络;碳排放预测;数据预处理
中图分类号:TP302;X321文献标志码:A
随着碳排放与日俱增导致全球气候变暖从而对人们生活发展产生了直接而恒久的负面影响。因此,站在国家层面而言,科学地预测碳排放量走势并积极制定相关政策,进而实现绿色可持续性发展开始变得至关重要[1-2]。
能源消耗碳排放影响因素研究是预测未来能源消耗碳排放量的一个重要基础。能源消耗碳排放影响因素研究主要是为了探讨能源消耗碳排放与其影响因素之间的关系,主要包括人口规模、产业结构、经济产出、能源结构、运输结构、技术进步等因素。随着中国节能减排工作的积极开展以及低碳化的推广,许多学者对碳排放问题予以关注和研究,对碳排放影响因素的研究成果也逐渐增多。亓伟[3]运用可拓展的随机性环境影响评估(stochastic impacts by regression on population affluence and technology,STIRPAT)模型以及通过马尔可夫过程,从静态和动态两个方面研究收入与二氧化碳排放的关系,同时,在确定收入水平是影响二氧化碳排放量的主要因素后,重点研究收入水平与二氧化碳排放量之间的转移机制;ZHONG等[4]分析了“一带一路”沿线30个国家的国内生产总值(gross domestic product,GDP)与人口和碳排放之间的相关性,结果表明:GDP、人口和碳排放呈现总体上升趋势,三者间的变化显示出显著的相关性,GDP与人口和碳排放之间的相关性非常高;杨立国[5]针对GDP、碳排放、货物贸易出口额运用协整分析进行研究,结果表明:从长期直接效应来看,货物贸易出口和GDP与单位GDP碳排放存在相关关系。
機器学习模型由于其良好的性能被许多学者广泛用于数据预测与分析[6-8]。目前智能神经网络作为机器学习的一种经典方法被引入到碳排放预测领域。王珂珂等[9]使用灰狼-极限学习机(whale optimization algorithm-extreme learning machine,WOA-ELM)对神经网络模型进行优化,克服了算法容易陷入局部最优解这一问题并提升了预测模型的准确性,但忽视了对模型输入端数据的处理环节。DURSO等[10]基于自回归模型,结合模糊聚类对空气污染监测网络信息进行检测,优化了检测模型,减少了检测空气污染所需的经济成本,但其仍然忽视了对模型输入数据的一些适当处理。适当对数据预处理将有效提升预测模型的准确性。纪广月将灰色关联分析与BP神经网络结合使用[11],使用灰色关联度分析找到影响碳排放的重要因素,并将重要因素按序排列搜集数据后加入神经网络模型进行预测,有效提升了神经网络的训练速度,并且达到了良好的预测效果。蒋能超[12] 采用CEEMD联合小波去噪对数据进行预处理,从而提升了模型对中国宏观经济景气指数的预测精确度,但其在构建指标体系时未能详细说明影响中国宏观经济景气指数的重要因素。
受文献[9-12]的启发,本文做出了以下几点贡献:第一,根据已有文献,构建出适合本文预测的指标体系并采用灰色关联度方法进行分析;第二,通过CEEMD对数据进行分解并找到合适的阈值函数对分解数据进行处理,从而形成CEEMD联合小波去噪对数据进行预处理;第三,通过将预处理后的数据与未进行预处理的数据输入神经网络模型并对比验证基于CEEMD小波联合去噪的神经网络模型的优良性;第四,对碳排放进行合理地外推预测,并提取一些相关建议。上述研究对碳排放影响因素进行了探索,对数据预处理方法进行了改进,对助推碳排放预测工作、制定相关政策,进而实现绿色可持续性发展有着重要的意义。
1指标体系构建及灰色关联分析
1.1构建指标体系与数据来源
1.1.1构建指标体系
本文根据碳排放量驱动因素的种类,将影响碳排放的一系列指标作了如下几类区分:资产水平分为人均GDP、固定资本总额;人力资源水平分为城市人口、劳动力;实体经济水平分为工业增加值、货物进出口,指标及对应含义如表1所示。
1.1.2数据来源与描述
从世界银行、美国能源局、世界能源署获取历经25年13个国家8个变量的数据。由于数据的可得性,少量数据存在缺失值,本文采用随机森林填充法进行填补所有缺失数据。得到四大经济体25年的能源消耗碳排放总量,除2016年左右有小幅波动,其余年份均呈上升走势,能源消耗碳排放总量时序图如图1所示。
1.2灰色综合关联度分析
灰色关联分析法是一种多因素统计分析的方法。通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了数据间的关联程度。因此,常用于量化评价不同影响因素之间的关联程度及指标体系合理性。由于各指标之间的单位不同,所以本文先对各指标数据进行归一化处理,再分别计算各影响因素的关联度。通过对归一化数据进行关联度分析可得四大经济体的城市人口、人均GDP以及劳动力关联度均在80%以上,说明这三个指标与碳排放量有较大的关联度。其余各指标之间关联度均在60%以上,这反映出本文选取影响因素与碳排放量有较大的关联度,说明本文体系构建良好。各指标关联程度表如表2所示。33207F7F-5A67-453B-9785-0D27C4D9F5DC
2CEEMD小波联合去噪
CEEMD 在分解信息时会抑制高频有效信息、小波去噪在抑制大部分噪声时会消除部分小幅度有效信号。本文考虑联合使用CEEMD与小波去噪,首先,对原始信号采用 CEEMD分解获得多个信息分量;其次,选用硬阈值函数小波变换进行多尺度分解,对各尺度数据进行去噪处理,消除大部分CEEMD加入的随机噪声;最后,重构并输出处理后的信息。
2.1CEEMD分解得到信息分量
对25年四大经济体能源消耗碳排放进行CEEMD分解处理,分为如下三步:
2.2小波去噪对数据进行提纯
选择适当阈值函数对多尺度数据分量进行分解、去噪并重构输出。主要方法如式7所示,其中,α为尺度因子,它可以伸缩基本小波φ(t)函数波长;τ表示小波位移后的大小。
为了选取适应本文数据的小波函数对数据进行去噪处理,现对硬阈值函数、软阈值函数、固定阈值函数处理后的数据特征值进行对比。结果表明:硬阈值处理数据的信噪比SNR远大于另外两种函数,同时硬阈值处理数据的均方根误差RMSE远小于另外两种函数,说明硬阈值去噪后的数据层次区分更清晰,各层中数据与数据有较强关联性。因此,本文选择硬阈值函数对分解后加入噪声的数据进行去噪处理。三种阈值处理数据的SNR与RMSE如表3所示。
为了说明CEEMD小波联合技术对数据进行预处理,在挖掘数据深层次性质的同时并不影响数据本身的一些基本性质。现将预处理前后数据的三个特征值进行比对,数据特征值对照如表4所示。
根据表4可得,处理后数据无论是平均值还是标准偏差亦或是标准误差平均值都与原始数据无太大差异,这种差异在小数点百万分位后才体现出来。说明数据预处理对数据的基本性质没有太多改变。由此说明预处理后的数据对数据基本性质的影响较小,这保证了下文对数据分析的科学性与有效性。
3改进神经网络模型预测分析
3.1改进模型预测
通过灰色关联度分析建立合理的指标体系,以及对能源碳排放的时序数据作CEEMD小波预处理,得到良好的数据。由于BP、模糊神经网络模型常常被用来进行预测数据处理,因此,本文建立了基于CEEMD小波去噪的BP神经网络模型、模糊神经网络模型,设置测试集从2014至2019年对“一带一路”沿线国家或经济体的能源消耗碳排放进行预测,并以平均绝对误差MAE、均方误差MSE作为训练模型评估指标。以中国为例,BP神经网络模型与CEEMD小波-BP神经网络模型预测对比如图3、4所示。
结合图3与图4可以得到,CEEMD小波-BP神经网络模型对数据进行预测结果从2014年呈现出小幅度下降直至2015年起持续上升趋势;预测误差到2015年起开始迅速上升直至2016年起开始缓慢下降。相比于BP神经网络模型,改进的BP神经网络模型拟合曲线更贴近原始数据,预测误差的极值也远小于BP神经网络。
以中国为例,模糊神经网络模型与CEEMD小波-模糊神经网络模型预测对比如图5、6所示:
结合图5与图6可以得到,CEEMD小波-模糊神经网络模型对数据进行预测时,拟合的预测曲线从2014年起开始缓慢下降直至2016年开始持续上升;预测误差曲线在2016年达到顶峰。相比于传统模糊神经网络模型,改进的模糊神经网络模型拟合曲线更贴近原始数据,从2014年至2019年的预测准确性均优于传统模糊神经网络模型。
为了进一步反应基于CEEMD小波去噪改进后神经网络模型的优良性,本文针对MAE与MSE对BP、CEEMD小波-BP、模糊神经网络、CEEMD小波-模糊神经网络进行对比,对比结果如表5所示。
通过表5可得,基于CEEMD小波去噪预处理后的BP神经网络模型与模糊神经网络模型无论是MAE还是MSE均优于其对应的传统模型。对于MAE,CEEMD小波-BP神经网络模型比传统模型下降了55%;CEEMD小波-模糊神经网络模型相比于传统模型下降了41%。对于MSE,CEEMD小波-BP神经网络模型比传统模型下降近78%;CEEMD小波-模糊神经网络模型相比于传统模型下降近65.5%。
3.2能源消耗碳排放外推预测
基于CEEMD小波去噪后的数据对中国、俄罗斯、印度、东盟的能源消耗碳排放进行外推预测直至2026年,结果如图7至图10所示。
从图7可得,中国未来几年能源消耗碳排放量呈一條光滑曲线,直至2026年,中国碳排放量达到超过16 186百万吨。从图8可得,未来几年俄罗斯能源消耗碳排放量开始减少,直到2026年碳排放量减少到1 728百万吨,期间碳排放量变化曲线有两次明显斜率改变。从图9可得,印度在未来几年印度能源消耗碳排放量开始出现负增长然后负增长率逐渐减小,在2026年前碳排放量走势趋于相对平缓,直至2026年印度碳排放量减小至2 098百万吨,期间碳排放量曲线斜率有一次较为明显地改变。从图10可得,直至2026年,东盟能源消耗碳排放量将达到一个相对顶峰状态,此时碳排放变化逐渐平稳。
从外推预测结果来看:未来几年,四大经济体、中国、俄罗斯、印度、东盟的能源消耗碳排放量平均增长率分别为:3.00%、4.23%、-0.18%、-1.32%、2.15%。中国、东盟能源消耗碳排放量表现出正向增长状态;对于俄罗斯与印度而言,由于长期工业化生产、产业结构失衡导致能源消耗碳排放量出现非正常现象的负增长率状态。2020—2026年期间中国的平均增长率最大,远超四大经济体与东盟,印度的平均负增长率远大于俄罗斯。2020—2026年各个经济体能源消耗碳排放量预测平均增长率如表6所示。33207F7F-5A67-453B-9785-0D27C4D9F5DC
3.3能源消耗碳排放弹性系数
本文引入能源消耗碳排放弹性系数以及能源消耗碳排放弹性系数变化百分比,以此说明外推预测的合理性。根据从世界银行获得的原始数据,设立基期,结合世界货币基金组织发布预测数据,获取2020年至2026年的GDP年平均增长率以及GDP数据,通过计算得到能源消耗碳排放弹性系数,计算得能源消耗碳排放弹性系数表如表7所示。
根据表7可以得出,从2020年至2026年期间,中国能源消耗碳排放弹性系数开始逐渐降低,表明中国能源消耗碳排放总体增势得到有效控制;俄罗斯、印度的能源消耗碳排放弹性系数有正有负;东盟能源消耗碳排放弹性系数与中国类似,能源消耗碳排放弹性系数呈递减状态。
4结论
本文以“一带一路”主要经济体能源消耗碳排放量为研究对象,针对预测模型的输入数据优化问题,提出了CEEMD小波联合去噪与BP、模糊神经网络结合的预测模型。采用CEEMD与硬阈值小波对碳排放量序列进行分解、重构处理,使得处理后时间序列平稳性相比原始信号有较大提高,这有利于提高神经网络预测模型的精确度。该方法相对于传统神经网络预测方法,MAE与MSE有显著下降。可以得出此模型比传统BP、模糊神经网络具有更好的容错与逼近性能,预测精密度较高。该模型在碳排放预测领域提供了一种新的方法,具有较好的理论应有价值与应用价值。
此外,值得注意的是:由于2019年末全球遭受新冠疫情影响,预测使用的碳排放量数据出现大幅波动,故本文仅外推预测到2026年。对于更长远的未来预测,希望留给以后的工作。参考文献:
[1]张帆, 徐宁, 吴锋. 共享社会经济路径下中国2020—2100年碳排放预测研究[J]. 生态学报, 2021, 41(24):
9691-9704.
[2] 张志新, 黄海蓉, 林立. 贸易开放、经济增长与碳排放关系分析:基于“一带一路”沿线国家的实证研究[J]. 软科学, 2021, 35(10):
44-48.
[3] 亓伟. 中国收入水平与碳排放的动态关系[D]. 大连:
东北财经大学, 2013.
[4] ZHONG Y , LIN A , ZHOU Z , et al. Economic development status of the countries along the belt and road and their correlations with population and carbon emissions[J]. Journal of Resources and Ecology, 2020, 11(6):
539-548.
[5] 杨立国. FDI流入、货物贸易出口、GDP和碳排放:基于中国数据的实证研究[J]. 河北经贸大学学报, 2013, 34(1):
53-57.
[6] ONEILL A C, YANG D, ROY M, et al. Development and evaluation of a machine learning prediction model for flap failure in microvascular breast reconstruction[J]. Annals of surgical oncology, 2020, 27(9):
3466-3475.
[7] TIAN C, YE Y, LOU Y, et al. Daily power demand prediction for buildings at a large scale using a hybrid of physics-based model and generative adversarial network[J].Building Simulation, 2022, 15(9):
1685-1701.
[8] KALYAMPUDI P S, KRISHNA P V, KUPPANI S, et al. A work load prediction strategy for power optimization on cloud based data centre using deep machine learning[J]. Evolutionary Intelligence, 2021, 14(2):
519-527.
[9] 王珂珂, 牛东晓, 甄皓, 等. 基于WOA-ELM模型的中国碳排放预测研究[J]. 生态经济, 2020, 36(8):
20-27.
[10]DURSO P, DI LALLO D, MAHARAJ E A. Autoregressive model-based fuzzy clustering and its application for detecting information redundancy in air pollution monitoring networks[J]. Soft Computing, 2013, 17(1):
83-131.
[11]紀广月. 基于灰色关联分析的BP神经网络模型在中国碳排放预测中的应用[J]. 数学的实践与认识, 2014, 44(14):
243-249.
[12]蒋能超. 基于CEEMD-小波去噪的中国宏观经济景气指数预测[D]. 兰州:
兰州大学, 2019.
(责任编辑:于慧梅)
A New Method for Predicting Carbon Emissions of Neural
Network Based on CEEMD Wavelet Joint Denoising33207F7F-5A67-453B-9785-0D27C4D9F5DC
YANG Chezhou, WANG Si ZHANG Guohao
(College of Mathematics and Statistics, Chongqing Technology and Business University,Chongqing, 400067, China)Abstract:
Aiming at optimizing the input data of the model, this paper proposes a neural network carbon emission prediction method based on complementary ensemble empirical mode decomposition (CEEMD) wavelet joint denoising. Firstly, the data is denoised and purified by CEEMD wavelet combined denoising, and then the carbon emission prediction model is established by using the optimized training samples and input data. Taking the carbon emissions of major economies along the "Belt and Road" as examples, the improved model and the traditional model are used to conduct experimental simulations respectively. The simulation results show that the time series data denoised by CEEMD wavelet is purer and more stable; the improved model has better prediction and fitting effect and smaller error. In addition, carbon emission extrapolation prediction is carried out in this paper, and the results show that the use of CEEMD combined with wavelet denoising and with Back Propagation Algorithm (BP) neural network and fuzzy neural network model has considerable generalization performance and accuracy in prediction.
Key words:
CEEMD wavelet denoising; BP; fuzzy neural network; carbon emission prediction; data preprocessing33207F7F-5A67-453B-9785-0D27C4D9F5DC