-
【摘要】铁路运输作为综合交通运输体系的一部分,需要优化升级以满足高质量发展的要求。对铁路短期货运量进行预测分析,有助于扩展货运研究领域,进一步了解铁路短期货运现状,明确发展趋势。文中利用中国铁路月度货运量数据(2017-2024年),通过定量和定性的方法对其影响因素进行综合分析,基于最优参数组合的SVR模型进行预测分析,并以MSE和R2作为评价指标评估预测性能。结果表明,基于sigmoid核的SVR模型对铁路货运量有较好的拟合效果。未来研究可深入分析影响因素指标体系构建、评估现行多样化预测模型以及保证预测精度上简化模型等方面。
【关键词】货运量预测,皮尔逊相关分析,SVR
1引言
经济发展的重要性是毋庸置疑的,在此过程中,不仅需要金钱的流通,更需要物品的流通[1]。铁路运输作为交通运输体系的重要一环,承载了我国主要的人员流动和物资运输,在平衡东西南北经济发展上具有重要意义。为此,国家强调推动铁路高质量发展,充分发挥其作为综合交通运输体系中骨干的作用。然而,当前铁路路网建设不平衡,运输形式多样化还有待加强,并且,国家日益强调绿色物流、降煤减碳的发展要求,因此,铁路运输若要高质量发展,就必须优化升级,实施高效的运输方案,组织货运工作,而铁路货运量可以为相关铁路部门提供科学合理的决策依据。因此,进行货运量预测不仅为铁路部门合理规划运输提供了一种方法,而且为优化运输结构提供了理论指导[2]。
现有研究通过不同方法研究了货运量预测,如严雪晴利用灰色GM(1,1)模型对广东省年度货运量进行预测,并提出了运输结构有待优化的意见[3]。此外,陈鹏芳等利用PCA提取主成分,WOA算法优化LSSVM模型的参数来预测陕西省的年度铁路货运量,得出该模型明显改善了预测性能[4]。徐菲和任爽根据分解-集成方法分解数据,组合ARIMA和SVR模型进行预测,发现与单一模型相比,组合模型表现更佳[5]。然而,既有研究主要分析年度数据,时间跨度大,样本少,难以体现短期铁路运营情况。短期货运量是日常工作计划编制的依据,其准确预测在铁路日常工作组织层面也有十分重要的意义[6]。因此,对短期铁路货运量进行预测具有一定理论价值,更能有针对性地安排线路运输方案,合理调节车辆调度,降低运输成本。
2铁路货运量影响因素分析
2.1定性分析
2.1.1铁路运营对货运量的影响
主要从基础设施和货运方式两个方面来分析铁路运营对货运量的影响。一方面,铁路的基础设施包括线路、车辆等,从线路来看,目前全国铁路路网已基本建成,但东部地区分布较多、较密,西部地区较少、较疏,这一定程度上影响了铁路货运的发展。从车辆上看,铁路车型主要有棚车、敞车和平车等类型,但随着运输市场竞争越发激烈,现有车型需要优化升级,加快快运货车、重载货车等车辆研发,以提升铁路运输效率。另一方面,铁路货运形式日益多样化,可以满足市场需求。传统铁路货运主要运力集中在站到站的大宗货物运输,然而企业和人们对商品运输的要求已经从原来简单的大批量、少批次逐步向小批量、多批次转换[7]。此外,铁路运输常见的是客货共线即同时提供客/货运服务,专门运输货物的专列开设较少。为此,本文针对现代物流市场,铁路创新服务类型,如高铁快运、货物专列等进行分析,旨在扩大铁路货物承运市场,提高运输服务质量,从而在快速、稳定地输送货物方面获得优势。
2.1.2市场环境对货运量的影响
从宏观政策和行业竞争两个角度概括分析市场环境对货运量的影响。宏观政策上,国家高度重视交通运输业的发展,出台了许多政策,对铁路发展具有一定的扶持和推动作用。例如,十四五规划中,强调要建设现代综合交通运输体系,迎合当今世界发展潮流,进一步满足人们的服务需求。此外,如陆海新通道建设、多式联运等发展形式,拓宽了铁路货运业务范围,为铁路货运增添新的生机。同时,国家明确提出“2030年碳达峰,2060年碳中和”的奋斗目标,应调整能源和产业结构,以挖掘节能增效与碳减排潜力[8]。在此发展要求下,铁路货运也不可避免受到影响。此外,由于宏观经济增速逐渐放缓,大宗物资如煤炭、钢铁、金属矿石等产能过剩,处于行业的周期底部,导致铁路货运的需求量呈现下降的趋势[9]。行业竞争上,目前公路货运市场份额遥遥领先,2023年占据了66.91%的市场份额,水路货运仅次于公路,占据15.54%的市场,而铁路货运只占了8.35%,且以往数据中占比变化幅度较小。作为陆地运输的主要方式之一,公路运输路线自由,可有效解决配送“最后一公里”问题,更加切合市场服务需求。而铁路在大宗货物和远距离运输上更具优势,但受线路设置限制,运输灵活性较低。因此,受其他运输方式的影响,铁路货运的市场空间受到限制。
2.2定量分析
2.2.1皮尔逊相关系数
皮尔逊相关系数主要用来衡量两个变量之间的相关性程度,取值范围为[-1,1],如果值大于0,表示两个向量成正相关;如果值小于0,则两个向量成负相关;如果值等于0,则两个向量不相关[10]。其计算公式如下所示:

其中,pXY代表皮尔逊相关系数,X、Y表示变量,D是方差,Cov(X,Y)是协方差。以皮尔逊相关系数取值为正为例,其相关性程度见表1,取值为负的相关性程度类似。
2.2.2数据收集及影响因素筛选
依据铁路货运量影响因素的定性分析并结合已有学者对影响因素的研究,选择铁路货运量(RFV__ 1)、公路货运量(RFV_2)、铁路货物周转量(RFT__1)、公路货物周转量(RFT_2)、原煤产量(RCP)、社会消费品零售总额(GRS)、国内生产总值(GDP)、第二产业增加值(VAS)和铁路固定资产投资(RFA)等影响因素进行皮尔逊相关分析,筛选出与铁路货运量相关性较高的影响因素进行预测,以减小误差[11-12]。数据来源于国家统计局和中华人民共和国交通运输部2017-2024年内的月度数据。由于部分数据缺少1、2月的具体数值,利用季度数据合并计算每个影响因素的1、2月的数据,整个样本只统计分析每年11个月的数据。此外,由于GDP和VAS只有季度数据,为统一数据集,以月平均数据进行分析。此外,考虑数据量级存在差异,如RFV_1单位为万吨,而RFA为亿元。因此,需要对数据进行标准化处理。Z-score标准化方法是数据预处理的常用方法,其可以将不同量级的数据转换到同一尺度进行分析,以消除因为数据量级相差大造成的变量对模型作用差异大的情况,提高模型精度[13-14]。
基于Z-score标准化处理后的数据,使用R软件对影响因素进行皮尔逊相关分析,分析结果见图1。由图可知,除RFA的其他7个变量都与铁路货运量具有较高的相关性。其中,RFT_ 1、RCP、GRS、GDP和VAS的相关性都高达90%以上。而RFA相关性较低,可能是因为投资效果具有滞后性。此外,根据图中结果,所有统计变量都具有显著性(*表示P<5%,**表示P<1%,***表示P<0.1%)。结合上述分析,选择高相关程度的影响因素进行后续分析,即公路货运量、铁路货物周转量、公路货物周转量、原煤产量、社会消费品零售总额、国内生产总值和第二产业增加值。
3铁路月度货运量预测分析
3.1支持向量机回归模型
支持向量回归(SupportVectorRegression,SVR)是基于统计学习理论和结构风险最小化原理发展而来[15]。其能够在有限数据下,抓住关键样本,进行回归分析。SVR基本原理:对于数据集合A={(x1,y1),(x2,y2),…,(xm,ym)},寻找函数f(x)=wx+b在不超过偏差ε内来拟合数据,且引入惩罚系数C控制偏差大的数据,利用拉格朗日函数转化为对偶问题,求解f(x)[13,16-17]。SVR问题求解方程如式(2)-(3)所示。

C为惩罚系数,对出现的损失进行惩罚,损失越多,惩罚越大。l(xi,yi)表示预测值f(x)与观测值yi偏差在ε内,不计损失,否则,计入损失。引入拉格朗日函数,求解f(x)如式(4)所示。

其中,i,ai为拉格朗日乘子,K(xi,xj)为核函数。
3.2基于SVR模型的铁路货运量预测
在对数据进行Z-score标准化处理的基础上,结合皮尔逊相关分析筛选出与铁路货运量高度相关的影响因素,使用R软件通过SVR模型对最终样本数据集进行铁路货运量预测分析。SVR模型的预测精度主要由惩罚系数C和核函数参数γ决定[18]。考虑这些参数过大或过小,会导致模型出现过拟合即可能导致训练和预测效果差异大或者拟合效果不佳的情况。因此,需选择最优参数组合以提高模型的预测效果。考虑数据非线性的特点,利用高斯核函数和sigmoid核函数进行分析,参数C和γ沿用已有研究相关取值范围[2-8,28],利用5折交叉验证选择最合适的参数组合[15]。将处理后的数据70%作为训练集,30%作为测试集测试模型的性能。基于高斯核函数和sigmoid核函数的模型参数组合和预测结果分别如表2、图2所示。为评价模型预测的精准度,选用均方误差(MSE)和决定系数(R2)来评价模型,其中MSE越小,模型精度越高,R2越接近1,模型拟合效果越好。

y为预测值,yi为真实值,yi为平均值,n为样本数目。
从图2可以看出,基于sigmoid核函数的SVR模型的拟合效果显然比基于高斯核函数的SVR模型更好。具体从指标结果来看,高斯_SVR模型的MSE和R2在0.4左右波动,其预测效果较差。而相于高斯_SVR模型,sigmoid_SVR模型的MSE更接近于0,R更接近于1,说明基于sigmoid核函数的预测效果表现最好。
4结论
本文首先对铁路货运量的影响因素进行定量和定性分析,即从铁路运营和市场环境两个方面对货运量进行定性分析,再通过皮尔逊相关分析对影响因素进行定量分析。最后,得出公路货运量、铁路货物周转量、公路货物周转量、原煤产量、社会消费品零售总额、国内生产总值和第二产业增加值都与铁路货运量有较大的相关性的结论。另外,铁路固定资产投资相关性较低,可能是因为投资效果具有滞后性,在当期的数据中影响不明显。在对影响因素筛选的基础上,使用SVR模型对全国铁路月度货运量进行预测效果分析,得出基于sigmoid核函数的SVR模型对货运量具有较好的拟合效果。
但研究还存在一定缺点。首先,影响因素分析简略,精准预测铁路货运量必须控制数据输入的合理性,未来可构建铁路货运量影响因素指标体系,以合理选择影响因素。其次,只分析了最优参数组合下SVR模型对铁路月度货运量的预测效果,但尚未对既有研究中的组合模型预测、算法优化模型等加以分析,模型的多样性决定了不同模型的适用性存在差异,未来可从模型预测效果评估角度分析不同情况下预测模型的选择。最后,本文研究方法简单,而货运量预测研究趋势是向更复杂、更精细的模型发展,针对预测方法多样化和复杂化,未来可以整合预测模型,在保证预测精度的前提下简化问题和方法。
[参考文献]
[1]席少龙.基于PCA-AFSA-SVM的河南省公路货运量预测研究[D].深圳:深圳大学,2019.
[2]YangC,LiX,ZhouP,etal.Researchonrailwayfreightvolumepredictionbasedonneuralnetwork[J].E3SWebofConferences,2020,143:1050.
[3]严雪晴.基于灰色预测模型的广东省货运总量预测研究[J].数学的实践与认识,2020,50(14):294-302.
[4]陈鹏芳,孟建军,李德仓,等.基于改进LSSVM模型的区域铁路货运量预测[J].铁道运输与经济,2022,44(2):59-65.
[5]徐菲,任爽.基于分解—集成的铁路货运需求预测研究[J].运筹与管理,2021,30(08):133-138.
[6]程肇兰,张小强,梁越.基于LSTM网络的铁路货运量预测[J].铁道学报,2020,42(11):15-21.
[7]张诚,于兆宇,刘美玲.新时代铁路货运加速向现代物流转型的动力和举措[J].北京交通大学学报(社会科学版),2019,18(01):10-18.
[8]林伯强.碳中和背景下的广义节能—基于产业结构调整、低碳消费和循环经济的节能新内涵[J].厦门大学学报(哲学社会科学版),2022,72(02):10-20.
[9]宋吉星.煤炭等大宗物资铁路货运的需求发展形势—评«经济转型升级背景下的铁路货运需求研究»[J].矿业研究与开发,2020,40(11):197.
[10]陶洋,祝小钧,杨柳.基于皮尔逊相关系数和信息熵的多传感器数据融合[J].小型微型计算机系统,2023,44(5):1075-1080.
[11]张戎,何羽璐.我国铁路货运量影响因素探析[J].铁道货运,2019,37(11):14-21.
[12]宗会明,黄言,季欣.2000年以来中国铁路货物运输格局演化特征与影响因素[J].经济地理,2021,41(7):128-137.
[13]杨晋芳.基于支持向量回归的煤粉工业锅炉烟气氧含量预测[J].煤质技术,2021,36(4):24-29.
[14]李启文,王治和,杜辉,等.基于高斯分布的自适应密度峰值聚类算法[J].计算机工程,2024:1-12.
[15]陈梓海,黄香香.MC__SVR滚动模型对股票价格的预测研究[J].计算机工程与应用,2024:1-12.
[16]孙玉婷,王映龙,杨红云,等.基于支持向量机回归预测水稻叶片SPAD值[J].科技通报,2018,34(9):55-59.
[17]郑明,李娌芝,官心果,等.基于模糊信息粒化和支持向量机的股票价格回归预测[J].云南民族大学学报(自然科学版),2018,27(6):517-524.
[18]董洁,韩子扬.相空间重构与改进SMA优化SVR的网络流量预测[J].计算机工程与设计,2024,45(09):2796-2804.
后台-系统设置-扩展变量-手机广告位-内容正文底部 |
-
<< 上一篇
下一篇:没有了!