621万vs697万!2026年结婚人数预测你信哪个?
2026年5月9日,民政部公布:一季度结婚登记169.7万对,同比减少11.3万对。那么,2026年全年结婚人数会如何变化呢?今天,我们用三种经典的时间序列模型——ARIMA、指数平滑、季节性SARIMA分别对2026年全年的结婚登记对数进行预测。
一、结婚人数变化与预测方法
1、近十年结婚人数变化趋势
2016—2025年历年结婚登记总量数据变化趋势如下图:
SPSSAU簇状图分析
从2016到2025年,全国结婚登记人数整体呈现持续大幅下降的趋势,仅在个别年份出现小幅反弹,具体变化特征如下:
- 2016—2022年呈持续下降趋势,2022年降至683.5万对,较2016年减少约40%。
- 2023年出现反弹(768.2万对),主要受疫情后补偿性结婚潮影响。
- 2024年大幅回落至610.6万对,创下近年新低。
- 2025年回升至676.3万对,同比增长10.8%,但绝对量仍低于2023年及以前。
2、常见预测方法
常见的结婚人数预测方法主要有以下几种:
- 按第一季度占比推算:根据历史年份Q1占全年的平均比重(通常约24%~27%),结合当年Q1实际值,简单估算全年总量。
- 因素回归模型:纳入人口结构、经济指标、婚育政策等外部变量进行多元回归预测。
- 时间序列模型:利用历史数据的内在规律(自相关、趋势、季节性)建立统计模型,如指数平滑、ARIMA、季节SARIMA等。
本文将使用第三类时间序列模型进行预测。针对结婚人数的预测,指数平滑法、ARIMA、季节Sarima相对比较合适。大家可以留言讨论下自己的看法,顺便学习下时间序列数据预测方法。
二、指数平滑法预测
指数平滑模型通过赋予近期数据更高权重,同时估计水平、趋势和季节分量,能灵活响应最新变化。
1、指数平滑法知识
指数平滑法一般分为一次、二次和三次三种。
- 一次平滑主要适用于数据较为平稳的情况;
- 二次平滑在此基础上考虑趋势变化,适用于存在上升或下降趋势的数据;
- 三次平滑则进一步考虑更复杂的变化结构,常用于同时存在趋势和周期波动的数据。
实际应用中,通常需要根据数据特征来选择合适的模型,而不是简单套用某一种方法。
指数平滑法包括初始值S0和平滑系数alpha两个参数,用于确定预测模型的初始状态和对过去观察值的权重。说明如下表:
参数 | 说明 |
初始值S0 | 样本<10,则取前3期平均值 |
10≤样本<20,取前2期平均值 | |
样本>20,取前1期(第1期)平均值 | |
如果不设置,SPSSAU自动按上述标准进行 | |
平滑系数alpha | 数据波动大则alpha取0.1~0.5之间 |
数据波动小则alpha取0.6~0.8之间 | |
如果不设置alpha,SPSSAU默认会遍历各种alpha取值时数据效果,选择最优效果时对应的alpha值 |
SPSSAU可智能地找出最佳平滑方法及初始值S0和平滑系数alpha。
2、数据整理与软件操作
(1)数据整理
本文以2016-2025这10年数据为基础,使用ARIMA模型对2026年结婚登记人数进行预测,将数据整理成下表:
年份 | 结婚人数(万对) |
2016年 | 1142.8 |
2017年 | 1063.1 |
2018年 | 1013.9 |
2019年 | 927.3 |
2020年 | 814.3 |
2021年 | 764.3 |
2022年 | 683.5 |
2023年 | 768.2 |
2024年 | 610.6 |
2025年 | 676.3 |
(2)软件操作
在SPSSAU【综合评价】模块选择【指数平滑法】,将变量拖拽至右侧分析框中,如果只预测2026年结婚人数,则将向后预测期数填1;一般来讲向后预测期数越多,准确性也会随之下降。操作如下图:
点击开始分析按钮,即可得到指数平滑法预测结果。
3、指数平滑法预测结果
(1)参数设置情况
SPSSAU自动找出最优平滑法及参数,选择二次平滑法(适合线性趋势数据),α=0.500,初始值为1102.950。
(2)向后1期预测值
利用指数平滑法向后预测1期得到2026年结婚登记人数为621.547万对。相较于2025年676.3万对,预测会减少54万对。
(3)结婚人数(万对)模型拟合和预测图
接下来使用ARIMA模型进行预测。
二、ARIMA预测
1、ARIMA模型知识
ARIMA是最常见的时间序列预测分析方法。它通过差分来使序列变得平稳,从而剔除趋势和季节性。ARIMA模型可拆分为3项,分别是AR模型,I即差分,和MA模型。
表示为ARIMA(p, d, q),有三个核心参数:自回归阶数p,差分阶数d值和移动平均阶数q,说明如下:
参数 | 说明 |
p:自回归阶数 | 表示当前观察值与前p个观察值之间的相关性。 |
d:差分阶数 | 表示为使时间序列变得平稳所需的差分次数。如果平稳,则d=0。 |
q:移动平均阶数 | 表示当前观察值与前q个观察值的残差之间的相关性。 |
SPSSAU可智能地找出最佳模型对应的自回归阶数p,差分阶数d值和移动平均阶数q。
2、软件操作
将上文整理的数据上传至SPSSAU平台,在【计量经济研究】模块选择【ARIMA预测】,将变量拖拽至右侧分析框中,向后预测期数填写1。
自回归阶数p、差分阶数d、移动平均阶数q的设置需要结合专业知识进行判断,但是SPSSAU默认智能地找出最佳的ARIMA模型并且进行预测,无需手动设置参数即可分析。SPSSAU操作如下图:
3、ARIMA预测结果
(1)ARIMA模型参数表
针对结婚人数(万对),结合AIC信息准则(该值越低越好),SPSSAU自动对多个潜在备选模型进行建模和对比选择,最终找出最优模型为:AR(1),其模型公式为:y(t)=88.778+0.900*y(t-1)。
(2)模型Q统计量表格上表格展示模型Q统计量信息,包括统计量值和p值。ARIMA模型要求模型残差为白噪声,即残差不存在自相关性,可通过Q统计量检验进行白噪声检验(原假设:残差是白噪声);通常其对应p值大于0.1则说明满足白噪声检验(反之则说明不是白噪声),常见情况下可直接针对Q6进行分析即可。从Q统计量结果看,Q6的p值大于0.1,则在0.1的显著性水平下不能拒绝原假设,模型的残差是白噪声,模型基本满足要求。
(3)向后1期 预测值
预测值表格是分析者最关注的表格,从上表可以看出,使用2016年-2025年结婚人数,利用ARIMA模型向后预测1期得到2026年结婚人数为697.388万对。相较于2025年676.3万,预测会增加21万对。
(4)结婚人数(万对)模型拟合和预测图接下来使用Sarima模型进行预测。
三、季节Sarima预测
季节性Sarima模型则在ARIMA框架中增加季节性差分和季节性自回归/移动平均项,专门拟合季度数据的周期性规律。
结婚人数的季度变化规律为:第一季度通常是全年高峰(受春节等习俗推动),第二季度次之,第三、四季度明显回落,呈现出稳定的“年内季节性波动”。这种每年重复的固定周期(S=4)使得季节性Sarima模型非常适合用于拟合和预测。
1、数据整理与软件操作
(1)数据整理
将2016-2025年结婚人数按周期(本案例为季度)整理成如下格式,部分数据如下:
时间 | 结婚人数(万对) |
2016-Q1 | 297 |
2016-Q2 | 296 |
2016-Q3 | 274 |
2016-Q4 | 275 |
2017-Q1 | 276 |
2017-Q2 | 275 |
2017-Q3 | 255 |
2017-Q4 | 257 |
2018-Q1 | 263 |
2018-Q2 | 263 |
2018-Q3 | 243 |
2018-Q4 | 244 |
数据来源于网络
(2)软件操作
在SPSSAU【计量经济研究】模块选择【季节Sarima】,将变量拖拽至右侧对应分析框中,填写向后预测期数与周期,操作如下图:
对于Sarima模型的构建时,可使用SPSSAU自动化法,即设置好周期S值后,另外p/d/q/P/D/Q共6个参数值由系统自动寻优找到;也可使用半自动法和手工建模法。
关于Sarima模型原理可点击查看下方帮助手册:
季节Sarima模型分析
2、季节Sarima预测结果
(1)SARIMA模型参数结果
上表格展示季节Sarima模型的7个参数值,如果不选择“手工建模”,此时SPSSAU系统会结合信息准则越小越好的原理自动识别并构建出最优模型。
(2)SARIMA模型参数表
上表格展示本次模型构建结果,包括回归系数值,p值等。信息准则AIC和BIC值用于多次分析模型对比,此两值越低越好,如果多次进行分析,可对比此两个值的变化情况,综合说明模型构建的优化过程。
(3)向后4期预测值
从上表可以看出,使用2016年-2025年每个季度结婚人数,利用SARIMA模型向后预测4期得到2026年各季度结婚人数,四季度结婚人数加和得到2026年结婚人数预测为672.309万对。相较于2025年676.3万,预测会增加4万对。
(4)结婚人数(万对)模型拟合和预测图
综上所述,三类模型预测2026年结婚人数如下:
根据三个模型的拟合误差指标对比:
- 指数平滑法:RMSE = 81.091,MAE = 70.196,MAPE = 0.087
- ARIMA模型:RMSE = 115.305,MAE = 94.656,MAPE = 0.115
- 季节SARIMA模型:RMSE = 16.266,MAE = 10.531,MAPE = 0.056
可以看出,季节SARIMA模型在三项误差指标上均为最小值,说明其对历史数据的拟合精度更高,能够更好地刻画结婚人数时间序列中的波动特征与潜在结构变化。
因此,尽管三种模型对2026年的预测结果存在一定差异,但从历史拟合误差角度来看,季节SARIMA模型的预测结果——672.3万对具有更高的参考价值。
