查看原文
其他

为什么说,统计局发布的PMI指数其实都是不准确的?

竹杖芒鞋观烟雨 丹江湖上钓鱼翁 2024-07-07
撰写于2024年1月31日。
核心观点:众所周知,国家统计局发布的PMI指数中,季节性没有剔除干净,有很多“钉子状”。本文解释了原因:季节调整采用的SARIMA模型在处理时间序列末端的数据时不够准确。原则上,数据发布之后,应该逐月进行修正。但国家统计局发布PMI指数之后,不进行修正。因此严格来说,每个月的PMI指数其实都是不准确的。解读时需要小心,尤其在每年1、2月,以及波动比较大的时候。

昨天提到(点击),国家统计局发布的PMI指数是经过季节调整的(不剔除疫情影响),但是没把季节性剔除干净。此前很多同行也注意到了这一点。
这就引出了一个有意思的问题:为什么会没剔干净?
是国家统计局技术不过关吗?
当然不是。国家统计局专门组织过课题组研究季节调整问题,针对中国指标编制了专门的软件,还在2014年出版过一本《季节调整软件NBS-SA使用指南》,专业能力是毋庸置疑的(点击)。
那么问题出在哪里?
其实是数据发布的方式有问题。
众所周知,不管哪种季调,背后都是SARIMA模型。在调整时,对数据序列末端的调整不准确,导致结果不可信。统计局解决这个问题的方式是,每个月发布最新的季调环比时,会对过去11个月的季调环比进行修正(点击)。
例如图1中,2022年5月15日发布的工业增加值季调环比是-7.08%,此后每个月修正一次,到2023年5月16日修正为0.16%。
即:表1中深绿区域的数字,是每个月发布的上月季调环比。这些数字经过11次修正之后,变成粉红色区域的数字。而我们从数据库中下载到的,则是“粉红色区域+最后一列”数字。

表1  国家统计局每月对工业增加值季调环比的修正% 

资料来源:国家统计局网站

图1中,蓝线是国家统计局发布的工业增加值季调环比初始值(即表1中深绿色区域数字),红线是最新值(即表1中粉红色+黄色区域数字)。图1的下半部分是2020年4月至2022年3月的情况,可见部分月份的最初值与最终值相差相当大。 
图1  工业增加值季调环比:初始值与最终值
资料来源:国家统计局网站

国家统计局发布工业增加值季调环比的方法无疑是科学的。但是在发布PMI指数时,没有采用同样的方法(每月对此前11个月进行修正),而是每个月发布之后就不管了。由于SARIMA模型对时间序列末端的数据调整不准确,因此严格来说,每个月发布的PMI指数都是不准确的,通常趋势下降的时候会偏低,趋势上升的时候会偏高。表现在图2中,就是有很多钉子状,尤其是每年1、2月。在数据波动大的时候,这种情况尤其严重。 
图2  统计局发布的PMI指数,季节性没剔干净
资料来源:国家统计局;自己计算

同行们说的“PMI指数的季节性没有剔除干净”,就是指这种钉子状。造成这种情况的原因,就是数据发布之后不做修正。
这提醒我们,在解读PMI指数时要注意:
一是注重趋势,结合其他指标来判断经济趋势,对单月的数字波动不宜过度解读。尤其是当PMI指数在50附近时,对于零点几个点的差异不必太在意。
二是对每年1、2月的数字,尤其要结合趋势。
三是当数据波动较大时,可以看同比。例如2022年以来PMI指数波动剧烈。转换成同比之后,可以很清楚地看出,同期制造业持续处于萎缩状态。 
图3  PMI指数与其同比
资料来源:国家统计局;自己计算


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存