在日常的财经新闻和正式的经济分析报告中,我们越来越多地接触到一些“令人印象深刻”的数字。比如,中国企业部门负债超过100万亿元、中国地方政府债务接近18万亿元、M 2与GDP之比超过200%,等等。这些来源渠道多元的数据涉及国民经济和日常生活的方方面面,既有宏观又有微观,既有绝对指标又有相对指标,要在扑朔迷离的“大数据”中获取有用的信息实非易事。许多统计数据经过“必要的”加工和处理之后,表面上反映了经济运行的某些特征或表现,但仔细分析起来,有些却经不住推敲,失去了逻辑支撑。对于这些看似含义丰富的数字,如果我们不假思索、不予甄别,就会形成经济预期,似乎中国经济的杠杆率已经很高,“去杠杆”已经不可避免,从而加剧地方经济和企业发展面临的困难。
当前经济运行的复杂性远超以往任何时期,面对经济发展的新常态,经济分析和政策研究应当保持其客观性和准确性,谨防数字陷阱的误读和误导,更要防止主观上选择性地“运用”数据,唱衰中国经济。
简单加总分析可能会犯“体重和血压相加”的谬误
先来看一个实际的例子。某大学研究生院9000名男性申请者中的4000人被录取(44.4%),而4500名女性申请者中1500人被录取(33.3%),这是否能证明录取过程存在性别不平等呢?不一定。我们来看看该大学4个系的原始数据是怎样被加总和整合的,从各系的原始数据来看,每个系的女性录取比例都高于男性。很明显,原始数据比加总后的整合数据更好地描述了实际情况。这种现象通常很难被发现,其隐蔽性也超出了人们的直觉,这就是数学上的Simpson悖论。它告诉我们,宏观总量有时并不等于微观数量的简单加总。
数据加总在经济分析中非常普遍。广为熟知的GDP计算,无论是生产法还是收入法,其实都是数据加总的运用;与我们生活密切相关的CPI,其实也是在不同数据赋予一定权重后的加总。通过数据加总对经济运行特征和局部领域经济表现进行反映,是一种必要且有效的分析方法。但是,微观个体特征值的数量加总必须有一个基本前提,那就是事物之间必须是同质的。如果微观个体不具有同质性或者属于两类截然不同的事物,则简单加总容易犯“体重和血压相加”式的错误。脱离微观个体同质性基础的加总,除了得到一个具体的数字外,孤立地看并不具有任何分析学的含义(比如我们把某市或某省全部人口的体重或血压加总,得到的数据除了吸引眼球之外,能够说明的问题非常有限,必须通过历史数据和其他相关指标综合分析才能判断区域人群身体素质的变化趋势),据此也不可能对现实做出准确的判断。债务规模的测算,恰恰就犯了将不具有同质性的微观个体简单相加的错误。
以地方政府债务规模的测算为例。表面看,地方政府是性质类似的个体,但从债务层面来看,则不同区域的地方政府之间存在巨大差异。不同层级的地方政府,在经济规模、发展阶段、财政实力及发展潜力等方面存在巨大差异,由此导致其同等规模的债务造成影响和风险程度的显着不同。例如,截至2013年6月,山东省和重庆市政府性债务余额差别不大(公开数据分别为7107.8亿元和7360.27亿元),但两者的经济实力却相差悬殊(2013年,山东省和重庆市的生产总值分别为54684.33亿元和12656.69亿元,前者为后者的4.32倍),同时,两者在财政规模和增速上也存在显着差异(2013年,山东省财政收入为重庆市财政收入的2.69倍,财政收入增速分别为12.33%和-0.6%)。从上述指标来看,山东省和重庆市两个债务规模相近省份的差异,甚至要大于欧元区内债务水平接近的德国、法国和意大利三国之间的差异。这种情况下,两个微观个体很难被视为具有同质性。将两个差异如此巨大的微观个体债务规模简单相加,其结果并不具有实质性的意义。再比如,在对地方政府债务率进行测算时,将政府负有担保责任的债务按照同等比例折算后加总。这实质上也是认为不同省份债务的风险程度是一致的。但事实上,这种测算存在很大问题。2013年6月底,云南和甘肃政府负有担保责任的债务相差无几(公开数据为439.42亿元和422.80亿元),但前者财政收入是后者的2.6倍,将两者债务风险程度等同并简单加总脱离实际情况。
如果忽略企业的资产规模和结构状况,简单地将全国几百万家企业的负债加总计算,并推断中国企业债务水平的高低就错得更加离谱和荒唐了。
平均数分析对“黑天鹅”事件无能为力
有这么一则小故事:一位统计学家要穿越一条河流,过河之前,他仔细查阅了这条河的相关统计资料,计算其平均深度只有一米。于是,这位统计学家放心地涉水过河了。出乎预料的是,他被淹死在了这条河里。
平均数的运用不仅历史悠久而且极为广泛,甚至可以说,平均数思维已经深深嵌入人类的灵魂之中,没有平均数我们甚至不知如何思考和理性思维。但,恰好是这个迷人而简约的平均数经常令我们误入歧途。
近年来,社会中频繁出现了一个词——“被平均”,然后就“被增长”了。比如,人均收入增长,人均住房面积增长,甚至人均预期寿命也“被增长”了,等等。这种现象的出现,其实是反映了平均数分析的不足:数据简单平均后得出的结论,到底有何价值?又能多大程度地反映实际情况?
平均数统计在经济分析中屡见不鲜。例如,“十二五”以来经济平均增长率、2013年CPI平均水平、2010年以来地方政府债务的平均增速,等等。与总量分析一样,平均数分析也能反映出经济运行的某些特征,但是,平均数分析的一个重要不足,是忽略了离散数据(异常值)的巨大影响。比如,将巴菲特的收入放到某一低收入群体中计算平均数,则平均水平将大大提升。实践中,对经济运行甚至经济系统造成深刻影响的,往往是那些离散型数据。就是这些所谓的“黑天鹅”事件,无论是20世纪90年代末俄罗斯国债违约事件,还是至今仍在肆虐的欧债危机,都揭示了意外事件和离散变量的巨大危害性。
在平均数分析时,经常采用的一种方法是,通过高于或低于平均数,来得出发展程度高低、风险程度大小等结论。最常见的例子是行业和企业负债率的比较分析。例如,仅仅通过冶金、石化、炼焦、电力、高速公路等行业资产负债率高于全行业平均值,就得出这些行业债务风险程度偏高的结论。事实上,不同的行业或者企业,其发展前景、成本结构和生产经营情况存在很大差异,有些行业和企业(比如传媒业)天然地具有轻资产的特征,有些行业的经营特征决定了资产负债率必然很高(比如银行业),还有一些行业由于盈利质量较高或者存在行业壁垒,资产负债率处于较低水平(比如医药业、白酒业)。正因如此,不同行业和企业的最优负债水平存在显着差异。一个处于高速成长期的高科技企业资产负债率可能远高于平均水平,但其债务风险可能要显着低于一个处于夕阳产业、资产负债率低于平均水平的衰退期企业。不仅不同行业最优资产负债率存在差异,即使在同一行业内部,各个企业之间的最优资产负债率也存在很大不同。这是因为,现实中,随着企业越来越多元化发展,我们已经很难找到两个完全一样的企业。
在我们无法精确识别不同行业、不同企业之间的差别时,市场往往能够给出答案。市场的自主选择往往是最准确的。在股票市场上,银行业、钢铁业市盈率要明显低于高新技术企业,这是市场自主选择的结果,是投资者用脚投票的反映。这说明,市场参与者已经非常明显地意识到不同行业、不同企业存在着巨大差别,用平均数分析简单比较会存在很大问题。具体到考察不同企业、不同行业相对于其他行业、其他企业的相对债务负担时,我们更是要慎用平均数的简单对比。
比例分析在缺少参照基准情况下得出的结论站不住脚
在经济分析中,数据的比例化以及指标的横向比较也非常普遍。事实上,通过对一些数据进行比例化处理(相对指标),相对于用总量指标,更能反映出事物发展的典型特征。例如,通过对中国GDP与世界GDP的比例化处理,能够知悉从2000-2012年,中国GDP占世界的比重从3.7%提高至11.3%,进而形成中国经济地位快速提升的认识。再比如,通过对中国债券市场规模与GDP的比例化处理,可以发现从2003-2012年,中国债券市场规模占GDP的比重从28%提高至46%,进而可以直观评价2004年资本市场“国九条”带来的积极影响。
比例分析可以形成对经济运行的不同认识,尤其在相对规模测算和结构比较时体现出显着优势,但在比例数据处理和运用时,需要明确的一点是,必须是对具有相互联系的同一个主体(比如都针对某一国家或者某一省份)或者同一个经济变量(比如都针对GDP)进行比例分析,才具有意义(即可比性)。否则,如果比例分析时分子和分母归属于不同性质的不同主体,比如用河北省的钢铁产量对比北京市的生产总值,得出的比值毫无意义。
现实中,很多比例分析恰恰犯了上述错误。例如将中国非金融部门的各类企业负债总额与全国的GDP进行对比,藉此判断中国企业过度负债。将本不可以简单加总的各层级政府债务合并计算后再和GDP对比,得出结论认为中国地方政府债务过重。诸如这样将主体不同的两个变量进行比例分析,很难得出准确反映现实的结论,如果藉此对中国国家的债务负担作出评价并决策,则很可能出现明显偏差。
比例分析还有一个重要用途是进行横向比较,以判断相对于其他主体的地位。例如,以债券市场的横向比较为例,2012年,中国债券市场规模占GDP比重为46%,而美国处于中国发展程度近似阶段时(1997年),这一比例分别为150.7%;再比如,2009年,中国和日本GDP规模非常接近,但债券市场占GDP比重分别为51.6%和243.4%。通过上述比例分析,可以清晰地得出的结论是:中国债券市场相对规模明显不足。
上述例子中,我们之所以能得出清晰的结论,是因为借助发展水平相似这一前提,找到了一个参考基准。但现实中,很多情况下,我们很难找到进行高低判断的参照基准。然而,在没有参考基准的前提下,很多分析和研究却轻易地做出了高低与否的判断,这种结论深究起来是站不住脚的。例如,用货币供应量M2对比GDP这个单一指标超过200%就简单地判断中国的货币供应超发。事实上,这种推断是不准确的,应该同时分析CPI和金融市场利率水平等相关指标才能做出准确判断。再比如,通过非金融部门债务占GDP比重达到200%(且不管这种测算是否准确),得出中国非金融部门债务负担明显过高的结论。因为我们很难找到一个衡量一个经济体非金融部门、企业部门负债率高低的参考标准。例如,美国、日本和德国三个经济体发展程度相似,但2012年期非金融部门债务率分别为306%、468%和253%。如此明显的数据差异,使得我们很难推断出反映债务可持续性的临界水平。再比如,同样参照政府债务占GDP比重,葡萄牙、意大利在120%左右出现债务风险,希腊在160%-170%左右出现严重债务危机,但日本在超过210%的情况下,依然未出现太大问题。这再次说明,在很难找到参照基准的情况下,单纯通过一个比例就得出高低与否、风险大小的判断,在逻辑上是站不住脚的。
应理性看待我国政府当前的债务负担
近年来,次贷危机、欧债危机的发生并蔓延,使得债务问题成为各界关注焦点。这种情况下,我国政府尤其是地方政府债务规模的增长引起了大量关注和各方的担忧。众多机构和学者也进行了测算和分析,看法不尽相同,结论也有所差异。政府举债是现代社会中各国的普遍做法,适度举债对经济发展的正向作用已得到充分印证。对于我国政府的债务负担,我们在对规模和结构保持积极关注的同时,更应体现出一种理性的态度。
一是无论是理论分析还是经验数据来看,适当的债务水平有利于经济发展。经济发展需要资金、劳动力等投入。与劳动力等要素相比,资金要素的流动性和跨期选择的优势更加明显。适当举债,实际上就是一种跨期选择和跨期决策。在经济快速发展的时期,政府通过适当举债,可以弥补经济领域的短板(尤其是基础设施建设短板),进一步激发经济运行的潜力。而且,这种举债,可以通过经济更快发展所增加的税收来偿还。大量实证研究表明,在政府债务负担低于一定比例的情况下(90%左右),政府举债与经济增长之间存在正向关系。在美国、英国和日本城镇化过程中,政府适当举债,尤其是各级政府通过市政债的形式举债,对这些经济体城镇化的加速实现起到了巨大的促进作用。我国经济发展和改革的实践证明,通过适当举债来加快基础设施建设,弥补城镇化建设中的资金缺口,有利于有效地激发内需,激发经济运行的潜力和活力。
二是国际经验来看,在经济高速发展的时期,适度负债运营可能是更优的策略。在经济发展的不同阶段,一个经济体最优的债务负担比例是存在差异的。经济发展速度加快、经济发展潜力显着的时期,微观主体的经营状况往往较好,未来经营预期偏乐观,政府财政收入增速也会较快。这种情况下,政府债务水平适当高一点,并不会带来太大的风险。也就是说,债务规模与风险程度不存在密切关联,更不能直接画等号。
我们不能简单地看到地方政府债务规模的增长,就认为债务风险在增加。例如,上世纪80年代,日本经济处于快速发展阶段,这一时期政府的债务规模增速也在明显加快(经济增速在5%-7%,政府债务同比增速在两位数左右),但该时期日本政府的债务风险是很低的。相反,在经济增速明显下行、停滞甚至衰退的时期,较低的地方政府负担也可能导致债务风险集中暴露。例如,2006-2009年,希腊和意大利的债务水平的变动幅度并不算大,之所以出现严重的风险暴露,更主要原因在于经济增速的快速下滑甚至衰退。对我国而言,目前经济潜力依然巨大,经济增速也处于较快水平,各类主体运营也相对稳健,这种情况下,适当提高债务负担的容忍度、根据经济发展的差异化程度对不同地区实施差异化的负债管理,应是一种更优的选择。事实上,现阶段较高的负债比例,会在经济快速发展中逐步被吸收和消化。
三是无论是横向比较还是现实需求,当前我国政府负债相对标准值是不够的。根据公开资料统计,2012年底全国政府性债务的总负债率为39.43%,远低于国际通常使用的60%的负债率控制标准参考值,也远低于美国和日本在相似阶段时期的负债率。而且,与发达经济体中举债主要用于社会管理支出等不同,我国政府举债大多投向了市政建设、土地收储、交通运输等基础性项目,形成的大量优质资产可作为偿债保障。而且,相对于成熟经济体,我国现阶段在经济发展速度上仍然体现出显着优势。因此,无论从债务的规模还是单位债务的影响程度来看,我国政府债务除了局部地区之外总体上仍然处在健康水平,距离债务规模的临界值还有较大差距。而且,在当前实体企业缺乏足够活力、经济稳健运行的基础依然不牢固的情况下,适当提高中央政府债务负担,在总体债务风险依然可控的情况下,可以进一步增加财政政策的灵活性,进而为降低实体企业尤其是中小企业的税负负担腾出空间,增强积极财政政策实施的灵活性和针对性,从而进一步落实“稳增长、调结构、促改革”的战略决策。