动态资讯

INFORMATION



调研资讯

数据需要“分析”才能得出正确的结果

2017-02-17

人们一直对平均数深信不疑,最经典的就是简单算数平均数,以为这个公式算出的结果就是对的,真的吗?给大家一个实际的例子,大家就会知道,“数据”这个东西绝对不是几个学过编程的人,代入几个公式就可以搞明白的。数据需要分析才能得出正确的结果。

      以下是本人2010年发表在《中国经营报》的小文。

      新房价统计方法有数据陷阱

 

                                           刘德寰

 

      国家统计局最近公布了《住宅销售价格统计调查方案(征求意见稿)》,这是一个历史性的进步,说明统计局不再我行我素不考虑社会的观点了。该调查方案有两点进步:给出了房价计算的基本公式,透明度增加;在资料收集方法上进行了大的改进。但笔者详细验证后发现,这些改进无法使房价计算更加科学,还会导致严重失真的结果,甚至可能继续出现类似“2009年70个大中城市房屋销售价格上涨1.5%”等让人匪夷所思的统计数据。

  我们以“本月及上月平均价格计算公式”(见“住宅销售价格统计调查方案公开征求意见”)为例,来考察统计局房价计算方式存在的问题。

  在统计局现有房价计算方式中,“新建住宅销售价格指数”的计算步骤为:第一,计算某一新建住宅楼盘90平方米及以下、90平方米~144平方米、144平方米以上三个基本分类的环比指数;第二,采用双加权计算全市三个基本分类的环比指数,即分别利用本月销售面积和金额作为权数计算价格指数,然后将两个价格指数再简单平均;第三,计算保障性住房环比价格指数,计算方法与商品住宅基本分类计算方法一致。

  这一房价计算方式有两个严重问题:一是所谓楼盘的三个基本分类,其分类方式不合理,我们知道,同样是90平方米的房子,城市中心与城市边缘的价格差异非常大,这样简单的三个分类,方法武断而且没有分析意义;二是“利用本月销售面积和金额作为权数计算价格指数”,这一定会陷入到数据陷阱之中。我们举一个数据的例子来说明这个问题:

 

 

该城市最近三个月的销售与价格情况

 

第一月

销售总平米

成交均价

销售额

甲区

50000

30000

1500000000

乙区

30000

25000

750000000

丙区

40000

18000

720000000

丁区

20000

17000

340000000

合计

140000


3310000000

 

 

第二月

销售总平米

成交均价

销售额

甲区

20000

33000

660000000

乙区

30000

27500

825000000

丙区

50000

19800

990000000

丁区

40000

18700

748000000

合计

140000


3223000000

 

 

第三月

销售总平米

成交均价

销售额

甲区

5000

36300

181500000

乙区

10000

30250

302500000

丙区

40000

21780

871200000

丁区

50000

20570

1028500000

合计

105000


2383700000

 

 

  假设一个城市中,按照90平方米以下新房屋基本平均销售价来看,甲、乙、丙、丁四个区域价格不同,距离城市中心依次越来越远,最近三个月所有区域成交均价每个月都上涨了10%,但是四个区域的新房销售结构在这三个月中是不同的(以北京为例,三环以内新房供应越来越少,四环以内也在减少,五环之内有所增加,六环之内大量增加)。

  没有学过统计的人都能够看出,这个城市最近三个月房价最终上涨了21%,但是统计局的计算公式是以整个城市新房总成交价除以城市销售总面积,算出所谓的“成交均价”,因为前面提到的低价房销售面积上升、高价房销售面积下降的原因,就会发现这样算出的三个月的成交均价分别为:23642.857元、23021.429元、22701.9元,房价分别下跌了2.63%和1.39%,合计下跌4 %。“21%”与“-4%”,多么可怕的差异!

  如果还是这个销售结构,每个区域每月成交均价都上涨15%,三个月房价实际上涨了32%以上,但是按照统计局的计算公式,房价分别上涨了1.8%和3%,合计上涨5%左右。

  还是在这个销售结构中,每个区域每月成交均价都上涨20%,三个月房价实际上涨了44%,但是按照统计局的计算公式,房价分别上涨了6.22%和7.58%,合计上涨15%左右。

  这说明统计局的计算方式存在严重失误。因为它以销售结构决定房价上升与下降,而不是以房价涨跌本身来决定,这是在数据分析中最常见的一种数据陷阱。如果未来我们国家关于房价计算的方式存在这么大的失误,会严重影响决策部门对真实楼市情况的了解,误导公众。

  上述问题不仅仅是统计部门犯的错误,也是建设部门和一些所谓的房价监控部门犯的错误。中国房价计算方式需要大的改进。


上一篇:

下一篇:

抽样问卷最容易犯的五个认识错误
车流量检测如何做?