手机版 欢迎访问人人都是自媒体网站

当前位置:主页 > 体验 >

数据也会说谎:隐藏在统计数据中的那些小把戏

时间:2021-08-04 09:45|来源:网络整理|编辑:|点击:

数据本身不会说谎,但说谎者需要数据。统计数据在决策时拥有十分重要的意义,然而许多统计机构却经常以一些谎言掩盖数据的真实性,因此,学会识破统计数据中的一些常见小把戏非常有必要。

数据也会说谎:隐藏在统计数据中的那些小把戏

“世界上有三种谎言:谎言、弥天大谎和统计数据!”——美国统计专家达莱尔·哈夫在其传世之作《统计数据会说谎》中如是说。

对于统计数据,我们似乎对其有着某种天然的信任感,认为其代表着客观公正,数据不会说谎乃至成为了我们的潜意识,在许多时候成为了我们评判事物好坏与否的标准。

但现实的悖论在于,许多聪明的人或机构就是抓住了我们对于数据的这种天然的信任感做起了文章,通过各种统计手段得出各种或好或坏的各种数据,进而影响普通消费者的判断。

数据也会说谎:隐藏在统计数据中的那些小把戏

的确,在日常生活中,我们时常也能看到,在那些竞争激烈的行业,不同的统计机构往往会在同一时间给出相互打架的数据结论,造就同一行业中同时出现多个第一的闹剧,这在过往的外卖、移动支付、共享单车、智能手机等市场中都已是屡见不鲜。但常识告诉我们,同一行业中同时出现两个第一,是概率极小乃至是不可能事件。

为何这种统计闹剧屡见不鲜?

其中原因多种多样,往小了说有统计口径差异,基数偏差、数据粉饰、夸大等等,而往大了说那么就有可能是故意为之的数据造假,以求达到不可告人的目的。诚如政治家格罗夫纳(C.H.Grosvenor)所言:

“数据本身不会说谎,但说谎者需要数据。”

所以对于我们而言,在以统计数据作为决策依据时,需要擦亮自己的眼睛,预防辨别出统计数据中时常出现的一些小把戏,选择具备真正有意义的统计数据来做参考。

一、采用不同统计口径的统计数据

不同统计口径造就的数据差异,往往在市场份额、销量这类统计中时常出现,表现得颇为明显。

诸如在过往的国产厂商在国内智能手机市场销量谁是第一的竞争中,甲乙两家厂商都宣称自己是当年的市场销量第一,并且拉出了不同的市场调研机构给出的结论来站台背书。

的确,从不同统计机构给出的数据来说,这两家都做到了各自的第一。但问题的有趣之处在于甲乙两家厂商拉出来给自站台背书的统计机构所采用的统计口径却不尽相同,有的采用的是Sell-in(生产商卖给零售商的商品数量)的统计口径,有的采用的则是Sell-out(零售商卖给顾客的商品数量)的统计口径。

而从实际意义或者价值来说,或许把东西销售到用户手中的统计会更具价值。而这种由于统计口径造成的结果差异或者是数据打架现象,不仅在智能手机市场的销量统计中存在,在其他许多行业也同样存在。

二、忽略规模基数的统计数据

在日常生活中我们更为容易遇到、也更容易误导我们的一种统计小把戏是忽略规模基数差异的统计数据。

诸如在许多行业中,用户会把平台的顾客投诉量作为一个重要考察指标,也或正因如此,一些机构也做起了聚合用户各类投诉而后发布不同行业用户投诉排行榜的事情。

但有时候观察这些机构发布的这类投诉数据排行榜,我们却能发现他们发布的这类投诉排行榜其实对于用户的决策而言,并不能带来有任何实际意义的参考价值,反而有可能会把用户带进坑里。

原因在于这种投诉量排行榜忽略了一个统计中最为基本的要素——用户基数差异。

显而易见的一个道理是:不同行业不同品牌、平台,其用户规模各不相同,有的平台用户规模可能会很大,而有的平台用户规模则很小。但在众口难调的现实下,显然用户规模更大的平台,往往就会在这类数量的统计中更为吃亏。

但从实际的整体概率来说,我们却能发现用户规模高的平台,其服务水准、用户满意度、平台安全性可能反而会更高。

所以从这个层面来说,如果要真的去考量一个品牌、平台的服务水平、产品质量,其实更为合理负责的统计方式不是去统计他的用户投诉量,而应该是计算用户的投诉率。

诸如在去年21CN聚投诉发布的2017年十大行业“金虾奖”这份榜单中,我们就能明显发现采用用户投诉量的统计方式所带来的用户误导。

Copyright © 2018 DEDE97. 织梦97 版权所有 京ICP