【故事一】拉高收入的“最佳雇主”
年终奖发了,所得税缴了……新一年的开端,也该算算上一年的收成。于是“特能算统计公司”出马了,很快,三份统计数据摆到了网上。
公司甲——员工平均年收入五万元;公司乙——员工平均年收入九万元;公司丙——员工平均年收入七万元。毫无疑问,公司乙是“最佳雇主”。
拿着这份报告,大学应届生小李跑到了公司乙面试。想起进入公司甲的同学,小李暗喜——谁让他不先看看统计报告呢?
工作了一个月,看着手中工资条的小李有点失落——保底工资1000元——这可跟平均9万元年收入差得太远。
保底工资1000元……第二个月工资到手,小李彻底傻眼。“这哪里有‘最佳雇主’的样子?”小李忍不住拿着广告跑到了人事部。
不过,人事部门领导似乎早已习惯了如此场面,“没有错,’最佳雇主‘当然要配上最佳收入啊,如果你有什么疑问,还是去找‘特能算’吧。”
来到统计公司,小李终于拿到了“最佳雇主”的统计方式,平均倒是平均,可这公司乙的平均收入,全被老总一个人的收入拉高了——小李这才明白,自己是“被平均”的那一个。
说到底,坑了小李的还是自己微薄的数学知识。
从小我们就学平均数,却没人强调平均数的用法。正如“特能算”统计的三家公司,公司甲虽然平均收入不高,但收入水平却非常平均;公司乙和公司丙则贫富分化巨大,一个“员工A”,便把公司的整体收入拉高。这其实符合平均数的原本含义,只有在样本相对均匀时,平均数才有其参考意义。平均数还有些“好朋友”很少被提及,例如描述样本中数字处于中间值的中位数,描述数据与平均数之间偏离程度的方差等——如果小李知道公司乙的收入中位数是12000、公司甲的收入中位数为45000,就不会做出错误的判断。
真相:感觉与数据的背离算不上新闻,这正是“首席巨骗”平均数惹下的麻烦。与其公布平均数,不如也把中位数等数据一同公布。看看在平均收入的背后,有没有那拉“最佳雇主”。
【故事二】最受欢迎的网站
“寻狗”网站CEO李超阳最近犯了难,网站点击量上不去。无奈之下,李超阳只好请公关公司来帮忙。
商谈不久,公关公司就交出了第一份策划案:“最受欢迎的网站”调查活动。调查被放到了网站首页。
几天下来,公关公司的第一条新闻稿出炉:“九成网友喜爱寻狗网,寻狗网当选最受欢迎网站”。李超阳看到新闻稿,一阵唏嘘感叹,不愧是专业公关,不搞假投票,不搞假调查,就搞出如此一条像样的宣传稿。
“九成网友”听起来挺有说服力,可是说来说去,“九成”也与那些平均数一样,是中听不中用的数字。
统计数据会有误差,其中“人”的因素颇为重要。
李超阳获得的“九成网友”支持,也正是公关公司刻意利用这一倾向搞的名堂——愿意花时间在网站上投票的网友,自然对网站有偏好,更不要说题目设置中本身就忽略的“非常不满意”选项——如此一来,一边倒的结果得来全不费工夫。
即便脱离网络,有偏向性的数字仍然比比皆是,例如“九成消费者信赖xxx产品”,不信赖产品的消费者,早把调查表扔进纸篓了。
真相:看着那些“我们很幸福”的调查,周末要加班的你想必有些反感。然而想为不幸福投上一票的“你”,当调查员拨通电话时,你是否会用“我没时间”一口回绝?
这才是数字说谎的真实之处:造成“被幸福”数据出炉的,恰恰是不愿意提供意见的“被幸福”人群。所以下次当调查员找到你时,别忘了停下脚步,大喊一声“我不幸福”。
北京晚报(吴楠)