两年前,常山药业称「约1.4亿中国男人阳痿,产品市场广阔」而引发热议,该公司12/28公告,收到证监会《行政处罚决定书》,认定常山药业2018-28号公告中的部分内容信披违规,对公司给予警告并处以罚款60万元。如此常山药业又一次登上了热搜。

毫无疑问,这所谓的约1.4亿数据来源肯定是以偏概全,因为统计数据会说谎。

以前好像有本书就是这样命名的,就像下图这种同一个数据调坐标系。

其实常山药业这种,就是类似的。

我们经常看到各种数据,中国xx有多少亿,比如

常山药业之前说中国阳痿患者有1.27亿,贵州百灵之前说中国糖尿病患者超过1.1亿,通策医疗说不孕不育的有5,000万以上,康宁医院说每5个人就有一个是精神病。

但是,理论上,除了全国人口普查,没有任何机构可以做到全国性的普查,甚至每年的普查也是抽样的。

那么,常山药业如何得出这个结论?

其实办法就是抽样调查算出概率,然后乘以总人口。

比如找了几十上百个人调查一下比例,得出样本群里男性阳痿比例20%,最后用全国7亿左右的男性一乘,那就是1.4亿。

但是,这里面就有问题了:

统计学里做抽样调查,对于抽样是有严格的要求的。

常山药业的样本抽样到底如何?

地方是否具有代表性?是否全国性抽样?还是用某个城市代表的?

全国那么多地市,不同区域风土环境人情都有差异,人们生活习惯也有差异,是否包括?

年龄分布如何?

不同年龄段的个人性功能存在差异,尤其是少年儿童还没性成熟呢。

职业分布如何?

不同职业可能也存在差异

甚至于调查方式也有很大的影响,互联网?电话?上门?

比如互联网调查是否会涉及到上网人群和不上网人群的问题等等?我国当前接入互联网的人群是9亿,还有5亿多人没接入互联网呢。

如果这些没搞清楚,那么这个抽样调查就不具备说服力,举个典型的例子:

记者到列车上采访,发现人人都有车票,于是记者报道:春运一票难求问题已经得到解决。

这就是典型的调查样本选取的问题。

可是很多时候,又会遇到一些问题,那就是,对方到底是故意搞错呢?还是本身能力有限不知道抽样调查有这么多道道呢?