导航菜单

首页 >  文章 >  男性更容易感染新冠病毒?小心被数据骗了,女性也不要掉以轻心

男性更容易感染新冠病毒?小心被数据骗了,女性也不要掉以轻心

图片说明:男性更容易感染新冠病毒?小心被数据骗了,女性也不要掉以轻心,。

最近,《科学》发表了一篇评论性文章,认为雄性激素可能助力新冠病毒对细胞的入侵。有人因此推断出男性更容易感染新冠病毒,并猜测是否可以用抗雄激素治疗来预防和治疗新冠病毒。但是,该文章不是研究论文,且文章所引用的数据为流行病学数据,需要谨慎解读,不能简单解读为男性更容易感染新冠病毒。早在疫情爆发的时候,就有人注意到新冠病毒“重男轻女”的问题。1月24日,《柳叶刀》杂志上发表了第一份关于新冠患者的流行病学报告,研究对象是武汉最早入院的41例患者,其中有30例为男性,占比73% ;第二份新冠患者的流行病学报告,研究对象是99名入住金银潭医院的新冠肺炎患者,男性比例为68% 。从这两份数据看,感觉好像男性更容易感染新冠病毒。但是,《新英格兰医学杂志》发表过一份流行病学报告,研究对象是425个武汉患者。这份报告按照发病时间把患者进行分组,结果发现在1月1日之前,感染的患者中66%是男性;随后,患者男性比例下降为59%;在1月12日之后,男性比例继续降低到48%。随着越来越多的数据披露,患者中男女比例失衡,其实跟病毒是否“重男轻女”无关,而是选取数据的基数不够大。对于数据的解释一定要谨慎,过度的解读会导致完全歪曲的结论。世界上有三种谎言:谎言、弥天大谎和统计数据。在生活中,我们经常会接触到统计数据,不论是政府和研究人员公布的调查结果,还是商家打广告时用到的数据结论。在很多人眼里,数据就是对事实最有力的证明。但实际上,各种各样的统计操纵无处不在,让人一不小心就会掉入陷阱。《统计数据会说谎》这本书里,作者揭开统计数据的神秘面纱,让你远离数据陷阱。1. 统计陷阱一:样本内部偏差让结果失真在讲如何识破统计陷阱之前,我们先要弄明白什么是“统计”。概括来说,统计就是对数据进行收集、处理、分析和解释,并且从中得出某种结论。举个最简单的例子,现在有一万颗豆子,里面有红豆有绿豆,怎么知道红豆绿豆分别多少颗呢?你当然可以一颗一颗地数,得出精确的结果,但这得数到什么时候啊!为了节省时间精力,我们可以用统计的办法,先把这些豆子均匀地混在一起,然后随便抓几把出来,看看红豆绿豆分别占比多少,最终大致估计出红豆和绿豆的数量。这是最简单的一种统计,但其实说简单也不简单。为什么呢?因为一万颗豆子是整体,而抓住来这几把则是样本,我们是根据样本的情况来推断整体的情况,所以样本的选取非常重要,一定不能存在太大的偏差。那假如在抽样的时候出现了偏差,会导致什么后果呢?我们来讲一个真实的例子:1940年代,美国《时代》杂志上刊登了这样一则报道:对美国耶鲁大学1924届毕业生的调查发现,他们的平均年收入高达2.5万美元。这是个什么水平呢?按照美元的购买力来算,1940年代中期的1美元大概相当于现在的14美元,2.5万美元也就相当于现在的35万美元,换成人民币就是200多万!照这么看,耶鲁毕业生的收入相当可观,简直让人羡慕嫉妒恨啊!但别兴奋得太早,仔细分析一下,我们就会发现这个结论有下面几方面存在疑问:首先是数据的来源。如果是个人自己填报的收入,很有可能虚报。比如有人觉得自己赚得少怕丢脸,就故意多报一点;还有人可能实际收入比较高,但报给税务局的数比较低,为了防止逃税被发现,所以故意少报。既然数据来源不真实,统计结果自然就不准确。其次是数据的计算方法。也就是说,就算大家都实话实说,每个人对于“年收入”的理解也会不统一,可能有人只算了工资,而有人算上了各种福利,还有人则把一些投资也加进去。这样一来,数据就没什么可比性了。最后是样本不随机导致的偏差。要知道,上面说的调查时间离学生毕业已经20年,而且当时通讯又不发达,能联系上的人肯定不多。那些有所成就的肯定比失败潦倒的更容易联系,就算联系上了,也不是所有人都愿意配合调查,那些高收入的肯定比低收入的更愿意透露情况。所以说,样本本身就偏向了高收入群体,怎么还能用来代表整体情况呢?你看,如果样本内部就有偏差,代表不了整体,也就没法保证统计结果的准确性。当然了,即便以上三个问题都不存在,2.5万美元这个数据也不一定能代表这届耶鲁毕业生在1940年代收入的总体水平。为什么呢?关键在于数据披露不完整。2. 统计陷阱二:不完整的数据掩盖实际情况我们刚才说到,2.5万美元人均年收入这个统计结果存在数据披露不完整的问题。为什么这么说呢?主要有两方面原因。一方面,样本大小不明确。如果这批被调查的毕业生人数很少,样本就丧失了随机性,无法代表一整届毕业生这个整体。但在很多广告中,商家偏偏会利用这一点,故意忽略掉样本的数量,从而夸大产品的效果。比如在1950年代,美国多克斯牙膏曾经打过一个广告,说根据测试用户反映,在使用新款多克斯牙膏以后,有23%的人蛀牙数量有所减少。乍一听,这牙膏效果显著啊!但实际上,参加测试的人数有多少呢?才13个人!除了样本大小问题,数据披露不完整还体现在另一个方面,那就是数据之间的差异。我们回到前面年薪的例子,2.5万美元只是一个平均数,也就是N个数字相加再除以N的结果。问题是,如果数据相差很大,平均数就容易受到极端值的影响。假设样本是400个毕业生,只要里面有一个创业成功,成了年收入千万美元的大老板,就算其他人年收入都是0,平均下来年薪也能有2.5万美元。因此,我们不应该只关注平均数这一个统计数字,还要结合众数、中位数,或者分层来看,才能更全面地了解真实情况。换句话说,利用某些统计方式,可以掩盖真实的情况。除了我们刚才说的数据不完整以外,类似的情况还发生在统计图表的制作过程中。3. 统计陷阱三:操纵图表给人带来错觉我们经常会看到各式各样的统计图表,比如柱形图、折线图、饼图等等。有的图表里还会插入生动的图片,比如用一个钱袋子来代表1万元,用一头牛来代表1吨的牛肉产量。这些图表可以让枯燥复杂的统计数据变得更直观、更有趣,所以更容易被大家所接受。不过大家要注意的是,统计图表也是会骗人的。怎么个骗人法呢?我们就先从最原始的统计图表——柱形图讲起。大家知道,柱形图可以用来比较几个数据的大小多少。好比说一家公司2001年收入1亿,2010年收入2亿,他们就可以用柱形图来表现这种翻倍的效果。但如果这个公司心术不正,就可能通过在图表上动些手脚,来夸大两个数据之间的差距。第一种做法是改变纵坐标的起始数值。一般我们画柱形图,纵坐标都是从0开始的,但有些图的纵坐标故意不从0开始,相当于每根柱子都截掉了一段,相互之间的差异就被放大了。还是刚才的例子,如果纵坐标从5000万开始,那表示2010年收入的柱子就有2001年的3倍高,很容易让人以为收入是原来的3倍。以前很多广告都这么操作,不过这种做法毕竟不符合作图规范,所以现在更常用的是另一种办法——缩小纵坐标的单位。比如原来纵坐标上1厘米代表5000万,那么两个收入数据也就是2厘米和4厘米的差别,虽然确实是翻倍,但视觉上没什么冲击力。如果让1厘米代表2000万,那两个数据就成了5厘米和10厘米的差别。也就是说,柱子被拉高,柱子之间的距离却没有变化,那么收入的增加趋势看上去就更加陡峭和明显。由于这种办法并不违反作图规范,很难被质疑。除此之外,在对统计结果进行解读的时候,也有一些常见的陷阱。4. 统计陷阱四:用偷换概念和颠倒因果混淆视听就算没法操纵数据,还可以用其他一些手段来影响结论。第一招是偷换概念。也就是说,如果你没法证明A,那就给人们展示一下B,并假装A和B是一回事儿。举个例子,有一个感冒特效药的广告,说是经过独立的第三方实验室测试,把这种特效药放进装满细菌的试管里,只需15克,就能在11秒里杀死试管里的3万多个细菌!听上去特别厉害吧,特别是再配上一张穿着白大褂的医生照片,简直太权威了!但仔细分析一下,这里边玩的却是“看似相关”的把戏。首先,测试是在试管里做的,可是人体跟试管的环境能一样吗?其次,测试用的药物成分没有经过稀释,而给人服用的药品却必须限制含量和浓度,避免对身体组织造成伤害。最后,说这种药杀死了3万多个细菌,至于是哪种细菌、跟感冒有没有关系,这些都没提。因此光凭这条广告,根本不能判断感冒药的效果究竟如何。第二招是颠倒因果。统计只能说明数据之间是否相关,而因果关系则需要结合理论和现实进行主观判断,这就给了某些有心之人可乘之机。通过颠倒因果,他们就能让统计结果支持自己的说法。比如很多研究都表明,抽烟的学生往往比不抽烟的学生成绩差。有人可以把它解读成是抽烟导致学习变差,于是他们可以说“抽烟会让人变笨!”。但实际的因果关系并非如此,有可能是成绩不好的学生更有可能去抽烟。除此之外还有一种可能性,那就是成绩差和抽烟之间压根没有任何因果关系,而是都跟第三种因素有关。比如我们来听听这个解释:压力太大的人容易抽烟,而压力太大也会让人成绩差,所以不能简单地说抽烟的人成绩差,它们只不过是“压力太大”这个因素导致的两种表现罢了。所以你看,利用偷换概念和颠倒因果这两招来解释统计数据,就能利用似是而非的结论来支持自己的观点。看到这儿,大家应该明白了,统计数据并不一定是完全真实客观的,而是存在各种各样的操纵行为。不管是抽样样本存在偏差,还是在数据披露和图表制作过程中耍手段,又或者是对统计结果别有用心的解读,总有人会用这样那样的法子,利用统计数据给别人传递错误的信息。这类行为用一个词概括,就是统计操纵。那么听了这么多案例,我们在日常生活中又如何才能更好地鉴别和反驳这类统计操纵的现象呢?你不妨问问下面几个问题:第一,样本是怎么来的,数量够不够大呢?第二,在抽样的过程中,随机性有没有得到保证呢?第三,呈现统计结果的时候,有没有故意遗漏了某些容易被忽略但是很重要的数据?图表是不是符合制图规范,有没有故意利用人们的视觉错觉?在解释统计结果的时候,存不存在偷换概念、颠倒因果,或是夸大意义的情况呢?所以,我们有必要主动树立统计思维,学会批判性地看待统计数据。编辑|凉山排版|凉山路上读书:全球名校博士30分钟精读一本好书。

 >  本文声明:

本文内容不代表日韩无码AV激情视频_日本成人在线播放_siteLartvucom--蜜桃圈APP视频立场,本站仅作整理、存档及学习之用,文章版权归属于原作者所有。

部分原创内容欢迎收藏、学习、交流、转载,但请保留文章出处及链接。

文章名称:男性更容易感染新冠病毒?小心被数据骗了,女性也不要掉以轻心

文章地址:http://www.mybbvn.com/article/89.html
有关热门【男性更容易感染新冠病毒?小心被数据骗了,女性也不要掉以轻心】的标签