较真丨大数据透视疫情,新冠并没让更多人死亡?

较真丨大数据透视疫情 , 新冠并没让更多人死亡?2020 08/19【兼听则明 , 真真假假 , 假假真真 , 真假自辩】较真要点:·1热门流传文章宣称“今年美国总死亡人数并没有超过往年”乃至“美国总死亡人数不升反降” , 但作者提供的每一个图表或说法 , 都有离谱的错误或编造的痕迹 。 实际上 , 疫情期间美国总死亡人数比正常年份高出了15%以上 。·2流传文章关于美国这部分 , 很大程度其实是翻译改写自一位叫William M. Briggs的美国人的博客文章 。 原文已经很不可靠——除了宣扬错误数据和结论外 , 还宣扬拒绝疫苗 , 声称比尔·盖茨的做法是一种威胁 。 而中文译者甚至把原文关于图表有延迟数据的说明删掉了 , 再以个人喜好加上了诸多离谱想象 。·3作者宣称瑞典在社会运转如常的情况下 , 取得了理想的防疫成绩 。 实际上:瑞典并不是欧洲最先走出疫情的国家 , 而是最后一批;瑞典也并不是不检测、不隔离、不收治;瑞典的新冠死亡率在国情类似的北欧国家中显得非常高 。 总的来说 , 瑞典防疫措施目前尚难言成功也不应模仿 。·4作者宣称“英国死亡人数无异常” , 实际上错误解读了数据 。 根据英国权威媒体统计 , 在疫情高峰期 , 英国的死亡率上升了45% 。查证者:反海外谣言中心 | 国际谣言查证机构本文由较真特约专家、医学博士胡远东进行科学性把关新冠全球爆发已逾半年 , 相信它的威力大家都已经有所了解 。 即便如此 , 依然可以看见不少唱反调的文章 。 近期热传的一篇文章《大数据透视疫情》便是如此(还包括标题类似《奇怪!大数据显示 , 新冠并没有造成更多人死亡》等各种变种文章) 。 这篇文章的主要论点是 , 严格的防疫措施大多是不必要的 , 比如瑞典就靠宽松防疫获得了胜利 , 而英国、美国虽然新冠肆虐 , 但总体死亡人数并没有变多 。由于作者摆出了很多数据 , 看起来非常“学术” , 加上观点另类 , 挑战常识 , 文章被广泛传播 , 不少人信以为真 。 的确 , 防疫措施如何 , 大家可以探讨 。 但首要问题是 , 作者的数据真实吗 , 论述逻辑成立吗?一、疫情之下 , 美国总死亡人数比往年更低?都是假数字《大数据透视疫情》这篇文章篇幅颇长 , 但最让人感到震惊的所谓“真相” , 是关于美国部分的 。作者并没有否认美国的感染人数不断增加 , 但他却声称 , 美国的死亡人数在不停下跌 , 甚至“今年美国总死亡人数并没有超过往年”乃至“美国总死亡人数不升反降” 。 所以新冠变得并不可怕 。但实际上 , 作者在美国部分提供的每一个图表或说法 , 都有离谱的错误 , 我们不妨来依次检视 。1)作者提供的第一个图说是“美国快速增长的感染数” , 作者并宣称感染数没有意义 。 但这个图左上角明明白白写着(Daily Tests)“日测试数” , 并不是感染人数 , 这是个离谱的低级错误 。图注:流传文章宣称的“美国快速增长的感染数” , 实际是“测试数” , 原图来自William M. Briggs博客2)作者提供的第二个图是“美国的周死亡数曲线” 。 死亡数和死亡率是该文作者讨论的重点 。 作者宣称 , “病毒感染数逐渐上涨 , 但死亡数却在4月见顶后快速下降 , 说明疫情接近尾声了 。 ”图注:流传文章宣称的“美国周死亡人数曲线” , 原图来自7月28日William M. Briggs的博客 。 (图中曲线之所以7月份数量显著偏低 , 可能与Briggs做该图时CDC全因死亡数据延迟汇报有关 , 但那个时候美国实时新冠死亡数已经大幅度反弹 , 所以这个图是必然带有误导性的)然而这个死亡数曲线图 , 是错误的 , 而且不难识破——关注美国疫情就会知道 , 从6月下旬 , 美国疫情死亡人数反弹 , 7月迎来新一轮死亡高峰 , 曲线不可能往下 。 真实数据是这样的:图注:真实的死亡“美国周死亡人数曲线” , 引自Our World in Data3)作者提供的第三个图 , 对比了今年和历史死亡率 , 宣称保持了一百多年来的低位 。 且不说这个跨度一百年的比较意义有限(人类各方面进步都太大了) , 图表改得很蹩脚(纵坐标原点不是零 , 夸大了近些年的低水平) , 重要的是 , 这个所谓的今年的死亡率完全是不可靠的 。 该图表的来源 , 美国CDC并没有给出今年的估算数字 。图注:作者提供的“今年和历史死亡率对比”4)作者给出的第四个图 , 是所谓“放大来看”的“美国三年来的周死亡” 。 除了能看到在最近几个月死亡人数有大幅下降外 , 作者还宣称 , “其中高峰处虽然CDC估算有2-5万的额外死亡 , 但这是由心脏疾病等其它原因导致 。 ”图注:流传文章宣称的“美国三年来的周死亡曲线” ,原图来自William M. Briggs博客(与前面的“周死亡人数曲线”图类似 , 曲线右端的大幅度下坠可能与Briggs做该图时CDC全因死亡数据延迟汇报有关 , 因此存在严重误导性)实际上这个图和其引述的所谓“CDC的说法”都是不正确的 。 美国三年来的周死亡真实数据是下图:图注:真实的三年来美国全因周死亡人数 , 来自美国CDC网站图中橘色线是阈值 , 超过阈值的就是无法以统计波动解释的超额死亡(所谓超额死亡人数 , 表示“疫情阶段死亡人数与过去同期死亡人数相比 , 多死了多少人” , 无论死因如何 。 该指标摈弃了所有统计死因标准时出现的主观 , 能完全真实地反映出疫情对死亡人数的影响) , CDC会在柱状图上面标上加号提示 。 可以看见 , 自2020年春季起 , 美国出现了超额死亡人数的高峰 。图注:美国全因周死亡人数局部放大(新冠死因与其他死因对比图) , 来自美国CDC网站而CDC网站还提供了新冠与其他死因的全因周死亡人数对比 。 如上图 , 蓝色是CDC报告的新冠死亡人数 , 黄绿色是其它死亡(也包含漏检的死者) 。 最后几周因为死亡人数提交有一定的延迟 , 所以数据还不完整 。 据CDC的报告 , 从2020年2月1日起 , 截止到目前 。 美国在疫情期间超额死亡人数可估算为16.4-22.3万人 , 即橘色线以上的部分 。 从图中也可以对比看出 , 橘色线以上绝大部分都系新冠死者 , 疫情高峰期只有小部分超额死亡归因于心脏和循环系统、阿兹海默症等疾病死亡的增长 。另外还需要特别强调的是 , 作者宣称的“而更让人惊讶的是 , 尖峰后的每周死亡数近乎垂直下坠的形态 , 使得今年美国总死亡人数并没有超过往年 。 ”这是完全不存在的 。 根据美国CDC的周死亡数据汇报 , 疫情以来美国没有任何一周总死亡数字低于5万 , 更不要说作者提供图片里的跌破4万了 。5)这部分最后 , 作者给出了最为荒唐的结论 , “美国总死亡人数不升反降”——图注:流传文章初版对于3~6月美国总死亡人数的描述自然 , 数字是假数字 , 大概是因为作者也知道过于荒唐 , 或被指责造假 , 该段数字后续利用发文编辑功能进行了调整 , 调整的幅度堪称“大变活人” 。图注:流传文章修改版对于3~6月美国总死亡人数的描述 , 数字大为不同事实上 , 根据CDC最新的数字 , 107.82万这个3~6月的总死亡人数还有所低估 , 实际应为111万左右 。 但即使按照疫情期间月均总死亡26.95万这个数字 , 也比2017年的月均死亡数高了15% , 这能说“COVID-19肆虐 , 美国的总死亡人数并无异常”?这里再提供一个最新的美国CDC全因死亡数字:从年初截至今年第30周 , 美国死亡总人数约为183.6万;而去年截止第30周的死亡人数是166.3万(注:初步统计 , 非最终数字) 。 今年比去年高出17万以上 , 与“美国的总死亡人数不升反降”、“ 并无异常”之说可谓差别极大 。6)流传文章关于美国这部分 , 很大程度其实是翻译改写自一位叫William M. Briggs的美国人的博客文章 , 比如有三幅错误的图表就直接引自该博客 。 原文已经很不可靠——除了宣扬错误数据和结论外 , 还宣扬拒绝疫苗 , 声称比尔·盖茨的做法是一种威胁 。 而中文译者甚至把原文关于图表有延迟数据的说明删掉了 , 再以个人喜好加上了诸多离谱想象 。Briggs原先在Weill Cornell医学院担任统计学助理教授 , 后从学校出来跨界投身反气候变化运动 , 开设私人博客撰写文章 , 曾是知名反气候变化智库Heartland的嘉宾 。 我们不清楚这种转变的具体原因 , 但这种编造数据跟吃饭喝水一样平常的作风 , 恐怕不容易在学术界混下去 。二、新冠的防御方案岂能参考乙肝来制定说完美国部分 , 我们再重头看起 。这篇文章开头的论述就十分惊人:根据世卫组织统计 , 全球共有3.25亿人感染乙肝和丙肝 , 每年死亡人数140万 , 可新冠到目前为止才死了65万人 。 虽然肝炎无论死亡人数和死亡率都高于新冠 , 但我们可没有因此而大动干戈 。这个说法逻辑不清 , 因为防疫措施与疾病传播手段有关 。 如果肝炎能像新冠那样靠呼吸道迅速传播 , 那毫无疑问也会大动干戈 。 事实上 , 肝炎是一种已经见诸文献几千年的疾病 , 和新冠这种新发传染病没有可比性 。 新冠出现以来 , 科学家都是将其与其他呼吸道传染病进行比较 , 没有与消化道传染病相比的 。然后作者又提到了流感 , 指出美国近十年来 , 每年流感平均死亡3.6万人 。 但作者没说的是 , 时至今日 , 新冠在五个月里 , 已死亡16.2万人 , 这真的能够像流感那样防御?三、瑞典防疫措施目前尚难言成功也不应模仿该文另外一个重点 , 是表扬瑞典的防疫措施 , 他将瑞典的新冠死亡率与英国、法国、意大利、西班牙等国对比 , 认为瑞典在社会运转如常的情况下 , 取得了与这些国家相似的结果 。文中写道:从数据来看 , 最先走出疫情的 , 将是这个北欧国家——瑞典 。 从头到尾 , 瑞典都保持了社会的开放 , 实施简称“不检测、不隔离 , 不收治”的三不政策 。 这就是瑞典成功的奥秘 。那事实是什么呢?1.瑞典并不是欧洲最先走出疫情的国家 , 而是最后一批瑞典从疫情初期就采取了和所有国家都不同的宽松处理方式 , 并预期在5月份 , 斯德哥尔摩市就能实现群体免疫 。 但实际上直到6月底 , 其它欧洲主要国家的疫情均步入尾声时 , 它依然未能做到这一点 。 这在6月26日的欧洲疾病防控中心(ECDC)的14天新增病例人口比率报告中 , 可以醒目地看出来 。图注:在欧洲疾病防控中心6月26日的报告中 , 瑞典依然是高发区 。2.瑞典并不是不检测、不隔离、不收治在欧洲疫情爆发最烈的时期 , 一些媒体登载了瑞典人日常上街聚餐的照片来显示其宽松防疫政策 。 但这多少有点以偏概全 , 因为瑞典政府对公共生活施加了不少限制 , 包括禁止50人以上的聚会 , 关闭了所有高中、大学和职业学校 , 采取远程教学 。 呼吁国民在家工作、停止不必要的旅行、如非必要勿探望老人等等 。 从第10周开始 , 瑞典逐步加大测试量 , 到7月上旬时 , 每周测试已超过8万人 。对瑞典的防疫策略正确总结应该是平缓传播曲线 , 减少医疗机构压力 , 重点保护老人 。 但最后一点是失败的 , 瑞典超过3/4的新冠死亡 , 发生在养老院或在家看护的老人身上 。 说明它的这套防疫策略 , 并没有能够阻断病毒在年轻人和老人之间、以及老人和老人之间的传播 。负责瑞典防疫的安德斯·特涅尔在6月初接受瑞典电视台采访时回顾称:瑞典应当在疫情初期增加检测数量 , 保护好养老院 , 才能获得更好的结果 。3.瑞典的新冠死亡率在国情类似的北欧国家中显得非常高截至2020年8月8日 , 瑞典共有确诊病例82323例 , 死亡5763例 。 与情况相似的另外三个北欧国家相比 , 其新冠死亡占人口比率是挪威的13.8倍 , 芬兰的11.0倍 , 丹麦的6.1倍 。 前文提及的特涅尔本人也承认 , 瑞典死了太多的人 。图注:瑞典的新冠死亡人数 , 以及它占人口的比率 , 在北欧四国中显得非常高(据worldometers数据 , 截止目前 , 瑞典每百万人口因新冠死亡543人 , 丹麦为107人 , 挪威为48人 , 芬兰为60人)原文作者拿瑞典和英国、法国、西班牙、意大利比新冠死亡人数占人口的比率 , 得出“做得不错”的结论 。 问题是 , 后面那几个国家的人口密度比瑞典高很多 。 像瑞典这种地广人稀的地区 , 病毒传播的控制难度 , 远低于人口稠密区 。当然 , 我们不能就此说 , 瑞典的防疫相比其它国家是失败的 。 但可以明确的是:首先 , 防疫措施要切合国情 , 人口稠密的国家如果像瑞典那样宽松防疫 , 让死亡人数乘以数倍乃至10倍 , 社会是承担不起的 。 鼓吹瑞典经验时 , 要注意这点 。其次 , 防疫措施的好坏评判要明确标准 。 如果以控制死亡为成功标准 , 那瑞典同等人口的新冠死亡数高于其它北欧国家10倍 。 如果以经济为成败标准 , 那瑞典2020年第二季度的GDP锐减8.6% , 与其它北欧国家差不多 。 并没有成功可言 。所以 , 网上谈瑞典成功的其它文章 , 都是以今后瑞典不会再爆发疫情为标准 。 但这件事还没有发生呢 。 怎么能用没有发生过的事 , 来证明它的策略好于其它国家呢?四、英国的死亡人数在疫情期飙升英国是新冠抗疫最失败的国家之一 , 截止8月8日 , 在150个世界主要国家里 , 它的新冠总死亡人数排第四位 , 百万人口死亡数仅次于比利时 , 高居第二位 。在这种状况下 , 作者是如何论证英国死亡人数无异常的呢?他是这么说的:图注:流传文章宣称的“英格兰和威尔士的死亡人数统计”作者文中对该图曲线含义的描述 , 是准确的 。 但解读是大有问题的——先看上面几条曲线 。 首先 , 99-00年英格兰和威尔士的周死亡人数数据不应与今年的数据直接比较 , 因为20年前 , 英国的人口结构和医疗条件与今天是完全不同的(同理 , 所谓“过去27年的死亡数据 , 今年的死亡人数才排第八”也是缺乏比较意义的) 。 再者 , 称今年的死亡曲线与17-18年死亡曲线“未见明显差异” , 恐怕是有意采用“累积死亡人数”指标来作图 , 使视觉效果上感觉差异不大 。但仔细看就能察觉到 , 今年累计死亡358,751人的时候 , 比17-18年度同期已经多死了约4万人 , 即多死12%以上 , 这也能叫“未见明显差异”?再来看下面几条曲线 , 这几个数字的累计死亡人数的确差不多 , 今年年中均累计约近5万人左右 。 但绝不代表新冠死亡人数没什么大不了 。 要知道 , 黄色曲线是“流感加呼吸系统疾病死亡人数” , 并非光流感这个数字 。 而流感数字是多少呢?2019年冬到2020年流感季结束(第9周 , 即3月初) , 英国估算的流感相关死亡的中位数是7990人 。 换句话说 , 新冠死亡人数是流感6倍甚至以上之多 。另外 , 宣称“本次疫情的死亡人数曲线低于2017-2018年度、2019-2020年度65岁以下的死亡人数曲线”可谓毫无意义——就算65岁以下的人死亡风险相对65岁以上低很多 , 但这是全体死亡数字 , 死因包括交通事故、凶杀自杀、以及所有疾病 , 加起来也是个很大的数字了 。 新冠死亡人数低于这个值 , 丝毫不能让人感觉宽心 。评估英国疫情的严重性 , 依然应该考察超额死亡人数 。 那么 , 英国在疫情期间的超额死亡人数到底是多少呢?这是数据网站statista发布的英格兰和威尔士的周死亡人数统计 。图:蓝色是英格兰和威尔士在2020年的周死亡人数 。 黑色是2015-2019年同期平均 。 灰色是2020年的新冠死亡人数 。自3月下旬开始 , 英国每周死亡人数有了巨大的飙升 , 这个飙升与新冠死亡人数曲线是基本契合的 。 那具体是多少人呢?根据天空新闻引述英国国家统计署 , 这多出来的死亡人数里 , 约有5万人是新冠死亡 , 还有1.4万人是其它原因死亡(包含未确诊死者) 。 根据英国金融时报的统计 , 在疫情高峰期 , 英国的死亡率上升了45% 。补充说明:本文涉及瑞典新冠疫情的内容 , 部分参考了公众号“一小时爸爸”(id: hrdaddy)的文章《大数据能透视疫情 , 发现新冠不可怕?为什么总有人惦记着扰乱防疫呢?》https://mp.weixin.qq.com/s/RvOVPwccts2vorCaywuqVg , 特此致谢 。


    推荐阅读