数据看世界|9幅动态图5个数据指标带你了解新冠肺炎的全球现状!!
BrandImg
数据看世界|9幅动态图5个数据指标带你了解新冠肺炎的全球现状!!
3 赞同
9 收藏

加入我们,每日刷题:


https://t.zsxq.com/MbynyB2​t.zsxq.com/MbynyB2


坚持写作两年,我的第一本书《数据分析之道——用数据思维指导业务实战》正式出版啦!

PS:本来小编是打算全部都放动态图的,奈何动态图太大,超过了正篇文章不超过10M的限制,所以小编就只能放静态图了,如果大家需要动态图,文末有动态图领取方式。

随着冬季气温的降低,全国部分地区陆续出现了新冠本土病例,一直承担着国际航班进出港重任的上海也沦陷了,与此同时,全球范围内也有很多国家和地区还处于水深火热之中。新冠现在的情况到底如何?作为医学生物信息学出身的小编就通过数据和一些指标带大家一起了解下新冠疫情目前的全球情况。

首先,我们先通过一个短视频来了解下新冠肺炎是怎么在全球范围内传播开来的。

虽然,今年年初,新冠病毒是在武汉遭受了新冠病毒的攻击,但是经过中华民族的共同努力,中国已退出了群聊。而放眼全球,情况却不容乐观,全球新冠疫情从年初到现在是变得更好还是变得更糟?没有数据不足以说明情况,没有指标体系不足以监控问题,下面我们通过不同的数据指标来了解全球疫情状况。

1 确诊病例数

只有当全球的每个国家的病例都清零,才能结束这一场新冠大流行。现在新冠在全球的传播情况到底怎么样呢?在这一年中,我国采取各项积极措施扼制新冠的发展,取得了比较好的成果;与此同时,也有一些美国、印度等国家放任新冠的发展,确诊病例不断增加。具体情况,我们来看一组动图说明现在的情况下。从下图记录了从2020年7月1日到2020年11月26日的全球新冠确诊病例,单位为百万。我们可以看到,大部分国家新冠确诊病例呈下降趋势,部分国家不降反增。


‍‍图1 全球确诊病例数/百万


2 死亡病例

死亡病例是指确诊新冠的人群死亡的人数。该指标衡量了新冠病毒的致死性,下面我们从全球维度和国家维度对这个指标进行拆解。

全球累计死亡病例

从整体上看,全球死亡病例数不断增加,至今已经突破143万大关。


图2‍ 全球死亡病例‍


‍‍

各个国家的死亡病例数

虽然全球情况如此,但是各个国之间还是有差异。如果仅看总体数值,很可能掩盖掉个体差异。所以我们需要对死亡病例这个指标按照国家维度拆分,这样就可以清晰地看出每个国家的死亡病例情况。



图3 各国死亡病例


死亡人数的轨迹清楚地表明了不同国家受到的影响有多么大的不同。坡度的陡峭程度表明在疫情的特定时刻死亡人数增长的速度有多快。

我们可以看到大流行影响国家的三种不同方式:

  • 一些国家未能遏制大流行,死亡人数继续迅速上升。
  • 一些国家爆发了大规模疫情,但随后“曲线弯曲”,使死亡人数再次下降。
  • 有些可以完全防止大规模爆发。例如,图表中显示的是韩国和挪威。这些国家爆发迅速,但随后能够将死亡人数迅速减少到低水平。

3 死亡率

死亡率(CFR,the ratio between confirmed deaths and confirmed cases)是指死亡病例数占确诊病例的比率,同样也是一个衡量新冠致死性的指标。

可能有小伙伴就会问,前面不是已经有一个死亡病例数了吗?为什么还要看死亡率这个指标?

因为每个国家的人口基数和感染基数不一样,绝对值数据并没有考虑人口规模带来的差异,例如,美国,巴西和墨西哥等国家死亡人数较高,同时他们也是世界上人口较多的国家,因此,我们要通过死亡数量除以确诊数量得到新冠患病死亡率作为监控指标会更加合适。

从各个国家新冠死亡率数据来看,疫情初期,各国家对新冠的认识和探索都不够深入,防范意识不够以及医疗方面都没有经验,所以死亡率持续走高。而随着科研的进步,研究的深入,各国人民逐渐站我新冠病毒的传播规律和途径并采取了一些有效措施扼制其发展,所以死亡率在2020年3月30日左右达到顶峰之后,出现了明显的下降趋势。


图4 各国新冠死亡率



为了深入探讨死亡率,我们绘制了确诊病例数与死亡病例数之间关系的散点图。确诊病例数远远少于总计的case数,主要原因是核酸检测能力的局限。图片中灰色的线是其对应的病例死亡率(CFR,the ratio between confirmed deaths and confirmed cases)。


图5 各地区确诊病例数与死亡病例数之间关系的散点图



4 超额死亡率

什么是超额死亡率?

超额死亡率(Excess mortality)是指所有原因造成的死亡人数,超出了我们在“正常”条件下预期的水平。在这种情况下,我们感兴趣的是COVID-19大流行期间的死亡人数与前几年同一时期的平均死亡人数之间的比较。用数据分析领域的专业术语来说,就是所谓的同比。

研究超额死亡率的意义

监测超额死亡率有助于理解大流行病对死亡的总影响-包括直接影响和间接影响。 超额死亡率可以帮助我们了解新冠引起的死亡的直接影响,因为部分死亡病例没有得到正确的诊断和报告,例如因为没有进行病毒测试。 同时它也帮助我们了解间接死亡率的影响,包括该流行病影响卫生系统和生活条件的许多方式。例如,如果大流行病压倒了卫生系统或将资源从其他健康问题中转移出去,更多的人可能死于非新冠原因,超出了我们的预期。因此,超额死亡率是衡量大流行病对死亡影响的更全面的指标,而不仅仅是确认的新冠死亡人数。

如何计算超额死亡率

超额死亡率是通过2020年同一周期的死亡人数减去2015年到2019年同一周期内死亡人数的均值得到的差值。



虽然原始死亡人数有助于我们大致了解规模,但这项措施有其局限性,包括由于人口差异很大,各国之间的可比性较差。P评分在各个国家之间具有更高的可比性,它使用2020年每周死亡人数与前五年同一周平均死亡人数之间的百分比差来计算超额死亡率。



例如,如果一个国家在2020年的给定一周内的P得分为100%,则意味着该周的死亡人数比同一周的平均死亡人数高出100%,即对比前五年翻了一番。

虽然P分数是一种有用的度量,但它也有局限性。例如,五年平均死亡计数可能是“正常”死亡的一种相对粗略的度量,因为它没有考虑人口规模或死亡率的趋势。

结论说明

这里的图表显示了大流行期间的超额死亡率,我们使用P分来衡量超额死亡率,即2020年每周死亡人数与前五年(2015-2019年)同一周平均死亡人数之间的百分比差异。


图6 各地区超额死亡率



由于P-评分衡量的是一个国家内部的百分比差异,它允许在各国之间进行直接比较。从图表中可以看出,一些国家如英格兰和威尔士3和西班牙的死亡率过高,而其他国家如德国和挪威的死亡率则略有上升。

举个例子说明,英格兰&威尔士在2020年4月30日这一周P分为100%,这意味着该周的死亡人数比前五年同一周的平均死亡人数高出100%,即双倍。

年龄分组的超额死亡率

根据我们的经验和常识,年龄和死亡率是成正比的,所以我们对P分数从年龄维度进行了拆解。


图7 按年龄分组的超额死亡率



此处的图表显示了按两个大年龄段细分的P分数:年龄在15至64岁之间,其中包含大多数工作年龄人口;年龄在85岁以上,具有最高的死亡风险。

即使是15至64岁的年轻劳动人口,其在西班牙也遭受较高的超额死亡率,而德国即使是其85岁以上的最脆弱人口,其死亡率也相对较低。

5 阳性率

阳性率(positive rate)是在特定国家/地区的核酸检测中有多少份额确诊了新冠。

当一个国家的阳性测试率较低时,这条线是蓝色的,说明这些国家为防止疫情大规模爆发做出了很多努力;红色表示核酸检测阳性率高,这表明感染的真实数量可能远远高于确诊病例数。


图8 各地区阳性率


从图表中我们可以看到一些国家曲线很早就出现了“拐点”并很好地监控了疫情,而其他国家则没有,国家之间的差异确实很大。

  • 泰国,新西兰和韩国的数据显示,这些国家从一开始就对疫情进行了良好的监控,或者在初次疫情爆发后迅速采取了合理有效的措施。最终,他们达到曲线拐点并减少确诊病例的数量,同时增加了测试与确诊病例的比率。
  • 巴西,墨西哥,美国,巴拿马,印度,南非和尼日利亚的数据表明,相对于疫情爆发规模,这些国家的核酸检测规模小。此外,不幸的是,这些国家/地区的每日病例数仍然很高–它们的线是红色的,并且远非零。


图9 阳性率世界地图


阳性率低于3%的国家/地区以蓝色阴影显示。阳性率高于5%的那些以红色阴影显示。

世界地图同样也显示了各国之间的巨大差异:

  • 一些国家,例如澳大利亚,韩国和斯洛文尼亚,对于发现的每种病例都进行了数百甚至数千次检测-因此这些国家的阳性率低于1%甚至0.1%。
  • 其他国家,例如墨西哥,尼日利亚和孟加拉国,对于每个确诊病例,都很少进行测试(五个或更少)。他们的阳性率很高。

每个确诊病例检测次数很少的国家,可能是由于医疗卫生水平落后造成的,因此不太可能进行足够广泛的检测以发现所有病例。世界卫生组织建议将阳性率低于10%,但最好低于3%,作为适当测试的一般基准。

6 疫情尚未结束,我们仍需防护

新冠不会在短期内被根除,我们需要避免病毒快速,大规模爆发。

首先,需要避免疫情在此大规模的爆发,从而导致医疗系统崩溃。

举个例子来说,医生可以一个接一个地帮助10,000名患者,但是当10,000个患者同时生病时,医生不能帮助一万个患者,大量病人可能超出医疗保健系统的能力(如图所示)。


图10 确诊病例与医疗保健系统的能力之间的平衡


当这成为现实时,许多人得不到治疗而死。随着越来越多的医护人员生病,医疗系统的容量在最需要的时候就下降了。

不幸的是,这在大流行期间已经发生了好几次:对医疗保健的需求远远超过了该系统在意大利北部,马德里,纽约市以及世界其他几个地方所能提供的服务。

其次,需要降低感染率。这就是“拉平曲线”的逻辑,目的是减缓疾病的传播,以便减少疾病的高峰期,并能够照顾到所有需要照顾的人,或者至少照顾更大比例的人。

这些策略有两种强度:缓解和抑制。

  • 缓解策略的目标是降低感染率,以至于将繁殖数量(Rt)(每个病例产生的预期继发病例数)降低到1以下。因为Rt保持在1以上由于群体免疫的积累,大流行病发展到一个高峰。
  • 抑制策略的目标是将Rt降低到1以下,并将感染总数保持在如此低的水平,以至于羊群免疫永远无法实现。 希望是一种能够提供免疫的疫苗。

我们知道可以降低Rt并使曲线变平。世界许多地区的国家(例如,韩国,德国和乌拉圭)数据已经表明有缓解甚至遏制大流行非常有可能。

将感染率保持在较低水平的国家能够避免疫情急剧上升,同时生病的人数仍处于医疗保健系统的能力范围之内。


图11降低感染率的策略


世界各地的科学家都在研究与这种流行病作斗争的解决方案-更好的监测方案,药物治疗,以及在最佳情况下使用疫苗-但这需要时间。

而作为普通人呢?我们就需要勤洗手,戴口罩,注意个人卫生,少去人多的地方啦!


数据分析师除了掌握数据分析工具之外,拥有数据思维也是极为重要的。

数据分析师这个岗位并不直接参与到业务决策中,就算数据分析师提出合理、切实可行的意见或建议,业务方也不一定采纳。所以这类问题考验的已经不是数据分析师基础的数据分析能力,更多的是其软技能、沟通能力及影响力。数据分析师在提出意见和建议时可以考虑用图表代替文字说明问题,用业务方听得懂的话代替专业术语陈述建议。另外,如果你的建议能够帮助业务方提升 KPI,那么业务方多少会对你的建议感兴趣。当然,从不同的业务出发,从不同的分析角度着手,都能提出各种不同的建议。所以本节只是抛砖引玉,至于如何在不同业务形态中提出合理、可行的建议,就需要数据分析师在实践中积累了。



市面上大部分数据分析相关的书籍都是从工具的介绍开始的,但很多时候数据分析主要依靠数据思维。
特别是面对复杂业务场景时,对于业务的熟悉程度及数据思维显得尤为重要。
因为数据思维决定了分析问题的角度及合理性,只要数据分析师能够针对特定问题提出分析方案,无论用什么工具都可以得到结果,因此数据思维是数据分析师成长进阶路上的必修课。
而市面上关于数据思维的书籍较少且部分书籍讲授的知识点较浅,能够将数据思维、编程语言、统计学思想及案例分析等融为一体的书籍少之又少,强烈给大家推荐这本以数据分析全流程为主线的数据思维的书——《数据分析之道——用数据思维指导业务实战》


附上全书的目录,本书围绕数据思维展开,一共11章内容。





数据来源:Our World In Data

如果您觉得我们的文章还不错,请分享,点赞,再看,一键三连!!!



用数据来看马拉多纳究竟有多么闪耀!!!


Python入门教程(六):Numpy计算之布尔运算


大数据相关职位的真的了解吗?

编辑于 2022-03-29 · 著作权归作者所有