辅助功能设置

文字大小

色彩设置

单色 柔和色 dark

阅读工具

底部遮盖 标尺

文章

主题

疫情之下,数据的 100 种表达

注:本文原发自澎湃新闻·湃客频道,全球深度报道网经湃客唯一官方公众号“湃客工坊”(ID:thesparker)授权转载

2020年,一场新冠肺炎的暴发抢过了庚子春节的主调,身处其中,我们亲自为这场抗疫写下注脚。疫情实时地图、扩散路径还原、感染人数建模、问卷信息收集……有数编辑部整理了一批优质数据项目,来看数据的100种表达方式,重温数据创作者们在这次疫情中贡献的力量。

本文分两大部分,一是从病例数据、人口流动、知识科普、应对措施、疫情影响五大角度出发的作品汇总,二是观察了上百个疫情数据作品后我们的一些思考。

有关病例数据的一切

实时地图

澎湃新闻·美数课:新型冠状病毒肺炎病例实时更新地图

丁香园:新冠病毒最新实时疫情地图

北京大学可视化与可视分析实验室:疫情晴雨表等系列交互地图

眼看着疫情从最初的一张静态长图到各家媒体标配的动态地图,并随疫情发展不断完善。如丁香园除地图外,后期还开辟了辟谣与防护、疾病知识、最新信息实时播报栏口,便于读者一站式查询,澎湃新闻·美数课则在国内确诊数据放缓时及时上线「治愈地图」,国外疫情加重时,呈现细分的国际疫情数据。地图成为人们了解疫情动态的第一窗口。

但保证地图数据真实、准确、及时,并非易事。各家实时地图也会出现数据不一致的情况,同样来自官方数据,为何差异巨大?镝数团队对此做了分析。镝数:新冠肺炎病毒肆虐,疫情数据如何辨真伪?

时空追踪

一个贯穿整个疫情期间的数据操作。从最初几百例到7万多例,从国内到国外,从群像到细分的死亡病例、无症状感染人群、确诊儿童,从输入性到家庭聚集性病例……观察每一个或大或小的切口,都让我们对病毒的了解增加一分。

照路明:新型冠状病毒肺炎病例群像:何时发病,多大年龄,在哪分布?

上观数据:新型冠状病毒肺炎值得注意的细节:我们整理了277个病例和41个死亡案例

澎湃新闻·美数课:763例确诊患者的故事,还原新冠病毒向全国扩散的路径

DT财经:7.2万条病例数据首次披露,疫情如何发展到了今天

财新·数字说:新冠逝者:数字后不可遗忘的人

对上述内容分析的详尽程度,取决于政府信息公开程度。对此,一些机构做了有趣的记录:

南都大数据研究院:30省份170份疫情通报谁最高冷?这些地方病例越多信息量越粗、新冠肺炎疫情信息公开60天全记录

帝都绘:疫情爆发后的一个月里,你的城市做了什么?

后期备受关注的国外疫情:

21数据新闻实验室:下船!31天3711人感染新冠肺炎542例 一图复盘“钻石公主号”非常之旅

上观数据:确诊病例超过2000!为何海外疫情的爆发点是韩国,而不是日本与新加坡

澎湃新闻·美数课:2个月,13753例,新冠肺炎如何蔓延全球?

数据冰山:美国疫情分析:检测数据背后的政治“学问”

严肃的人口学八卦:意大利的病死率为什么这么高——来自人口学视角的分析

数字背后,是一个个鲜活的生命。他们的每一次发声,都值得被记录。比如,他们曾经在社交媒体上发出的「求助」。RUC新闻坊:1183位求助者的数据画像:不是弱者,而是你我

疫情预测

病毒什么时候爆发,最终会感染多少人,疫情拐点何时来临,我们什么时候能摘口罩。一切或好或坏的预测,乃至决策,都建立在病例数据的基础上。如前DHS生物监管总监接受大数据文摘采访时所言:疫情中数据的作用无法忽视,但也不能盲信模型。

集智俱乐部:防控力度多大才能遏制疫情发展?网络动力学推演给你答案

chenqin:2月3日全国确诊新型肺炎20438例,死亡425例,目前防治情况如何?

大数据文摘:疫情中数据的作用无法忽视,但也不能盲信模型 | 专访前DHS生物监管总监

过程中,我们经历了由于统计口径更改带来的数据大幅变化。2月13日,湖北新增14840例新冠肺炎确诊病例,随后,接连两天下降,2月15日早上,这个数字又降到了2420。DT财经:湖北数据大幅波动意味着什么?

人口流动数据哪里找

离开武汉的人去哪了?

23日,武汉宣布封城。26日,武汉市长周先旺表示,「目前有500多万人离开武汉,还有900万人留在城里」。有多少人离开武汉?我在的城市安全吗?是春节时人们最关心的话题。毕竟,碰上九省通衢的武汉和春节这个特殊节点,没有谁能置身其外。

来自地理角度的分析:

地球知识局:我们研究了一下如何避开武汉,几乎不可能

基于百度慧眼的人口迁徙数据分析:

新一线城市研究所:这13天,离开武汉的人都去了哪里?

DT财经:离开武汉的那500万人到底去了哪里?

大连民族大学许小可团队:学术视角告诉你:500万武汉人是“逃离”还是“正常离开”

关注武汉之外

人口迁徙导致了病毒向全国扩散的必然性,但当武汉成为全部焦点时,「灯下黑」的问题在前期被忽视了。

社会网络与数据挖掘:当目光聚焦武汉时,湖北其他城市也在“求助”

数据冰山:东莞商丘周口,戴口罩要加油

知链数据:城际迁徙数据告诉你,哪些“地市”需要重点关注?

上观数据:为什么温州会成为湖北外,新冠肺炎确症病例数最多的城市

国际人口流动

时间来到3月,中国大部分地区新增确诊开始收窄,疫情得到控制。此时国外疫情日趋严重,外防输入成为二次防控的重中之重。了解国际间人口流动情况,航班数据是可供参考的指标。

南都大数据研究院:88例境外输入病例中,来自伊朗、意大利占比超85%

航旅圈:大数据丨境外疫情主要从哪些城市飞入国内

Alfred数据室:各城市一日内入境究竟有多少人?

复学复工

一延再延的假期过后,生活总要继续,复学复工迫在眉睫。面对依然严峻的疫情,大城市做好应对了吗?返程复工进度如何?百度慧眼迁徙地图数据再次派上用场。机场、高铁站、普铁站、汽车站等交通枢纽人流量、迁入迁出人口指数、城市内部出行强度是常见的数据指标。

城市数据团:你的城市复工了吗?

新一线城市研究所:复盘节后返城数据,你的城市属于“严控型”吗?

严肃的人口学八卦:全国返城复工进度如何?

新一线城市研究所:你还在居家办公吗?这些城市三成上班族已经回到了公司 | 城市生活复原追踪

作业帮APP一周下载量突破46万次,钉钉收获超82万条1星差评,喧嚣舆情背后,学生、老师、家长们的真实看法是什么?在线教育果真逆势翻盘了?

澎湃新闻·美数课:数说|“停课不停学”,目前大规模线上教学反响如何?

财新·数字说:数字说|“停课不停学”带火各路在线教育 哪些App受关注?

知识科普,最好的时代

传染病

新冠肺炎和 SARS 到底是什么关系?哪类口罩防护最有效?相比其它传染病,新冠肺炎的严重性如何?历史上人类和传染病经历了怎样的纠缠史……突然间,科普遇上了它最好的时代。

回形针PaperClip:关于新冠肺炎的一切

严肃的人口学八卦:为什么新冠肺炎武汉病死率高于全国?

澎湃新闻·美数课:图释两千年传染病史:若瘟疫无法被根除,该如何与之相处?

搜狐四象工作室《病菌与人类》专题则以图绘形式做了系列科普,包括免疫系统如何工作、冠状病毒的分类、传染病潜伏期等等。

野生动物

如今我们经历的一切,都要从一只蝙蝠说起?未来,我们又该如何与野生动物相处。

谷雨数据:瘟疫曾多次放过人类,人类能否放过野生动物?

搜狐四象工作室:753种动物谁最“毒”?附“病毒王”分布图

山水自然保护中心:野生动物非法贸易为何如此乱象百出?

药物治疗

截至2月7日所有的临床试验,已有50项与新冠肺炎有关的临床试验已登记在案,其中既有洛匹那韦/利托那韦(克力芝)等西药,也有双黄连口服液,还包括太极拳。至于新冠肺炎为何迟迟没有特效药,需知新药研发本就有一套复杂的流程,遑论面对的是新型病毒。

上观数据:50项与新冠肺炎有关的临床试验登记在案,里边会有“特效药”吗?

DT财经:成功率仅0.02%,新冠治疗药物距离上市还有多远?

澎湃新闻·美数课:涨知识|新冠疫苗开始临床试验,为何我们至少还要等待一年?

疫情当前,如何应对?

关键节点

事后回顾关键性事件的时间节点,总能发现一些端倪。而与人们情绪密切相关的微博热搜,也部分见证了疫情发展的高低起伏。

第一财经周刊:特别报道——假如武汉的警铃有机会被拉响,可以是哪天?

大数据文摘:两个月热搜分析:疫情之下,哪些时、地、人、物处在风口浪尖

救助力量

澎湃新闻·美数课:盘点|各地驰援湖北的52支医疗队被派到了哪些医院?

DT财经:3万医护逆行背后,是谁在前方驰援湖北?

复数实验室:数读武汉医护感染 | 我们该如何更好地保护白衣天使?

毕导:科学家光写论文不抗疫情?我帮大家解读一下68篇新冠病毒论文

抗疫现场

澎湃新闻·美数课:如何运作一座容纳1461张病床的方舱医院?

镝次元:350多场新闻发布会带你微观防疫过程

RUC新闻坊:那些被吐槽的国家,为抗疫“默默”做了哪些努力?|视野

疫情之下,什么改变了?

对普通人

身处暴风眼的湖北人民,封城对他们来说意味着什么;远离风暴中心,被困在家的你我如何度过这段特殊时期;生活又发生了哪些突如其来的变化。

DT财经:外卖数据下的武汉:普通人的“封城”十日生活

回形针PaperClip:为什么你还买不到口罩

照路明:被新冠肺炎困在家中的中国人,这几天都在干什么?

大数据文摘:疫情期间全民上网图鉴:封城后,武汉内外的人们在线上做什么?

时代数据:多国限制入境,数十万中国留学生学途难归

照路明:后疫情时代:我们如何被新冠肺炎改变了生活?

从没哪个时刻如当下,接收铺天盖地的信息,有真知,就有谣言。

复数实验室:看了946条辟谣信息,我们提炼出一些信息辨别方法

航旅圈:数据 | 韩国人都飞去哪里了,韩国飞中国的都是什么人

Ele实验室:计算机仿真程序告诉你为什么现在还没到出门的时候

对行业/经济/社会

2003年的非典,给了我们警醒和经验,但新冠 ≠ 非典,且看时间会将我们带去哪?

DT财经:各行业扛疫能力大调查

时代数据:资本市场过山车应理性看待

谷雨数据:874万应届生:主动降低薪资预期,城市首选新一线

泽平宏观:疫情对中国经济的影响分析与政策建议

帝都绘:灾祸如何塑造城市?

趋势观察

数据,在疫情发展的每一个重要节点都留下了足迹,或答疑解惑,或记录现场,或探寻真相。观察了近200个数据作品后,在此将我们的观察分享给大家。

发挥优势,人人可以数据创作。我们曾在2019数据创作者大会上指出:数据创作者的身份日趋多元化,记者、设计师、程序员,还有“八卦”的人口学家、有趣的城市规划师、严谨的经济学家正参与其中……他们做事实核查,关注小众领域,发挥专业优势,不断拓宽着数据新闻的版图。

在这次疫情中,有民间自然保护机构-山水自然保护中心集结志愿者力量,分析野生动物非法贸易乱象,在#韩国人来青岛躲避疫情#的消息在网络上疯传时,关注航空领域的航旅圈第一时间以数据呈现事实,从不缺席的程序员Ele实验室模拟程序告诫大家不要出门,微博用户@江南剑心2组织网友自发绘制城市内部传播图,还有专注人口、城市、舆情、地理等创作者基于自身在专业领域的积累,不约而同展开数据叙事。

图源:@江南剑心2

数据共享,开源力量在行动。和蔓延的疫情相伴而生的,还有各类开源力量。确诊患者相同行程查询 、新冠肺炎小区查询等项目被广泛传播及使用,「本站数据接口和页面接受转发、嵌入、调用、下载」的说明又促进了项目的二次使用。又如澎湃新闻·美数课在疫情期间共享实时地图数据库及疫情明细数据,方便各界研究和报道。北京大学的疫情可视化工具也无偿开放给社会使用。

数据时代,多一些开源分享,或许就有多一些各学科、领域、人才间的碰撞创新。尤其期待未来看到更多机器学习、图像识别等计算机技术在新闻领域的使用。

共创时代,数据可以从哪里来?除了公开的政府数据、开源数据,商业力量也是数据生态中重要的一环。在这次疫情中,百度人口迁徙数据在分析人口流动路径时起到很大作用。外卖数据、电商销售量、APP下载数等商业数据,也间接展现了消费者在疫情之下生活状态的变化。此外,你的每一次在线操作,都在互联网上留下了足迹,社交媒体的数据当然不能错过。在这些作品中,我们还发现了不少来自问卷数据的新探索。当面向人群达到一定数量,保证样本科学的条件下,问卷调研可以弥补当疫情这类突发情况出现时,新数据的缺失。

可视化,为有精度地观察疫情而设计。在本次疫情传播中,首次与图表大家族会面。我们发现,疫情稿件中的可视化涵盖了95%以上的图表类型。除了常规条形图、折线图、气泡图等基本图形,网络关系图、日历图、南丁格尔玫瑰图等小众图表也被大众所熟知。更重要的是,好看之外,可视化高效准确地信息传达功能得到重视,如向帆融合数字技术与艺术设计,以时间和空间为重点探寻疫情表达方式,还有指数坐标等高阶玩法被应用,作者和读者间出现了更多专业性的讨论。

冷冷的数字背后,亦不缺人文关怀。相比文本、影像,数据似乎总给人冷冰冰的感觉,这也赋予了其理性、客观的特质。但当视角定格在《图释两千年传染病史:若瘟疫无法被根除,该如何与之相处?》一文时,人类与几千年的传染病纠缠史娓娓道来,不由让人感慨人类的渺小。我们用一片片花瓣表征一个个逝去的生命,为的是不忘却这场灾难中的每一个普通个体。数据说话,不仅是摆事实、讲道理,最终是为了讲述一个值得记录的「故事」。

抗「疫」尚未结束,数据的记录也在继续。

您可以根据知识共享协议条款免费转载这篇文章

转载


阅读更多

数据新闻

数据新闻中最常见的10个错误

在今年的 NICAR 会议上,GIJN 与几位数据新闻专家交谈,询问他们在数据新闻中最常见的10个错误,包括忽视空白行、混淆百分比和百分点、在图表中使用错误的刻度尺等等。

数据新闻

新冠三年,记者们围绕它展开了哪些调查?

自第一例已知的新冠病例被发现的三年时间里,世界各地的调查记者已经对这个现代史上最困难的公共卫生选题进行了诸多调查。在这篇文章中,我们回顾了其中最具创新性和影响力的调查报道。

数据新闻

深度报道精选:生为女性是原罪吗?

“唐山打人案”轰动中国网络舆论。要求女性主动规避风险,肩负自我保护的特殊负担,真的能为她们带来安全?还是会将她们的生活和行动置于处处恐惧之中?全球深度报道网精选了六月几篇值得一读的深度报道。

数据新闻

过去一年,有哪些不可错过的数据新闻?

在过去一年中,来自全球各地的数据记者们用数字、图表,甚至音符来呈现新冠疫情、气候变化、地区冲突等新闻议题。在这篇文章中,我们精选了过去一年中最值得一读的数据新闻报道。