作为一种新型报道方式,数据新闻正在越来越多地进入公众视野。虽然对数据新闻的定义五花八门,但教育界和媒体行业有一个共识,数据新闻至少要有三个要素:新闻、数据、可视化。
首先,数据新闻必须是新闻,具备新闻价值,是新近发生的事实,或者新发现的事实,或重要,或有趣,或解释现象,或揭露秘密;其次,数据新闻必须有数据支撑,通过分析数据进而发现问题并挖掘出新闻故事;另外,数据新闻通常使用可视化手段,呈现文字难以描述的内容,或者文字描述难以让读者更好地理解内容。可视化既可以很简单,比如在文字中罗列数据,或是做一个简单的数据图表,也可以很复杂,比如信息图、互动页面、动画视频等。
相比于一般新闻报道,数据新闻的选题多了一个要求:必须要有数据。那么是先有选题还是先有数据?这个问题就像鸡和蛋的关系一样,没有令人满意的答案。在选题操作中,既可以是选题先行,再去寻找数据,也可以是先找数据,进而从数据分析中找到新闻,无论哪一种情况,都要运用数据对所发现的问题或现象进行探究或解释,最后以恰当的方式呈现给读者。
作者过去两年从事与数据新闻相关的教学工作,指导学生创作了超过五十篇数据新闻作品,这些作品选题各异,涉及时政、教育、人口、经济、民生、文化、新闻出版、环保、科技、娱乐、体育等多个领域。这些作品的选题都是如何确定的?寻找选题又有哪些方法呢?
一、关心时事,从新闻中寻找选题
很多数据新闻选题都来自新闻报道。平时阅读新闻时留意有可能做成数据新闻的选题,并把它记录一下,积少成多,就会形成一个选题库。
例如《134亿学前教育发展基金,你的家乡能分到多少?》的选题,就来自2018年11月20日的一条新闻,有媒体援引财政部网站公开信息,财政部将提前下达2019年学前教育发展基金,总计134亿元。学前教育发展基金是否每年都有?2019年的预算相较以往是增加了还是减少了?这笔预算的分配有什么规律?通过初步的信息梳理发现,与2017和2018年相比,2019年的学前教育发展基金减少了10%。数据分析还发现,学前教育发展基金每个省区直辖市都获分配,人口多,城市化率低,农村人口数庞大的省区,被分配的发展资金相对多,从一个侧面反映中央财政对欠发达地区的支持。
《端上谈判桌的为什么是大豆?不是小麦玉米!》,这篇作品的选题受中美贸易战相关报道所启发,中国反制美国贸易战的“武器”主要是农产品,而农产品中,大豆被经常提及。为什么是大豆?而不是其他农作物?大豆都有哪些用途?为什么中国的大豆不能自给自足?除了美国,中国还从哪些国家进口大豆?近年来,进口大豆的数据有什么变化?对这个选题所涉及的专业领域学生并不熟悉,需要大量阅读文献,查找海关进出口数据,世界谷物协会数据,并采访农科院的技术人员。作品通过多个纬度的数据,解释为什么中国要进口大豆;通过梳理中国大豆生产历史,解释为什么中国从大豆出口国变为进口国;作品还发现一个问题,中国十多年前就提出“大豆振兴计划”口号,但大豆非但没有振兴,反而对进口依赖越来越大。
《一年437万对夫妻离异,有一个原因不容忽视!》这个选题也是来自新闻报道。2018年8月,民政部公布《2017年社会服务发展统计公报》,其中提到2017年中国离婚人数437.4万对,不少媒体对此做出报道,但都大同小异,通过简单数据可视化的呈现,告诉读者离婚率高的事实,但没有告诉读者,中国的离婚率在世界所处的位置,是高,是低,还是处于平均水平?这么多人离婚,背后的原因是什么?学生们去南京市栖霞区婚姻登记处采访,发现办理离婚手续跟“买菜”一样,手续非常简单,15分钟就可以办完。采访还发现有人为买房而假离婚。通过查找资料和数据,发现新中国成立以来,中国人离婚从不自由到自由,进步的同时,由于离婚手续过于简单,也令婚姻变得不那么神圣。数据分析发现,离婚率与房地产政策变化有关系,房地产限购的年份,离婚率会升高。通过对比国外离婚政策和数据,发现一些国家和地区,离婚手续繁琐,离婚成本高,而中国的离婚率已经超过某些发达国家和地区。
二、保持好奇心,在熟悉的领域寻找问题
学生身处高校,最熟悉的领域是教育,只要保持好奇心,就会在学习、实习、考研、求职中发现很多值得探究的问题,其中一些问题就可以变成数据新闻的选题。
每年都有很多大学毕业生选择考研,重点大学的报名人数尤其火爆,为了让考生清楚知道自己有多大机会能考取理想高校的研究生,我们决定做一个考研选题《新闻传播考研,哪家学校最难考?》。由于高校数量众多,院系情况各异,我们将分析范围缩窄至42所“双一流”高校。通过查找这些学校新闻传播研究生(包括全日制学硕、全日制专硕、非全日制专硕)报名人数、录取人数(包括考试录取和保研录取),分析哪些学校研究生招生规模大容易考,哪些学校接受保研比例高难考,哪些学校侧重于学术型硕士培养,哪些学校招收的专硕数量最多,从研究生推免率、报录比、就业率等多个维度进行分析,教会考生如何分析数据,做出有利于自己的选择。
社会上不少机构热衷搞大学排名,这些大学排名是怎么计算出来的?学生们对此很好奇。在英国 QS 世界大学排名网站上,学生们发现,QS 虽然公布了排名计算公式,但根据其公布的数据和公式,并不能计算出其公布的结果,而且,有些排名没有统计单项数据,却得出了综合排名,根据所获取到的 QS 网络调查问卷发现,所谓高校学术声誉,就是让被调查者提供国内外各10所大学名称而已。于是学生写了《我们调查了 QS 世界大学排名,发现了三个问题!》,揭开QS大学排名的神秘面纱,告诉人们,所谓的世界大学排名,原来评选过程并不严谨。
在高校网站上,可以查到很多公开数据。教育部2014年公布《高等学校信息公开事项清单》,要求高校公开包括基本信息、招生考试信息、财务、资产及收费信息、教学质量信息等十大类信息。学生们对其中的财务信息公开产生的兴趣,各个高校信息公开做得怎么样?“双一流”大学的钱都从哪里来?都花在什么地方?哪些大学钱多?哪些学校预算做得精准?学生们通过查阅42所大学的预决算报告,完成了《“双一流”高校财务公开:哪家经费最多?哪家预算最精准?》这一作品。
教育类选题,是学生们做的最多的选题,一是接近性,学生们身处校园,对教育方面存在的问题和现象比较敏感,容易找到选题;二是教育部门和高校,在信息公开方面做得比较好,数据容易获取。三是采访对象容易接近,选题容易操作。
三、多看数据新闻案例、举一反三
多看数据新闻优秀案例,学习别人的方法,举一反三,对找选题就会有启发。澎湃湃客平台“有数”栏目,截至2019年8月共有91支数据新闻和信息可视化团队入驻,“有数”每天发表大量作品,多看作品,就会逐渐培养数据新闻的选题策划能力。除了澎湃“有数”,新华社、新京报、界面、每日经济、China Daily、网易等媒体,都设有数据新闻栏目,初学者可以先从看作品学起。
网易数读曾经做过一个分析楼盘名称的数据新闻《我们分析了54069个楼盘后,发现了中国楼盘取名的套路》,受该作品启发,学生们从恒大、碧桂园、万科三大地产商官网上抓取了2000多条楼盘名称信息,分析发现三大地产商给楼盘取名的套路,比如爱用与大自然相关的词汇,出现最多的词语包括“天”“山”“江”“湾”“湖”“海”“花”“洲”“岛”等,爱用“府”“城”“都”“公园”“庭”“台”“里”“郡”等词汇,动物最钟意“龙”和“凤”,喜欢皇家气派,爱用“御”“金”“玺”“龙”等词,另外还要有珠光宝气,最喜欢用 “翡翠”。
与分析楼盘名称的方法一样,我们从百度地图抓取了南京市的2000多条街道名称,通过词频分析和内容分析,发现南京街道名称的特点:门特别多,名山大川遍布、有着缤纷的颜色,像是一个动物世界,承载着中国历史,《南京这座古董铺子,在2000多条道路里都藏了哪些秘密?》由荔枝新闻首发,作品形式新颖,内容有趣,引发许多互动。
四、从政府信息公开网站中找选题
随着政府部门和教育部门信息公开工作的推进,政府部门网站和高校网站都有很多公开信息,有的是结构性数据,有的是非结构性数据,如果有一定的新闻敏感性,就可以从这些公开信息中,寻找到有新闻价值的元素,进而形成新闻选题。
江苏人力资源和社会保障网公布了一份“三支一服”招募计划名单,有详细的学生姓名、性别、毕业学校、学历等信息。很多学生对“三支一服”并不了解。什么是“三支一服”?每年有多少“三支一服”名额?什么学生选择参加“三支一服”?参加“三支一服”有什么好处?“三支一服”是新一轮“上山下乡”运动吗?……带着这些问题,学生们去寻找答案,除了查找资料和数据,理清大学生村官、西部计划、“三支一扶”三者之间的关系,还要采访参加 “三支一服” 的大学生,在冰冷的数据之外,增加有温度的人物故事,最终形成了《数据告诉你,哪些大学生选择下基层?》。
南京民政局官网每个月都会公布民政统计月报表,里边有很多数据,学生从中发现,南京市每年火化遗体数约5万具,遗体火化后如何处理?墓地够用吗?不够用怎么办?带着这些问题,学生们开始了解南京的殡葬改革,查找数据,并到公墓去采访,最后完成了《你听说过“3D生态云葬”吗?》这篇介绍生态葬的作品,用数据普及了生态葬的知识,内容很有趣。
人口题材是数据新闻常见的选题,人口信息可以从政府统计年报中查到。学生们查找了改革开放40年来江苏省人口的变化,创作了《40年中国人口发生了哪两个显著变化,一个江苏省就能体现》,从数据可以清楚地看出,40年中国人口流动的趋势,就是从农村到城市,从欠发达地区,向发达地区流动,一个省如此,全国亦如此。学生们也关注了香港的人口变化,通过《8组数据告诉你香港人口老龄化有多严重?》,用官方统计数据分析香港人口老龄化的原因,即晚婚、晚育、少子、长寿。
2019年,南京市公安局公布了一份“积分落户”人员名单,名单上有新落户的人名、身份证部分字段、落户区域等。通过数据处理,可以清楚地发现,申请南京“积分落户”的4000多人中,一半来自本省,一半来自外省,而外省又以邻近的安徽省为主,居住年限和房产情况是“积分落户”的最大“敲城砖”。用同样的方法分析北京、上海、深圳等外来人口较多的城市,情况可能又不一样。
政府信息公开,是数据新闻的“富矿”,没事儿去逛逛政府网站,就可能有意外的收获。
五、从行业报告、企业财报中寻找线索
不少行业协会、调查咨询机构、中介组织都会定期或不定期发布行业报告,阅读行业报告和企业年报,可以从中挖掘到数据新闻的选题。
中国演出行业协会每年都会发布《中国演出市场年度报告》,里边有很多演出数据,每一组数据,都可以衍生为一个数据新闻选题,对话剧感兴趣的同学创作了《话剧:小众的狂欢,还是大众的繁荣?》,通过话剧的票房、票价、观众、政府补贴、剧团经营等多个数据维度,结合人物采访,说明话剧“繁荣”背后有多种原因,除了剧团推出优秀剧目,小众但稳定的话剧观众、政府补贴也功不可没。同样一份报告,除了可以分析话剧市场,还可以分析音乐剧、农村演出、政府文化补贴等等,做出不同选题的数据新闻。
国家卫计委定期公布《全国口腔流行病学调查》,里边涉及大量的牙病调查数据,虽然上次调查已经过去两年,但结合新的采访,学生们创作了《我国竟有64%成年人每天刷牙不足两次》,这个作品在湃客上发表,引发读者共鸣,取得了不错的传播效果。
六、从生活经验中找选题
用支付宝的人大约都知道「蚂蚁森林」(用户通过步行、地铁出行、在线缴纳水电煤气费、网上缴交通罚单、网络挂号、网络购票等行为,就会减少相应的碳排放量,可以用来在支付宝里养一棵虚拟的树。这棵树长大后,公益组织、环保企业等蚂蚁生态伙伴们,可以“买走”用户的“树”,而在现实某个地域种下一棵实体的树),它将电子支付与环保理念绑在一起,既营造了良好的企业形象,又满足了消费者的环保“虚荣心”。蚂蚁森林种树的地方是内蒙古,为什么要到内蒙古去种树?一定是那里的树少!在一般人的印象里,内蒙除了草原,还有沙漠,是沙尘暴的发源地。但查找资料却发现,内蒙古的森林面积在全国排第一,内蒙是怎么做到的?学生们完成的数据新闻《考考你!中国哪个省份森林面积最大?》在湃客号发表后,获得了意想不到的热评,被评为澎湃2019年6月数据驱动内容排行榜三等奖。
用手机的人都知道,手机里安装的 App 会读取手机里的数据信息,比如手机型号、位置、联络人等等。App 读取手机数据的情况有多严重?会导致哪些后果?如何防止个人信息泄露?学生们在某应用商城里爬取了数万个 App 的应用程序安装包,通过分析这些安装包中的用户权限调取文档,完成了《8.7万条数据告诉你 安卓 App 里面到底有多少“坑”》,揭露应用商城监管不力,致使众多 App 随意调取用户隐私数据,留下安全隐患。
近年来,高铁成为人们出行的常用交通工具。高铁如此便捷,民航是否大受冲击?是不是有了高铁,人们坐飞机少了,民航的业绩会大幅下滑?通过查找数据,学生们发现,民航的收入不减反增,民航都采取了哪些手段应对高铁的冲击?通过查找数据和采访民航业内人士,学生们创作了《高铁抢了民航的生意吗?》,通过腾讯位置大数据和飞常准等第三方数据,发现高铁的出行数据以中短程为主,而飞机的出行数据以中远程为主,在“一带一路“政策下,民航开辟了更多的国际航线,与高铁差异化竞争,寻找到新的出路和财路。
日常生活中多观察,多思考,在司空见惯的现象中寻找问题,用数据来解读,就有机会发现各种有趣的答案。
七、头脑风暴聊出来的选题
2018年下半年,我们想做一个年终盘点的数据新闻选题,但一直没有找不到合适的选题。我在首尔参加全球深度报道网年会时,与每日经济记者聊天,获悉2018年内地企业蜂拥到港上市,数量可能是历年来最多的。为什么内地企业要赴港上市?为什么2018年赴港上市“井喷”?赴港上市的都是些什么企业?来自哪里?上市后的市值如何?基于这些疑问,我们与《每日经济新闻》记者合作,完成了《七成赴港上市内地企业都破发了,小米、海底捞们图个啥?》。
没有想法的时候,可以与同伴一起头脑风暴一下,或许可以找到思路。
结语
做数据新闻有时候是选题先行,之后再去找数据,有时候,是先有一个大的方向,在找数据的过程中,逐渐形成选题;还有的时候,是数据先行,从分析数据中确定选题。选题确定之后并非一成不变,有时候在做的过程中,发现事先的想法不可行,或者进展不下去,或者有了新的发现,就会临时转换选题的角度。
完成一个数据新闻选题,不亚于做一个行业调查报告,问题意识、采访沟通能力、数据获取与分析能力、写作能力、解释问题的能力都会得到锻炼。
白净,博士,南京大学新闻传播学院教授,主要研究方向:新闻实务,可视化应用,媒介伦理与法规。