NICAR分享 | 在可视化中,如何处理人口普查数据?
想知道如何为数据可视化处理人口数据?此次NICAR会议上,前USA Today的数据记者(现供职于《华尔街日报》)Paul Overberg就以USA Today Census Tool为例,教给你诀窍。深度网经授权转载镝次元数据传媒实验室(ID: dyclub-org)的分享,还可参考深度君总结的:《新闻数据使用要领清单:避开陷阱,完善处理流程》(戳标题即可进入)哦。
“2043年,美国将成为一个种族多样化的国家。”今年NICAR会议上,来自美国人口普查局的Stephanie Ewert这样说道,她所在部门负责统计移民数据以及移民社会经济情况的调研。
这句话可不是空口无凭。通过USA Today Census Tool,一看便知。
1970年,美国政府展开首次具有现代意义的人口普查后,诸如自杀率、犯罪率、宗教分布、男女比例等也随之出现,并逐渐成为国家发展的重要衡量指标。USA Today的多样性指数则分析了自2000年到2010年美国种族多样性变化,并且对未来四十年的趋势做了预测。
跨越时空的种族多样化差异
USA Today Cesus Tool
比较时间和空间:例如在任意的时间和空间里比较种族多样化差异
USA Today Cesus Tool在1991年首次出现,该工具基于十分简单的理念:两个人在种族方面的差异。这个差异被评级为0-100。
【图1】底部是一个时间滑块
【图2】鼠标悬停在地图上,可以看到更多的细节信息(这是该作品的主要的交互元素)
无论是那些变化大小,整体情况一览无余。值得注意的是即使是一些地区种族多样性差异不大,比如只有10到17的改变,但是对于当地而言已经是很大的改变了。
指数公式:靠谱吗?
指数是一种汇集各种不同的指标的综合性统计,奇妙之处在于数据的维度层级,你可以通过降低数据维度从而进行大量差异比较。USA Today多元化指数(USA TODAY Diversity Index)也是如此。
它的计算公式如下:
1-((%White^2 +%Black^2 + %Asian^2 + %AmericanIndian +%nativehawaiian) * (%Hispanic^2 + %NonHispanic^2))
(注:white为白人,Black为黑人,Asian为亚裔,AmericanIndian 为印第安人,nativehawaiian 为夏威夷土著, Hispanic为西班牙裔, NonHispanic 为非西班牙裔 )
注意,由于千禧年之前人口普查中勾选“多种族(双亲属于不同种族)”选项的人数太少,所以该选项就没有被考虑列入公式进行加权。不过公式一直都在完善中。
看见未来,如何在其他报道里使用Diversity Index?
还可以怎样运用此指数?如何在其中找到自己的故事?开来用特定数据来定制你的社群和城市报道。
- 地区与全国平均数据的比较,在相似表现的地区之间进行比较;
- 学校数据:查询任一学校的种族多样性;
- 狂飙的种族多样性:北弗吉尼亚沿着高速路通往Washington D.C.的近郊
- 北弗吉尼亚的学校里,学生们有多么国际化?
- 在你住的地方,有多少“本地人”?比如,出生地:是在科罗拉多州还是美国西部或者别的地方,甚至是国外?他们有多么“土生土长”;
- 多样性越大,社群就会越稳定,经济情况也会更好。
如何使用人口普查数据
表格名称:B02001 Race within the census data
下载链接:Censusreporter.org/tables/B02001
表格名称:B3003: Hispanic
第一步:登入census.org-开始输入表格数字(例如B02001)—然后你会得到关于表格的基本信息—你可以输入一个地名,或者你想要知道的东西。
第二步:一旦选中某个地方,你可以看到这个地方的种族组成情况,同时左边的页面上还有其它的选项。接下来你可以下载数据,获得一个带有元数据文件的一个 excel 文件压缩包。
第三步:通过代码识别关键栏。你可以通过打开元数据文件来实现,也可以查阅不同栏的名称,直到你找到想要的东西。
第四步:为了便捷地分析,建议删除边际误差和B02001007表格。
第五步:使用 excel 函数计算人种/民族比例,运用USA Today的方程式。
第六步:做一些取样测试,看看这些模式是否与人口普查机构的统计相似。
镝次元数据传媒实验室(ID: dyclub-org),以武汉大学为研究基地,对接丰富的数据资源和媒体资源,以产学研结合方式,积极参与和推动数据新闻的人才培养、技术创新、行业生长和理论发展。
镝次元作者/田青
编译/蔡家欣,曾明
运营/刘雅露
深度网编辑/周炜乐