2015数据可视化精选:35款好用工具,搞定信息图+可视化
数据可视化为新闻媒体提供了生动有效的叙事方式和包装形式,也引领架构故事的思维变革。那么有哪些实用工具可以帮你讲好故事呢?深度君整合全年干货,为你精选35款优质可视化工具,指南+案例随你选。点击文中相应链接,即可查看工具案例和更多细节哦。
数据新闻刚入门,就想做简单的互动数据图?Journalism.co.uk就为我们介绍了一款适合数据分析、绘制图表的软件——Plotly,你还可以通过它连接你的Twitter账号等社交媒体账号。
Plotly上面有标示为“探索(Explore)”的按键,可以看到其他用户的数据可视化作品,这样你就能大致了解Plotly的图像成品。参考之后,你就可以在“工作区(Workspace)”绘制自己的图表啦。
一开始,需要点击“import”上传自己的数据文件,或者在添加“新网格(new grid)”后复制黏贴表格。这些数据栏都是自动编码的——如果你想改变它们在可视化作品中的名字,只需右键单击你想当做标题的那行,选择“使用行作为栏目标题(use row as column headers)”。
像infogram这样的软件可以根据数据表里的全部内容自动生成可视化效果,而Plotly与此不同,会额外让你选择哪一行哪一列需要在可视化作品里出现。在设计图表时,你可以在左边栏选择背景和颜色,添加注释、任意移动或伸缩尖头,随之调整文本。当图表完成,Plotly有多个隐私选项供你选择,还能生成嵌入代码,这样就能插入网站啦。更多操作细节,请查看Journalism.co.uk或者Plotly网站上的介绍吧。
2.CartoDB: 不会编程,也可轻松学地图可视化
CartoDB是一款开源网络应用程序和交互式地图制作工具,以提供“一键式制图”功能闻名,也就是分析任何你上传的数据、自动制作地图以显示相关信息。起初CartoDB和数据新闻似乎相差千里,是两名西班牙研究生物多样性和自然保护的科学家为了更好地展示研究成果而建立的,没成想已经成为广大数据新闻记者的好帮手。目前CartoDB已经吸引12万用户创制40万张地图,将世界上所有有趣的主题——从全球粉丝对于Beyonce的最新专辑发布的实时反应到尼泊尔地震的损毁情况一一变成互动性强、好玩的可视化作品。
那CartoDB怎么用呢?
1)注册账户:
用户首先需要在CartoDB上注册账户、获得免费许可,也可以使用它提供的付费模板,有14天的有效期,可以随时取消。
注册成功后,你会进入后台控制页面,刚开始是空白一片。如果上传了数据、制作好了地图,页面上会自动显示“你的数据”和“你的地图”选项,点选直接查看即可。
2) 创制数据表并检查:
CartoDB一般以数据库模板为基础开始制图,因此登陆账户后第一步就是上传数据。可上传地理空间数据,如Shapefiles, GeoJSON等,可以设置公开或者个人可见。
用户可以传多少数据呢?仅有免费许可时,最多可上传50MB大小的数据。几乎能涵盖虽有的需求。点击“新数据集(New Dataset)”即可上传string,date,numeric和boolean众多格式。
如果你上传的数据集含有空间信息,就能从表格视图转换成地图视图。
上传数据后,先别急着制图,先检查检查输入的数据有没有差错,数据栏格式对不对。万一格式不统一,可以选择转换格式:
对拖延症的小伙伴来讲,CartoDB无疑是一款治愈神器。在地图发布之前,CartoDB会提示你赶紧制作地图,而且平时定期邮件“轰炸”,告知新特性、提醒多练手。
制图之前,除了检查数据,更重要的准备是找到思路。CartoDB提供的建议固然能作为宝贵参考,但更重要的是自己先思考数据该怎么用、制作可视化的可行性有多大。先有框架,动手才快,效果才准。
3)制作可视化:
数据上传完毕后,点击页面右上角“可视化(Visualize)”按钮即可制图。
CartoDB在屏幕右边栏贴心准备了一系列地图向导(Wizards),帮你用不同模式标注地图。例如有“简单模式(simple)”、“团簇模式(cluster)”、“等值域模式(choropleth)”(等值域地图是指根据数据的数值大小来标注地理区划的地图)等等。
点选模式后,CartoDB有众多创制图例和信息窗口的选项供你选择,也可以转换同的基础地图,看看哪一个最合适。
如果你按下右边的CSS按钮,就能自己修改可视化代码。如下图所示,可以轻松改变标注颜色,就像编辑文本一样:
4)化静态为互动:
是时候让地图动起来了!CartoDB的交互式数据库可运行Leaflet.js的插件和Google Maps插件来制作数据层,轻松完成这一过程。(这里还可以参考一个例子,即是依照行政区选择纽约住宅类型的可视化筛选器)【想得到手把手制作地铁动画指南和更多细节?请点击这里查看吧!】
需要更多地图制作工具/平台?深度君还推荐:
- 提供制图、查图、解图“一条龙”功能的ArcGIS Online Platform ,请查阅:《地图可视化制作和数据平台精选》
- QGIS:开源制图桌面工具
- Leaflet:用于制作互动地图的Javascript数据库
- Open Layers: 是一款功能强大、地图专用的Javascript制图数据库
- Open Street Map: 地图的开放源代码和公开数据
- Serving tiles: 教你如何能用开源软件运行自己的地图服务器
3.NodeXL: 社会网络制作助手
想快速学会如何将复杂的社会网络做成直观炫酷的可视化?NodeXL是你的绝佳选择:会用Excel,就会用它生成网络图。
NodeXL能计算以下这些社会网络研究中的常见指标:
程度(Degree),指每个节点拥有的关系链接数。对于指向型关系网,有内向程度(In-degree)和外向程度(Out-degree)之分,前者是指向内部的关系链接数,后者是指向外部的关系链接数。
特征向量中心性(Eigenvector centrality)所关注的不仅包括某一节点的关系链接数量,还包括与该节点相链接的是哪些节点,以及那些节点各自的关系链接数量是多少。
中介中心性(Betweenness centrality)则揭示出每个节点在不同关系网间提供“桥梁作用”的重要程度。它所特别标出的点,是一些移除后会导致整个网络崩塌的重要节点。
接近中心性(Closeness centrality)用于量度关系网中每个节点离其他节点的平均距离。它特别标出以较少连线与其他节点联系的点——这就类似于Kevin Bacon的六度理论(即在世界上任意两个陌生人之间只隔着六个人)。
在2014年计算机辅助报道协会巴尔的摩年会 (NICAR 2014) 上,BuzzFeed News 的科学与健康记者Peter Aldhous就介绍了NodeXL的用法,手把手教你分析美国共和党人中倾向于民主党的有哪些。文章略长,请点击“阅读原文”里的相关链接,一起打开Excel跟着学吧!
如果觉得以上工具还不过瘾,我们还推荐:
4. Analytics Vidhya:18个可视化好用工具一览
网站Analytics Vidhya整合出了一张【信息图可视化工具清单】,分为适用于一般用途和特定用途的两大类工具。一般用途的工具包括我们耳熟能详的Tableau, D3.js., R语言, Excel, Python等,也有专业人士更了解的Weka(主要用于数据挖掘,可生成简单图表,支持数据挖掘),SAS(用于数据建模),QlikView和QlikSense(用于数据整合和分享)。
在特殊用途工具中,有不少功能强大的选项:Instant Atlas(设计互动式图表,快速传达信息,提供图表和地图模板), WolframAlpha(智能呈现图表,无需配置),Cytoscape(高级分析和模型使用软件,用于社会网络或人际关系网的可视化呈现), NetworkX(是Python语言软件包,可用于生成经典图表、随机图表和综合性网络,Nodes可以包括文本、图片或者XML记录等格式), Flot(专门做线形图和柱状图,支持回调函数(Call back functions),需要jquery的相关知识才能驾驭)和Gephi(嵌入式3D生成器,以深入数据分析验证关系,普遍用于社会网络的可视化制作)。
关于更多信息,可以查看QlikSense的介绍,也可以参照Tableau和QlikView的对比。
此外,网站还推荐了诸如Dygraphs, Chart.js, Raphael, Highcharts等实用的JavaScript libraries作参考。如果你还想持续关注信息图和数据分析的新知,可以订阅Analytics Vidhya的邮件、关注它的Twitter和Facebook主页,掌握行业前沿资讯。【想查阅更多信息图制作信息,请点击这里】
5.软件开发师8款开源工具分享:
想知道灵动炫酷的可视化效果怎么做?怎么从零基础开始学?软件开发师、开源支持者Nitishi Tiwari撰文重点推荐了8款数据可视化的开源工具 (点击左边即可看到工具条目),一解众忧。如果觉得不过瘾,点击文末链接,有50款工具推荐。
Data Wrapper:由欧洲的新闻学院开发,以便新闻机构做数据可视化作品。该工具基于图形用户界面(GUI),可以用简单四步绘图。
Chart JS:简洁的图表库。在生成图表之前,需要把函数库加进前端代码中,之后可以从函数库的应用程序编程接口(API)加图表,赋值。这款工具适合想要精确调整图表外观的人。它不适合想用现成工具用户。
Charted:由Medium的产品科学组开发,是最简便的在线表格工具之一。只需粘贴谷歌表格或.csv文件,工具就会抓取数据,生成表格。Charted每三十分钟抓取数据,及时更新。
D3:是数据驱动文件(data-driven documents)的缩写,是一个JavaScript函数库。它使用数据创造并控制在网络浏览器里运行的交互图形,必须嵌入在html网页中,依赖矢量图形(SVG), 层叠式样式表(CSS3)等html的工具展示图形。因为需要编写代码,更适合掌握此项技能的数据新闻程序员们。
Dygraphs是一款基于JavaScript的函数库,十分灵活。这款工具的优势是可以处理大的数据集,并为终端用户生成互动数据。
Raw:基于网页的可视化工具。用户可以粘贴数据,在几步内生成图表。
Timeline: 用来做时间轴。按照规定格式将数据放在谷歌表格中,之后Timeline工具生成并发布。然后再网页上嵌入代码即可。
Leaflet:一款轻便、适合移动端用户的JavaScript函数库,用来制作互动地图。
深度君年度精选系列,仍在继续!未来还将奉上网络调查技巧分享等系列使用指南+干货推荐,敬请关注!
编辑/周炜乐