IT培训网 - IT职场人学IT技术上IT培训网
掌握数据可视化工具 编辑和记者不懂编程也能制作信息图
时间:2017-04-21 11:34:56 来源:编程网 作者:IT培训网 已有:名学员访问该课程
编辑、记者的专长就是挖掘数据价值,然后编写一个好听的故事,可编辑、记者会制作信息图表吗,也许这些都是编程人员所做的事情,其实不然,如果我们不依赖编程者了,是否也可以独立的制作可视化图表了呢?
对于新闻编辑人员或者记者来说,如果能够依赖编程员来制作信息图,那么每天就可以省出很多的时间来发布新闻。
Duncan Clark曾在《卫报》(Guardian)等多家新闻出版机构担任数据新闻记者,他深知信息图之痛。
于是,他创办了交互新闻工作室Kiln,还获了奖。之后,Clark和计算机工程师兼数学家Robin Houston合作,花了近一年时间发布Kiln的衍生网站Flourish。
Flourish是一个信息图制作网站,不懂编程的人也可以在上面创作出抓人眼球的信息图,而且操作简便。
Clark了解新闻人的需求,因此,Flourish面向的首批用户正是新闻机构。近日,这家初创公司和Google News Lab正式建立合作关系,世界各地的新闻机构都可以使用Flourish的服务。
Flourish的工作原理和Tableau等数据可视化软件有一定的相似之处。譬如,用户可以先登录账号,从大量的信息图模板中选择合适的模板。上传Excel或CVS数据后,就能生成数据信息图,用户能自由调整信息图的颜色、风格或增加新的内容。用户可以下载信息图到自己的服务器上发布,也可以直接在Flourish平台发布,和其他记者或新闻机构共享作品。
最后一步正是Flourish这款数据可视化平台的特色,对新闻机构尤其有用。背后的理念就是,新闻出版社的程序开发员负责在平台上为自己的数据新闻记者团队建立一套合适的基本模板,如,跟杂志风格保持一致的简易地图、饼状图,或者更复杂的互动信息图。那些不会编程、但擅长写作的数据新闻记者和数据设计师,可以利用基本模板轻松快速地创作信息图。
这样,不擅长设计数据图表的记者也可以承担信息图制作任务。譬如,他们不用找专业数据组的成员帮忙,就可以独立制作人口统计地图。Clark以《纽约时报》的内部决策书《2020报告》为例,强调了这一需求。
报告指出,记者常常遇到的困境就是他们明知道文章加入互动元素或信息图会更有吸引力,却没有相关的能力或资源去做。
以前,专业的数据可视化开发人员没有发挥出的用处。“这些地方都有的(数据设计)团队,可是总被叫去做一些简单重复的工作,”Clark如是说。
一旦出版社决定在Flourish上发布他们的信息图,其他人就可能使用(和引用)这些公开的信息图。新闻机构不想分享重要项目和专题报道的信息图或内容,但是他们也要每日设计发布大量的信息图,供上班族在路上快速浏览。每日新闻的信息图可以方便地分享,还可以减轻大家的负担。“需知道,如果大家都在开发类似的功能,却不分享,会降低整个新闻行业的效率,”Clark解释道。
就这点来看,Flourish和GitHub等开源网站有共同之处:网站提供公开的模板,用户根据自己的需求在模板基础上增加内容或进行修改。其他人也可以在这些人的基础上学习或制作内容。目前,Flourish仅面向新闻机构提供开放的模板,但是长远的目标群体是所有个体用户。
“我们【Flourish模板设计人员】希望和大型新闻机构一起创作出大量特色模板,供用户使用,”Clark如是说。他们也希望那些无法和《泰晤士报》或《卫报》一样拥有数据团队的小型新闻机构可以从Flourish的模板库中获益。
和Google合作,Flourish可以得到Google News Lab的财政支持,还可以跟新闻机构建立联系。Google News Lab和世界各地的新闻团队都有合作,向记者推广Google Trends和ngram这些工具。
合作发布当天,Flourish就和30家新闻社和统计机构建立了合作关系,其中包括《卫报》和英国广播公司BBC。数据新闻深深植根于新闻机构,Flourish很有可能帮助记者更好地利用数据进行新闻报道。
为了帮助编辑或者记者能够自己独立的制作图表,让我们一起在看看制作图表的方法吧!
1.CartoDB: 不会编程,也可轻松学地图可视化
CartoDB是一款开源网络应用程序和交互式地图制作工具,以提供“一键式制图”功能闻名,也就是分析任何你上传的数据、自动制作地图以显示相关信息。起初CartoDB和数据新闻似乎相差千里,是两名西班牙研究生物多样性和自然保护的科学家为了更好地展示研究成果而建立的,没成想已经成为广大数据新闻记者的好帮手。目前CartoDB已经吸引12万用户创制40万张地图,将世界上所有有趣的主题——从全球粉丝对于Beyonce的最新专辑发布的实时反应到尼泊尔地震的损毁情况一一变成互动性强、好玩的可视化作品。
那CartoDB怎么用呢?
1)注册账户:
用户首先需要在CartoDB上注册账户、获得免费许可,也可以使用它提供的付费模板,有14天的有效期,可以随时取消。
注册成功后,你会进入后台控制页面,刚开始是空白一片。如果上传了数据、制作好了地图,页面上会自动显示“你的数据”和“你的地图”选项,点选直接查看即可。
2) 创制数据表并检查:
CartoDB一般以数据库模板为基础开始制图,因此登陆账户后第一步就是上传数据。可上传地理空间数据,如Shapefiles, GeoJSON等,可以设置公开或者个人可见。
用户可以传多少数据呢?仅有免费许可时,最多可上传50MB大小的数据。几乎能涵盖虽有的需求。点击“新数据集(New Dataset)”即可上传string,date,numeric和boolean众多格式。
载入数据之后,点击“连接数据集”。
如果你上传的数据集含有空间信息,就能从表格视图转换成地图视图。
上传数据后,先别急着制图,先检查检查输入的数据有没有差错,数据栏格式对不对。万一格式不统一,可以选择转换格式。
对拖延症的小伙伴来讲,CartoDB无疑是一款治愈神器。在地图发布之前,CartoDB会提示你赶紧制作地图,而且平时定期邮件“轰炸”,告知新特性、提醒多练手。
制图之前,除了检查数据,更重要的准备是找到思路。CartoDB提供的建议固然能作为宝贵参考,但更重要的是自己先思考数据该怎么用、制作可视化的可行性有多大。先有框架,动手才快,效果才准。
3)制作可视化:
数据上传完毕后,点击页面右上角“可视化(Visualize)”按钮即可制图。
CartoDB在屏幕右边栏贴心准备了一系列地图向导(Wizards),帮你用不同模式标注地图。例如有“简单模式(simple)”、“团簇模式(cluster)”、“等值域模式(choropleth)”(等值域地图是指根据数据的数值大小来标注地理区划的地图)等等。
点选模式后,CartoDB有众多创制图例和信息窗口的选项供你选择,也可以转换同的基础地图,看看哪一个最合适。
如果你按下右边的CSS按钮,就能自己修改可视化代码。
4)化静态为互动:
是时候让地图动起来了!CartoDB的交互式数据库可运行Leaflet.js的插件和Google Maps插件来制作数据层,轻松完成这一过程。
需要更多地图制作工具/平台?深度君还推荐:
提供制图、查图、解图“一条龙”功能的ArcGIS Online Platform ,请查阅:《地图可视化制作和数据平台精选》
QGIS:开源制图桌面工具
Leaflet:用于制作互动地图的Javascript数据库
Open Layers: 是一款功能强大、地图专用的Javascript制图数据库
Open Street Map: 地图的开放源代码和公开数据
Serving tiles: 教你如何能用开源软件运行自己的地图服务器
2.Plotly:简易互动式图表制作
数据新闻刚入门,就想做简单的互动数据图?Journalism.co.uk就为我们介绍了一款适合数据分析、绘制图表的软件——Plotly,你还可以通过它连接你的Twitter账号等社交媒体账号。
Plotly上面有标示为“探索(Explore)”的按键,可以看到其他用户的数据可视化作品,这样你就能大致了解Plotly的图像成品。参考之后,你就可以在“工作区(Workspace)”绘制自己的图表啦。
一开始,需要点击“import”上传自己的数据文件,或者在添加“新网格(new grid)”后复制黏贴表格。这些数据栏都是自动编码的——如果你想改变它们在可视化作品中的名字,只需右键单击你想当做标题的那行,选择“使用行作为栏目标题(use row as column headers)”。
像infogram这样的软件可以根据数据表里的全部内容自动生成可视化效果,而Plotly与此不同,会额外让你选择哪一行哪一列需要在可视化作品里出现。在设计图表时,你可以在左边栏选择背景和颜色,添加注释、任意移动或伸缩尖头,随之调整文本。当图表完成,Plotly有多个隐私选项供你选择,还能生成嵌入代码,这样就能插入网站啦。更多操作细节,请查看Journalism.co.uk或者Plotly网站上的介绍吧。
3.NodeXL: 社会网络制作助手(请参阅:《NodeXL网络图制作中文教程:手把手教你NodeXL使用方法》)
想快速学会如何将复杂的社会网络做成直观炫酷的可视化?NodeXL是你的绝佳选择:会用Excel,就会用它生成网络图。
NodeXL能计算以下这些社会网络研究中的常见指标:
程度(Degree),指每个节点拥有的关系链接数。对于指向型关系网,有内向程度(In-degree)和外向程度(Out-degree)之分,前者是指向内部的关系链接数,后者是指向外部的关系链接数。
特征向量中心性(Eigenvector centrality)所关注的不仅包括某一节点的关系链接数量,还包括与该节点相链接的是哪些节点,以及那些节点各自的关系链接数量是多少。
中介中心性(Betweenness centrality)则揭示出每个节点在不同关系网间提供“桥梁作用”的重要程度。它所特别标出的点,是一些移除后会导致整个网络崩塌的重要节点。
接近中心性(Closeness centrality)用于量度关系网中每个节点离其他节点的平均距离。它特别标出以较少连线与其他节点联系的点——这就类似于Kevin Bacon的六度理论(即在世界上任意两个陌生人之间只隔着六个人)。
在2014年计算机辅助报道协会巴尔的摩年会 (NICAR 2014) 上,BuzzFeed News 的科学与健康记者Peter Aldhous就介绍了NodeXL的用法,手把手教你分析美国共和党人中倾向于民主党的有哪些。文章略长,请点击“阅读原文”里的相关链接,一起打开Excel跟着学吧!
如果觉得以上工具还不过瘾,我们还推荐:
4. Analytics Vidhya:18个可视化好用工具一览
网站Analytics Vidhya整合出了一张【信息图可视化工具清单】,分为适用于一般用途和特定用途的两大类工具。一般用途的工具包括我们耳熟能详的Tableau, D3.js., R语言, Excel, Python等,也有专业人士更了解的Weka(主要用于数据挖掘,可生成简单图表,支持数据挖掘),SAS(用于数据建模),QlikView和QlikSense(用于数据整合和分享)。
在特殊用途工具中,有不少功能强大的选项:Instant Atlas(设计互动式图表,快速传达信息,提供图表和地图模板), WolframAlpha(智能呈现图表,无需配置),Cytoscape(高级分析和模型使用软件,用于社会网络或人际关系网的可视化呈现), NetworkX(是Python语言软件包,可用于生成经典图表、随机图表和综合性网络,Nodes可以包括文本、图片或者XML记录等格式), Flot(专门做线形图和柱状图,支持回调函数(Call back functions),需要jquery的相关知识才能驾驭)和Gephi(嵌入式3D生成器,以深入数据分析验证关系,普遍用于社会网络的可视化制作)。
关于更多信息,可以查看QlikSense的介绍,也可以参照Tableau和QlikView的对比。
此外,网站还推荐了诸如Dygraphs, Chart.js, Raphael, Highcharts等实用的JavaScript libraries作参考。如果你还想持续关注信息图和数据分析的新知,可以订阅Analytics Vidhya的邮件、关注它的Twitter和Facebook主页,掌握行业前沿资讯。
5.软件开发师8款开源工具分享:
想知道灵动炫酷的可视化效果怎么做?怎么从零基础开始学?软件开发师、开源支持者Nitishi Tiwari撰文重点推荐了8款数据可视化的开源工具 (点击左边即可看到工具条目),一解众忧。如果觉得不过瘾,点击文末链接,有50款工具推荐。
Data Wrapper:由欧洲的新闻学院开发,以便新闻机构做数据可视化作品。该工具基于图形用户界面(GUI),可以用简单四步绘图。
Chart JS:简洁的图表库。在生成图表之前,需要把函数库加进前端代码中,之后可以从函数库的应用程序编程接口(API)加图表,赋值。这款工具适合想要精确调整图表外观的人。它不适合想用现成工具用户。
Charted:由Medium的产品科学组开发,是最简便的在线表格工具之一。只需粘贴谷歌表格或.csv文件,工具就会抓取数据,生成表格。Charted每三十分钟抓取数据,及时更新。
D3:是数据驱动文件(data-driven documents)的缩写,是一个JavaScript函数库。它使用数据创造并控制在网络浏览器里运行的交互图形,必须嵌入在html网页中,依赖矢量图形(SVG), 层叠式样式表(CSS3)等html的工具展示图形。因为需要编写代码,更适合掌握此项技能的数据新闻程序员们。
Dygraphs是一款基于JavaScript的函数库,十分灵活。这款工具的优势是可以处理大的数据集,并为终端用户生成互动数据。
Raw:基于网页的可视化工具。用户可以粘贴数据,在几步内生成图表。
Timeline: 用来做时间轴。按照规定格式将数据放在谷歌表格中,之后Timeline工具生成并发布。然后再网页上嵌入代码即可。
Leaflet:一款轻便、适合移动端用户的JavaScript函数库,用来制作互动地图。
每期开班座位有限.0元试听抢座开始!
温馨提示 : 请保持手机畅通,咨询老师为您
提供专属一对一报名服务。