猜你喜欢
更好的数据可视化指南

更好的数据可视化指南

书籍作者:Jonathan Schwabish ISBN:9787121440632
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:6588
创建日期:2023-04-22 发布日期:2023-04-22
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

这是一本关于如何更好、更有效地进行数据可视化的书。本书分为3个部分。第1部分是创建有效可视化的通用指导原则,我们将了解受众的重要性,以及思考哪类图表能更好地契合他们的需求。第2部分是本书的核心部分,我们将定义和讨论80多张图表,这些图表分为八大类:比较、时间、分布、地缘、关系、构成、定性和表格。我们将看到各类图表是如何起作用的,以及它们的优缺点。第3部分整合了两块内容,一是构建数据可视化样式指南,二是如何结合不同的经验对图表进行重新设计。



作者简介

作者:

Jonathan Schwabish(乔纳森99施瓦比什),经济学家、作家、教师,也是政府相关数据可视化的创造者。他帮助非营利组织、研究机构和各级政府改进如何向同事、合作伙伴、客户和选民传达它们的工作和发现。他也是Better Presentations: A Guide for Scholars, Researchers, and Wonks(哥伦比亚大学出版社,2016年)的作者。

译者:

易炜,毕业于上海大学,企业管理硕士,自由培训师。主要研究领域有结构化思维、商务可视化呈现、管理与绩效改进等,曾为众多知名企业提供培训和辅导。公众号【思维与效能】的运营人,编有《不会游戏化管理就带不好95后团队》。喜欢阅读和跑马拉松,一年阅读图书近200本,跑步2000公里左右。

编辑推荐
适读人群 :本书适合对数据可视化表达感兴趣的读者学习,也适合对图表、视频设计感兴趣的读者学习。

1本全面而专业的数据可视化宝典

5大设计原则,让你的图表直击人心

80多种可视化图表,助你成为数据呈现专家

500多个可视化案例,让你轻松掌握图表应用


前言

译者序

你需要一个数据可视化工具箱

作为一个信息可视化的爱好者,我阅读了大量与可视化有关的书籍,也浏览了许多与可视化相关的网站。结果发现,要做好信息可视化,需要非常广泛的知识,包括但不限于格式塔心理学、设计原理、色彩规则、图表类型等。

很多人在运用数据可视化时,容易陷入一个误区,就是执着于如何制作一张酷炫、华丽、夺目的数据图表,于是Excel、Tableau、R、Python等软件齐齐上阵,就是为了生成一张看上去很漂亮的图表。

也可能因为这样,市面上教你怎么制作一系列漂亮图表的书比较多,但真正从源头上厘清在什么情况下使用什么图表效果更好的书却非常少,即便有,内容也不是那么系统。因此,我一直想找一本能系统地介绍如何规范使用数据图表的指南。

“念念不忘,必有回响”,一次偶然的机会,让这本书出现在我的面前。

有一天,电子工业出版社的张慧敏编辑联系我,希望我推荐一个译者来翻译一本数据可视化的书。我请编辑把电子版先发给我看一下,并准备根据大致内容帮她寻找合适的译者。

当我浏览这本书时,激动得直拍大腿,这不就是我一直在找的书吗!这简直就是一个数据可视化的工具箱,在你需要了解哪些图表适用于什么场合时,拿出来查阅一下,就能挑选出恰当的图表。

这本书的核心就是不断强调:用什么图表取决于你的目的,以及受众的需求!所有数据图表的使用都围绕着这一点进行,在没有分析清楚这个之前,不要贸然使用所谓的经典图表。

作者的这个核心观点,和我在结构思维体系中创建的G·A·S(目的、对象和场景)模型不谋而合。这么奇特的缘分,怎么能让它擦肩而过呢!

打定主意后,我就毛遂自荐,说我来试试吧!于是直接试译了前言,发给编辑过目,不知是不是被我的诚意所打动(在签订翻译合同之前,我已经默默地翻译了三章),张慧敏编辑最后决定让我来完成本书的翻译。

在此,非常感谢张慧敏编辑的信任,把这么一本大部头书放心地交给一个翻译领域的新手。

在翻译的过程中,虽然查阅了大量数据统计方面的资料,力争能将专业术语翻译准确,但还是发现有些图表没有统一的中文称谓。我知道读者中藏龙卧虎,如果你发现有不准确的地方,还望不吝指出,你可以发邮件到本书责任编辑的邮箱[email protected],我们会在再版时进行修订。

易炜


前言

有多少人在制作数据图表时是这么做的:分析数据,得出结论;做一张图表,把它粘贴到报告中,再配上说明文字;写一个平平无奇的标题,比如“图1. 平均收入,1990—2020年”;另存为PDF格式,把它发送出去。

你也许会用几个月甚至几年的时间来整理和分析数据并写出这份报告,但设计数据图表所用的时间要少得多。你可能会打开一个类似于Excel的软件,粘贴数据,单击下拉菜单,选择一张使用过数十次甚至上百次的图表,采用默认格式,并将其粘贴到报告中。

在这个过程中,你有没有停下来思考过,在传递信息时最重要的是什么?是受众!人们会读你的报告,会听你谈论你的研究内容。然而,许多人不愿花时间去思考,如何更好地展示自己的洞见,大家都是在用一些简单而俗套的方法。

这是为什么呢?也许你觉得自己缺乏技术能力或设计基础来创建复杂、有趣的图表,也许你担心时间花得不值,因为你的领导或其他人认为这不值得花时间。大多数人认为他们的读者会“明白”,就好像每个人都看过这个内容上百遍似的。但是,许多读者,尤其是那些有权做出改变或实施政策的人,可能从未见过这个内容。在这种情况下(可能是大多数情况),仔细考虑数据如何呈现与数据本身一样重要。

这是一本关于如何更好、更有效地进行数据可视化的书。它的目的是提升你的图表素养,扩充你的图表工具箱。下次你再打开Excel、Tableau、R或其他这类软件时,将不再拘泥于下拉菜单或导航菜单里的图表。本书将指导你选择最适合展示相关数据的图表,并有效地传递你想传达的信息。

人们常常和我说,他们不能创建那些复杂的、非标准化的图表,因为他们的同事、领导或受众无法理解这些图表。我们不是生来就能读懂条形图、折线图或饼图的。正如ProPublica的执行副主编斯科特·克莱因(Scott Klein)曾写道的那样:“根本不存在所谓的直觉类图表,没有人生来就能阅读视觉化的信息。”

作为数据可视化的创造者,你必须了解受众,并知道什么时候使用哪类图表能够吸引读者——帮助他们提升图表素养。


本书分为3个部分,第1部分是创建有效可视化的通用指导原则。我们将了解受众的重要性,以及思考哪类图表能更好地契合他们的需求。没有哪本数据可视化的书能包含制作有效图表的所有内容,不过有些最佳实践能够帮助你更好地开展工作。当你继续创造更多的视觉效果,并看到它们对受众的影响时,你将培养出自己的美学观,并学会何时改变或打破这些指导原则。

第2部分是本书的核心部分。我们将定义和讨论80多张图表,这些图表分为八大类:比较、时间、分布、地缘、关系、构成、定性和表格。我们将看到各类图表是如何起作用的,以及它们的优缺点。

各类别之间的图表可能会有重叠——例如,条形图既可以用来显示某个类目随时间的变化,也可以用来表示各类目之间的对比。图表的分类是基于它们的用途的。但即使这样,也并不是完全客观的,你的看法和面临的情况可能不一样。本书不会涉及所有的图表,比如建筑、生物和工程等领域里的专用图表就不在本书的讨论之列。相反,本书会涵盖最常见和最灵活的图表,这些图表可以满足大多数人展示数据的需要。

第3部分整合了两块内容,一是构建数据可视化样式指南,二是如何结合不同的经验对图表进行重新设计。如果你曾写过研究论文或报告,那么你可能了解一些写作格式指南,从CMS(The Chicago Manual of Style,芝加哥手册,一个适用于美国英语的写作格式指南)到MLA(Modern Language Association,美国现代语言协会制定的论文格式指南)。这些指南把写作分解为多个要素,并规定了它们的正确用法。数据可视化样式指南与之类似——定义构成要素、规定相应格式,以及如何使用它们。在最后一章中,我们将应用这些经验重新设计一系列图表,以更好地展示数据。

本书将指导你深挖数据,以及如何进行数据可视化。为了让你的信息传播得更远,可视化比以往任何时候都重要。你的客户和同事、政策制定者和决策者、感兴趣的读者都被淹没在信息洪流之中,而好的视觉效果可以帮他们拨云见日。

任何人都可以改进其可视化和沟通数据的方式,而且你不需要拥有市场营销、设计或广告专业的研究生学位。你看我,我的职业生涯就是从联邦政府的经济学家开始的。

我学习数据可视化的历程

我曾准备报考麦迪逊的威斯康星大学经济学专业(有一次尝试数学专业也是倒霉透顶,因为在马尔可夫链遇到了麻烦),我知道自己最终想去华盛顿,那是公共政策和政治的中心。在那里,我能探索真正的问题,并制定解决方案。

我在2005年搬到华盛顿,并加入国会预算办公室(CBO)。我的工作是帮助研究长期微观模拟模型,以用于检查社会安全系统和预测联邦预算的长期财政状况。2005年春,对于社会保障工作而言,是一个激动人心的时期。那年,布什总统宣布将社会保障作为其第二任期的核心组成部分。他在2005年的国情咨文中说:“我们必须通过改革,彻底解决社会保障的财政问题。”虽然那一年晚些时候,改革停滞不前了,但在我加入国会预算办公室的头几个月里,我在国会预算办公室的团队评估和分析了数十项政策的效果。

五年后,我把残障工人、移民和食品券(现在称为补充营养援助计划或SNAP)的政策研究纳入我的工作范围内。2010年,我的三位同事起草了一份关于社会保障政策选择的特别报告。该报告探讨了30种不同的改革方案,以及它们的影响。报告中有一组核心数据,该组数据会显示系统中的税收变化和支付的福利,还能体现出两者之间的差额,以及这30种改革方案在其他财政偿付能力指标上的变化。这组数据看起来像这样:


你就算不是政府经济学家也知道,国会议员不会去阅读这种数据表——里面太多的行和列,满屏的数据,信息严重过载。就在那时,我开始思考有没有更好的展示数据的方式。

于是,我们对原来的表做了一些改进,用小面积图代替了一些数字,让读者对每个选项都有一个直观的印象,这样,他们就能看出,哪些选项增加了偿付能力,哪些选项没有增加。


这份报告的效果不错,我们收到来自多方的赞许,有国会预算办公室和其他部门的同事,也有国会山(Capitol Hill)和其他地方的读者。这也是我和我的部门第一次仔细而有前瞻性地思考数据可视化。从那时起,我就开始研读数据可视化、设计、色彩理论以及排版等方面的内容。

接着,我开始和编辑、设计师通力合作,改进基础报告中的图表,同时创建一些新的报告和图表类型。我们开始制作信息图,当时挺流行的,它把数据、文本、图像等信息整合在一起,形成一张有着统一视觉效果的长图。2012年,我们制作了这张信息图,作为长期预算展望(一份109页的报告)的补充和总结。


同年6月,国会预算办公室主任在美国众议院预算委员会面前阐述我们的分析结果。当时走廊上的电视正在播放听证会,我突然听到同事大喊:“乔恩!乔恩!快出来!你的信息图上电视了!”

我出来一看,果然,在C-SPAN(公共事务卫星有线电视网)上,众议员克里斯·范·霍伦(Chris Van Hollen)举着我的那张信息图,上面布满了标注和笔记。这种形象化的展示甚至引起了美国总统的注意,当然,也吸引了那些整天和联邦预算打交道的人。那一刻我意识到,如何呈现数据和数据本身一样重要。


马里兰州众议员克里斯·范·霍伦在众议院预算委员会听证会上举着“长期预算展望”信息图2014年,我加入了位于华盛顿的城市学院(Urban Institute),这是一家非营利机构。在那里,我有一半的时间做研究,另一半的时间则在通信部帮同事做数据可视化和数据的有效展示。

从那时起,我先后举办了数百场研讨会,在全球各地发表演讲,出版了两本关于数据沟通的书。大家似乎也意识到了,更好的视觉内容和演示,能更好地影响决策者采纳相关研究和政策。

随着计算机技术的突飞猛进、社交媒体的广泛普及,以及媒体领域的不断扩展,视觉化内容变得越来越重要,甚至可以说是必需的。

如今,我和不同组织的人一起合作,有非营利组织的、政府机构的、私人企业的等。我的主要工作是帮助他们提升创建图表的能力,以及更好地传递内容。我曾与年轻的经济学家和分析师一起处理海量数据;帮助医护人员将分析结果传达给患者、家属及医院管理层;与人力资源管理者一起处理求职者数据库;帮助广告和市场人员销售产品,等等。

在工作和学习中,我们将面临各种各样的数据可视化挑战,虽然在学校或职业发展计划里都不会教授这些技能,但是这些技能都是容易学会的。我们可以轻松学会并读懂那些从未见过的复杂图表,我们也可以学会如何利用这些图表进行更有效的沟通。

最终,我发现,能展示给大家最重要的东西之一,就是大量的可视化图表。这正是本书要带给大家的——80多张可视化图表,从大家所熟知的标准图表,到个性化图表,都有涉及。不过,在正式讲解每张图表之前,还是应该先了解一下,我们的大脑是如何处理这些可视化信息的,以及有哪些数据可视化的最佳实践。


目录

第1部分 数据可视化原理

1 视觉化过程和感知顺序 / 002
安斯库姆四重奏 / 009
视觉感知的格式塔原理 / 011
前注意加工 / 014
小结 / 017

2 提高数据可视化效果的五个原则 / 018
原则1:展示数据 / 018
原则2:减少混乱 / 020
原则3:图文结合 / 023
原则4:避免使用意面图 / 030
原则5:从灰色开始 / 033
数据的平等与责任 / 036 下一步 / 039

3 形式与功能 / 040
受众需求决定数据可视化选择 / 040
改变我们与数据交互的方式 / 048
我们开始吧 / 049

第2部分 图表类型
4 比较 / 052
条形图 / 053
创建条形图的策略 / 054
条形图的变化 / 064
簇状条形图 / 068
堆积条形图 / 071
对比条形图 / 075
点状图 / 080
玛莉美歌图和马赛克图 / 085
单元图、同型图和华夫图 / 089
热力图 / 094
仪表图 / 100
子弹图 / 101
气泡图和嵌套气泡图 / 103
桑基图 / 108
瀑布图 / 111
小结 / 112

5 时间 / 113
折线图 / 113
圆形折线图 / 129
斜率图 / 130
迷你图 / 132
凹凸图 / 133
周期图 / 135
面积图 / 137
堆积面积图 / 139
流图 / 142
地平线图 / 144
甘特图 / 146
流程图和时间线 / 150
连接散点图 / 154
小结 / 157

6 分布 / 158
直方图 / 158
金字塔图 / 164
通过图表显示统计的不确定性 / 166
误差条形图 / 168
置信区间图 / 169
渐变图 / 170
扇形图 / 172
手绘效果 / 173
箱线图 / 174
蜡烛图 / 177
小提琴图 / 178
山脊图 / 179
通过展示数据呈现不确定性 / 182
茎叶图 / 192
小结 / 193

7 地缘 / 195
数据化地图的挑战 / 196
分级统计图 / 197
一定要用地图吗 / 201
变形地图 / 203
比例符号图和点密度图 / 211
流向图 / 212
小结 / 212

8 关系 / 214
散点图 / 214
气泡图 / 220
平行坐标图 / 226
雷达图 / 230
和弦图 / 232
弧线图 / 235
相关矩阵 / 238
网络图 / 240
树形图 / 247
小结 / 250

9 构成 / 251
饼图 / 251
树图 / 259
旭日图 / 261
南丁格尔图 / 262
维诺图 / 266
小结 / 271

10 定性 / 272
图标 / 272
词云和特定词 / 273
文字树 / 277
特定词 / 279
引用 / 280
着色短语 / 282
矩阵和列表 / 285
小结 / 286

11 表格 / 287
表格结构剖析 / 287
设计表格的十大准则 / 289
示例:重新设计基本数据表 / 298
示例:重新设计回归表 / 301
小结 / 303

第3部分 设计你的可视化内容
12 数据可视化样式指南 / 306
数据可视化样式指南的要素 / 306
图表的结构 / 309
图表的配色 / 315
定义字体 / 319
特殊图表类型指南 / 321
导出图表 / 322
可访问性、多元化和兼容性 / 323

13 图表的再设计 / 326
簇状柱状图:大田作物面积 / 326
堆积条形图:服务交付 / 329
折线图:社会保障受托人 / 331
分级统计图:阿拉巴马州奴隶制和
参议院选举 / 335
点状图:国家学校午餐计划 / 337
点状图:美国的GDP增长 / 339
折线图:政府借款净额 / 341
表格:坚定的承诺 / 343
小结 / 345
总结 / 346
附录A 数据可视化工具 / 352
致谢 / 357

产品特色