每当我对数据启动可视化时,不论是静态图、灵活图,还是报告、博客中的一局部,甚至是 Twitter的配图,我都会遵照以下五个准则。
展现数据和缩小凌乱象征着缩小多余的网格线、标志和阴影,这些都会搅扰实践数据。
有力的题目、更好的标签和有用的注释将使图表与其周围的文本相联合。
当图表有许少数据系列时, 可以战略性地经常使用色彩突出显示感兴味的系列,或许将一个密集的图表拆分红多个小图表。
总之,这五个准则会提示我关注受众的需求,以及如何用可视化的数据讲故事。
准则1:展现数据
读者只要看到你的数据,才干了解你的重点、观念或故事。这并不象征着你要展现一切的数据,但你要突出显示那些撑持观念的数据。作为图表的创立者,咱们面临的应战是要 出现多少数据,以及出现的最佳方式。
这张美国的点密度图,经常使用了自2010年起,美国十年一次性的人口普查数据,每一个点代表一团体,这是全国3.08亿居民在人口普查区(一团体口普查区相当于一个街区)的散布状况。注 意,这张图除了数据什么都没有,没有州界,没有路线,没有市区标志,也没有湖泊和河流的标 记。但咱们依然能看出这是美国,由于人们往往生存在边陲和沿海地域,这些数据痕迹勾画出了整个国度的状态。
这并不象征着咱们必定不时显示一切的数据。有时图表显示的数据太多,很美观出哪些数据更关键。比如这两张折线图,都显示了环球上50个国度的平均受教育年限。
在左边的图表中,每个国度都用不同色彩的折线示意。这造成整张图表十分凌乱,无法看出任何一个国度的趋向。
而在左边的图表中,突出显示了六个重点关注的国度,其余国度所有被设置为灰色,把它们当成背景消息。
这样,读者一眼就能看出咱们想要强调的国度。这不是说咱们要显示起码的数据,而是说要显示最关键的数据。
只突显几个国度(右图),这样图表更容易阅读
准则2:缩小凌乱
经常使用不用要的视觉元素会扩散读者的留意力,并使页面变得凌乱。
有很多造成图表凌乱的圈套须要避开。有一些基本元素,比如太粗的刻度线和网格线,简直都可以间接删除。
有些图表会经常使用数据标志(如正方形、圆形和三角形)来辨别序列,但当标志堆叠时,它们会让图表看上去乱哄哄的。
当经常使用便捷的、纯色的图表成果也很好时,千万不要做纹理或突变填充。当经常使用不用要的3D(平面)成果时,会使数据失真。
还有一些图表蕴含太多的文本和标签,使得整个空间变得凌乱而拥堵。
就拿这张美国和德国的平均受教育年限的三维柱状图来说。
你之前应该也见过这种3D图表——扩散留意力、难以阅读及数据失真
假设你以为没有人会设计这么奇异的图表,那么你就错了。
这是间接复制上来的图表,包括它的突变样式。三维的柱形和闪动的条纹,不婚配的数据和轴标签,用少量的小数标明数据的准确度,但实践上并没有这种成果——一切这些混在一同构成了一张很难阅读的图表,诚恳地说,看起来很不舒适。
同时,三维图形会让数据失真。产生这种失真,是由于经常使用了不用要的三维透视成果。经过抛弃这些有关的、扩散留意力的元历来简化图表,可以让你的观念愈加明晰、易懂。
虽然咱们对感知,以及眼睛和大脑如何上班的了解大多根植于迷信钻研,但选择经常使用什么视 觉成果往往是客观的。比如经常使用哪种图表、在哪里搁置标签和注释、经常使用什么色彩和字体等。
经常使用基础的柱状图就能消弭3D成果造成的凌乱和失真,因此图表更容易阅读和了解
在有些状况下,经常使用某种图表客观上就是失误的,但在大少数状况下,须要靠你的客观判别。随着你创立和阅读可视化图表的数量越来越多,你将拓宽视线,提高审美才干,并找到艺 术和迷信之间的平衡。
准则3:图文联合
虽然咱们关键关注创立可视化图表的元素,比如条形、点或折线,但对图表的文字说明雷同关键。咱们经常将文本和注释视为预先才思索的内容,但这些元素可以协助读者来了解图表所蕴含的内容,以及图表自身。
《纽约时报》的数据编辑阿曼达·考克斯(Amanda Cox)曾经说过,“注释局部是最关键的……否则就相当于说‘都在这儿,你自己去搞明确’。”
为图表增加正确的注释,从协助读者了解的角度来说,至关关键。
有三种方法可以让图表和视觉成果融为一体:删除图例、创立有吸引力的题目和增加一些细节。
1.尽或许去掉图例,间接标注数据
将标签间接搁置在图表上,读者能更轻松地找到对应的数据
2.把题目写得像报纸的题目一样
好的题目须要能抓住图表的要点,通知读者从中可以得出什么论断。我把这些称为“有力的标 题”或“报纸式题目”。
这张来自皮尤钻研中心的图表的题目准确地通知你应该从中学习什么
一旦图表制造成功,题目确定上去后,无妨问问自己,假设再增加一些文字说明,会更有协助吗?
有时数据里有峰值或谷值、团圆值或动摇值须要解释。在图表中增加细节说明,有助于大 家推导出你的论点或关键点。假设经常使用的是非规范图表,则还要解释如何阅读它。
右图中冗长的说明解释了数据的一些基本特色
准则4:防止使意图面图
意面图(Spaghetti Chart)是制造业里的一个术语,这里作者用来泛指那种容纳了少量数据的图表。
很显著,当某张图表蕴含太多的消息时——折线图看起来就像一堆意大利面条,还有几十种色彩和图标的地图,或许一个接一个的条形布满整个页面。当一张图表中蕴含少量的数据时,这确实是一个应战,但咱们不须要将一切数据都放到一张图表中。
小型序列图(small multiples)的两个示例。左图来自Zeit Online,显示了德国过去140年的平均气温。右图来自疾病控制和预防中心,显示了面部毛发如何影响呼吸器的装置。格局塔的衔接原理可以协助咱们追踪图中的变动
咱们可以将一张图表合成成多张图表。这被称为网格图或面板图,也叫格栅图,或小型序列图。这些较小的图表经常使用相反的比例、坐标轴和范畴,但将数据散布在多张图表上。换句话说,不要把一切的数据都放在一张图表中,而是在基础数据上创立多个更小的版本。
小型序列图不是一种新的或反派性的数据表白方式。1878年,摄影师埃德维德·穆布里 奇(Eadweard Muybridge)要确定一匹马在飞奔时能否齐全凌空。穆布里奇开发了一种技术来 拍摄一匹疾驰的马,它可以拍摄一系列极速举措的照片(咱们如今称之为定格)。他的照片证 明,马在飞奔时确实齐全分开了低空。图像序列,也给人一种灵活感,这是小型序列图早期的 例子。
摄影师埃德维德·穆布里奇早在1878年就驳回了小型序列图的方式来确定马在飞奔时能否齐全凌空
小型序列图至少有三个优势。
《卫报》(Guardian)的这个例子显示,2016年英国脱欧决议案在六个不同人口 统计学变量上的投票结果。横轴坚持不变,可以很容易看到每团体口统计目的的相关方向。
《卫报》的多张小型散点图显示了投票选择与六团体口统计学变量之间的相关。格局塔的相似原理 让咱们很容易看到每张散点图中的两类数据
但这种序列图也存在一些毛病,假设不加以防止,图表会很凌乱。
首先,图表应该按逻辑顺序陈列。 不要让读者四处阅读整个页面,而是应该经常使用直观的排序方式,比如天文位置或字母顺序。
其次,图表应该经常使用相反的规划、大小、字体和色彩。 请记住,咱们正在将一张图表分 解为多张图表,因此它应该看起来像一张图表被复制了屡次。纵轴和横轴兴许会扭转,但你不 能用蓝点在一张图表中代表“否”,而在另一张图表中代表“是”。
第三,序列图应该相对容阅读。 你不用要求读者加大,并详细解读图表中的一切细节,你的目的是给他们一种全体形式。这些图表的尺寸很小,因此,蕴含注释和标签,或重复冗长的轴标签和数据标志,都会让读者手足无措。
准则5:从灰色开局
我用一个适用的技巧来完结这一节,这是创立明晰、易懂的可视化成果的一个便捷步骤:从灰色开局。无论何时绘制图表,都从全灰色元素开局。这样,会迫使你在经常使用色彩、标签和其余元素时更有目的性和战略性。
咱们以一张便捷的平均受教育年限的图表为例,这次只显示10个国度。有了色彩和标签 (左上角的图表),我可以把这张图表放到我的报告或讲义中,稍做加工,再增加一个有吸引 力的题目,读者就可以知道哪些标签对应于哪些折线。但是,假设把一切的折线都变成灰色的 (右上角的图表),读者就无法成功雷同的义务,由于不知道哪条折线对应于哪个国度。
将一切数据先所有设置为灰色,这会迫使你思索你的目的,以及你究竟想要将读者的留意力引向何处
如今我可以有目的地调整这张图表。
我可以增加色彩,扭转线条的粗细,以便更好地突 出显示想要强调的消息,比如其中的两个国度。
左下角的图表,把一切的标签都放在图表上, 而右下角的图表,只是间接标明两个国度,可以显著地看出,右下角的图表能更有效地传递消息。
从灰色开局,能迫使咱们有目的地选择在前景中搁置哪些元素。