图表中视觉的“谎言”

图1.2-1中第一个图表是真实的数据状态,在视觉上这8个柱形看起来差异非常小。第二个图表将Y轴最小刻度设在了60,第三个图表在0~70之间进行了折断处理,同一组数据绘制的8个柱形在第二、第三个图表上看起来差异非常明显。如果不认真读图(尤其第二个图表,将会导致图表反映的数据出现偏差),大脑通过视觉获取的就是错误信息。

同一组数据三种状态下的图表

图1.2-1 同一组数据三种状态下的图表

图1.2-2整个画面由于使用了积木,很有趣味性。但如果没有积木顶端的数据标识,读者根本无法直观获取到准确且有价值的数据。由于透视和单个积木高度的关系,这样的图表让人迷惑和难于理解,看过后留在大脑的仅仅是不同数量积木叠加并排列的图片,而非各类保险品种的比重信息。

关于保险的调查

图1.2-2 关于保险的调查

图1.2-3展示的图表形象直观,但详看之下却发现:数据截止位置到底是处于汽车品牌标志的顶部还是中间?这让人很困惑,不同的人会有不同的解读。汽车品牌标志位于柱形上部,模糊了柱形的准确截止位置,无法准确给出视觉参考基准,于是歧义就这样产生了。

某汽车销售公司各品牌销售一览

图1.2-3 某汽车销售公司各品牌销售一览

■ Lie Factor畸变因子

“Lie Factor=Size of effect shown in graphic/Size of effect in data”

畸变因子=图表中有效表达的数据量/所有的有效数据量

即图形在表达数据诉求时的失真程度,这个评价系数越接近1,图表的失真度越少。图表本身不会产生谎言,造成图表“谎言”的原因很多,尤其当前大多数互联网及其专业杂志的图表制作人员多为平面设计出身,他们常常没有最基本的统计学知识,过于崇尚美学效果,使图表失真度被无限放大,制作出来的图表只能是徒具图表意味的美术广告作品。

不迷失:好图表的三要素

图表视觉大师爱德华·塔夫特(Edward Tufte)告诉我们,卓越的图表:

  1. 需要明确传递有关数据的真相;
  2. 应该是在较小的图表空间内使用最少的着墨,可以在最短时间展示最大数量的信息;
  3. 包含单一诉求的多个数据点。”

以上三点概括出一个好的图表应该具有的三个要素:真实、简明、丰富。

做图表,不能盲目

图表必须是用来直观表达数据诉求的工具,不是一堆无意义图形的杂乱组合。经常看到有人在BBS中发出“有一堆数据,请代为作图”的请求,这样的请求基本没有太好的解答,不同的出发点,理解数据会有不同,自然所作的图表也会截然不同。不要为了作图而作图,开始之前请想清楚我们的图表用来干什么,要传递和表达何种信息比其他都重要。这是方向,如果没有方向或方向错误,一切的努力都是白费工夫。

图表表达诉求和截拳道追求以精简、直接、非传统为核心理念的攻击技法一样,应该做到:

  1. 具有精准简明的图表诉求表达,作为视觉沟通语言,不应该和没有重点泛泛而谈的聊天画上等号;
  2. 诉求应该直接可以从图表中获得,不要犹抱琵琶半遮面,非常不智的是让人去猜想一个图表到底想要表达什么;
  3. 不要将多个诉求塞在一个图表中,一个图表应该只有一个诉求;
  4. 图表存在的价值在于:证明图表诉求所言不虚。没有了诉求的图表毫无意义,这和成语“皮之不存,毛将焉附”是一个道理;
  5. 诉求必须建立在数据基础之上,既不是主观臆断所得,也不应该是断章取义的结论。

做图表原来我们都错了?

在制作图表的过程中,我们总是有意或是无意间制造这样和那样的错误,这些错误产生图表谎言,数据的客观和真实在这些图表上荡然无存;也许我们从未考虑过图表上某些元素,对视觉沟通根本没有丝毫帮助,反而是给视觉带来干扰的垃圾;图表上的每个元素都应该有价值,这些价值应该很好地体现在图表演绎数据的诉求上;具有专业精神的图表才会有很强的说服力。GIGO原则(Garbage In Garbage Out)告诉我们:装入的是垃圾,出来的当然也是垃圾。

玩转Excel图表不简单

要在Excel中创建一个图表非常容易:选择数据>[图表向导]>选中需要的图表类型即可完成,我们日常看到的图表大多均如图1.1-6所示的那样,千篇一律没有特点。随着Excel 2007和2010的发布,图表的默认样式有了不少改观,但这样的图表依然使人感到“审美疲劳”,引不起丝毫的兴趣。

Excel默认生成的柱状图表

图1.1-6 Excel默认生成的柱状图表

图1.1-7是一个叠加了多种诉求信息,并且使用了大量颜色的图表。这个图表在眼前一闪的第一时间,我们可能就已经失去了继续看下去的意愿,除叹服作图者所具有的Excel图表应用功底外,不得不赞叹Excel图表功能的强大。这种强大创造了大量在视觉中彼此干扰的信息,使图表实用性大打折扣,因为这样的图表并不具有可读性。

复杂且糟糕的Excel图表

图1.1-7 复杂且糟糕的Excel图表

图表是拿来阐释数据、展示诉求的语言,使用只有草图水准的简陋图表,和或将图表变成炫耀作图者Excel图表应用技巧的道具,既不尊重图表的读者,也显得我们水准业余。

“无所不能”的Excel

数据处理的专业人士也许更喜欢使用专业软件来制作图表,不可否认,有时Excel直接生成且未经处理的图表,的确无法满足我们的需要,因为这些图表大部分显得简陋和不够专业。如图1.1-4所示的图表,我们可能会认为用Excel来实现几无可能,虽然Excel的图表只有alt柱状、alt条状、alt折线、alt散点、alt面积、alt气泡、alt饼图、alt环形、alt雷达、alt曲面这些基础种类,但凭借Excel超强的自定义功能,和熟练的Excel图表制作技术,这些案例的实现完全不是问题。

日常被认为是Excel难以完成的图表

图1.1-4 日常被认为是Excel难以完成的图表

Excel提供了6类3D类型的图表,遗憾的是现今为止的所有Excel版本,均不支持XYZ三组数据的3D类型图表。但这并不代表Excel就无法完成基于XYZ三组数据的3D类型图表,如果我们愿意花费一些时间,利用Excel三角函数和XY散点图,同样可以完成如图1.1-5所示的图表。

利用Excel三角函数和XY散点图完成的3D空间曲线图

图1.1-5 利用Excel三角函数和XY散点图完成的3D空间曲线图

图表是视觉沟通语言

不要理所当然地认为:视觉只是一个把看到的图形投射到大脑中的简单过程,这个过程存在着微妙的视觉思维,该过程其实是包含了与图表多次交互的答疑解惑的思维过程。图1.1-3简要说明了我们如何获取图表信息的整个视觉沟通过程,该过程依次通过5个和图表有关的层次来完成:

图表的视觉沟通过程模型

图1.1-3 图表的视觉沟通过程模型

1)首先进入眼帘的是图表整体轮廓和色彩布局这些总体视觉特征。这个层次决定了人的视觉是否愿意持续关注图表,整体色彩把握糟糕的图表更会使人兴趣索然。

2)其次是图表中元素的布局关系,包括图表中元素间的表达面积及其位置。元素布局的不合理和无序会对视觉思维造成严重障碍。

3)紧接着大脑在对图表元素布局进行理性认知的同时,透过图表元素间的比较排序,建立元素间的彼此联系。当太多的图表元素混杂叠加时,如此复杂的元素彼此间关联关系,人脑的短时记忆根本无法理清并存储。

4)再接下来通过图表标题\注释的诉求说明,和已经形成的视觉思维结论建立关联。一个无法回答要说明什么的图表,只会使人一头雾水,不要奢望人人都有和作图者相同的思维。

5)最后是通过具体图表元素获取的信息,进行互动推理判断。如果具体的图表元素不能有力印证图表诉求,一切均徒劳无功。

好的Excel图表应该从何谈起?

图1.1-1形象描述了从数据到图表,再到不同人透过图表看到数据的整个过程。往往我们在作图一开始就出现了理解偏差,外加制作过程信息表达的失真,导致日常所作的大多数图表并没有很好地反映数据本来面貌。

所作非所得

图1.1-1 所作非所得,到底是驴、羊还是马?

1854年,医生约翰·斯诺(John Snow)绘制的一张位置地图(如图1.1-2所示),通过准确标注英国伦敦霍乱疫情病人的所在位置,使人立刻从图表上病人的密集区找到霍乱疫情源头所在:“宽街”的抽水泵。这张极具说服力和不产生歧义的图表,帮助很多人幸免于那场霍乱疫情。

约翰·斯诺的“死亡地图”

图1.1-2 约翰·斯诺的“死亡地图”

开会做汇报是否需要好的Excel图表?

一个周六的上午,我正在计划如何安排下午的一些个人活动,却被临时通知由财务部主导的公司经营会议因故推迟到了下午,周六下午本不上班,不幸这天成了一个例外。

会议在财务部经理的主持下准时开始。会议开始没多久,就听到下面有同事失望地私语:“图表背景颜色和柱状图上的标注颜色太接近,都看不清。”“就是呀,而且很多数据叠加在一起,要是把它们分开来多好。”紧接着总经理也开始发问了……

一个原计划1小时的会议,经历了3个多小时才结束,会议过程漫长而充满沮丧。公司本希望通过财务数据来检视和督导各部门运作,最后却变成了一个检讨如何去做财务报告的培训指导。

今天我们处在一个信息瞬息万变、节奏快如闪电、时间贵似白金的时代,人们追求生动、新鲜、条理、速度、轻松,拒绝冗长和平淡。你我均无一例外地需要接触和使用图表,图表的好坏不仅仅决定一个会议的时间,往往可能关乎公司乃至国家决策的正确性。掌握图表这个沟通工具,让沟通看得见、摸得着,图表的价值不言而喻。

alt

一个表达上扭曲数据、产生歧义的图表只能被称为“垃圾图表”,在日常工作中此类图表总是如影随形,这是因为我们并未认识到其存在问题。好的图表应该是:使用很少着墨即可准确表达作图者诉求的利器,一图抵千言,这是图表的根本所在。

alt