用图表讲故事

“The goal of any chart, graph or information graphic, however, is not merely to communicate clear, dramatic statistics. Instead, its real job is to tell a story that aids decision-making.”

使用图表、图形或信息可视化不仅仅是传递清晰的统计信息,真正的作用在于:讲一个辅助决策的故事。

——爱德华·塔夫特Edward Tufte

将枯燥的数据转换成图表形式,直观呈现数据,不只是数据形象描述的一种形式,创建一个没问题的图表只是第一步,透过图表讲故事来进行有效沟通才是重点,开始沟通前我们是否认真思考过这些问题?

1)内容 所要传递的信息是否明确?

2)过程 故事讲解是否易于理解?

3)意境 读者是否乐意花时间来听这个故事?

作为进行数据分析展示和问题探究的沟通方式,更重要的是将图表演绎成一个“山峦错落有致,水依着山势从山间缓缓流淌,绿草红花相映其中”的生动故事:

  1. 内容是“山”,高低交错使人一目了然地观察到数据间的关系及发展趋势;
  2. 过程是“水”,流动有序使表达流畅自然;
  3. 意境是“绿”,生机盎然使诉求鲜活灵动。

图表不是作给自己看的

图表好比超市,商品的种类数量以及所处位置不由顾客直接决定,但顾客的意愿和喜好决定着商品是否被购买,以及购买数量的多少。图表的目标读者我们称之为受众,受众通过自己的方式和喜好来理解图表,这个过程具有选择性。和“客户是上帝”道理相同,在整个图表的视觉沟通过程中图表制作者并非中心,受众才是。

布局凌乱和色彩搭配欠妥,均不符合视觉审美需求;图表元素间层次不清,相互干扰,不符合视觉逻辑需求;图表整体重点不突出,缺乏诉求表现力,不符合视觉的感知需求。受众在对图表目光接触、理解和诉求记忆活动中有着各种偏好需求,这决定了图表设计者要有为受众服务的良好意识。

不要让图表给受众盲人摸象的感觉,是是而非,成功的图表设计需要完美地融入到受众的视觉活动需求中。这需要站在受众的角度,使用能够被理解且合乎视觉需求的表现形式来传递信息。只有图表承载的说明性信息很容易理解和合乎情理时,才能使受众准确理解其所要传达的含义;图表应留意对受众的心理影响,感情是联想和思维的动力源泉,只有产生强烈的情感交流,才会缩短与受众之间的距离。通过引发受众共鸣、联想,产生视觉与情感合一的愉悦回味,图表诉求自然会被受众欣然接受和信服。记住以下要点:

  • 站在受众的立场给出图表这样设计的理由;
  • 让受众认为自己掌握着对图表数据的控制;
  • 给出肯定有力的结论,让受众信服图表诉求。

数学概念不应被束之高阁

我们今天所面对的数据和以往相比变得愈加复杂和海量,使用图表的表达方式也变得多种多样。但都不外乎将海量数据中具体数据项作为单个图表元素来表示,采用大量的数据集合构成数据图表,同时将数据的各个属性值以多维的形式进行表示,借以从不同的维度观察数据,从而对数据进行更深入的观察和分析,这些不借助数学的力量很难完成。

随着电脑平面设计技术日新月异的变化,以解释数据为目的的平面设计作品被不断被创作出来,这些作品通过互联网、报刊、杂志不断刺激和影响着我们的视觉感知。很多人开始迷恋这些令人舒适和具有享受意味的作品,但请记住我们看到的这些作品大多都是垃圾图表,因为美学考虑大于数学考虑。

自图表产生起,图表就和数学结下了不解之缘,我们日常使用的简单柱形、折线图表虽然只是对数据的简单描述,但请注意这依然是数学中的统计图解分析。不管我们有没有意识到,都无法回避这个现实,专业的图表在我们第一眼看到时,就应该使人联想到数学。

片面的图表

图1.2-7是一张由卫星拍摄的中日韩夜间照片,但这不仅仅是一张照片,这是张数据地图,那些闪光的亮点代表了不同地区的经济发达状况。图中的日本遍布了密集的亮点,几乎已经连成一条光带,我国的沿海地区基本遍布亮点,越往内陆地区,亮点就越稀疏,亮点密集区是珠三角、长三角、黄三角地区,这恰恰有力印证了各地区经济发展的状态。

卫星拍摄的中日韩夜间照片

图1.2-7 卫星拍摄的中日韩夜间照片

如果仅拿日本个别地区和我们的珠三角、长三角、京津塘地区经济数据进行比较,来说明中日经济差异就会有失客观和准确。使用较少数量的数据进行相互间的比较和趋势推断不具有说服力,这就好比只有两个数据点的XY散点图,使用趋势线进行预测,结果只能是线性的两点一条直线,根本不能有效地说明数据真实的趋势。

■ Data Density数据密度

“Data density of graphic=number of entries in data matrix/area of data graphic”

数据密度=各项有效数据点个数/图表诉求表达面积

即在一定大小的空间内表示了多少个有效数据点。在条件允许的情况下,在图表中要容纳大量表达单一诉求的数据点个数。

图表中的“垃圾”

图1.2-4粗看之下仅是一张图片,如果不是右侧的柱形和数据,很难使人想到这是图表。由于大量和数据无关的图形元素占据了整体画面70%的面积,图表的数据诉求被严重降低。好的图表不应该包含如此多与图表诉求无关的表达面积。

2010年服装网上零售市场规模将达到1150亿元的市场规模(图片来自网络)

图1.2-4 2010年服装网上零售市场规模将达到1150亿元的市场规模(图片来自网络)

图1.2-5的图表是一个百分比堆叠柱形图,数据标签密密麻麻散布在整个图表中,数据标签既有具体数值又有各项所占比例。更为糟糕的是具体数值放置在各项中心,而表示图形实际所占的比例却放到了各项侧面,直观感受是:所占面积2居然大于121,这完全背离数学逻辑;由于使用了Excel堆叠柱形图的系列线,比例面积的表达被安排在系列线分割的不规则面积上,肉眼无法进行有效的比较;由于数据标签已经明确了具体数值,Y轴坐标就显得非常多余;根本无法理解右侧辅助标签的使用意图。总之太多的冗余信息交织在一起,使人感到困惑。

富含冗余信息的百分比堆积柱形图

图1.2-5 富含冗余信息的百分比堆积柱形图

不要认为图表上默认的元素,均神圣不可侵犯,也不要认为图表必须一股脑将所有数据信息都要表达清楚。对于图表诉求而言是“垃圾”的内容,请统统大胆地从图表上剔除。看看毕加索的《公牛》(如图1.2-6所示):从第1张写实主义版画开始,逐渐消去细节和形态,留下神质,到最后第11张的抽象线条,寥寥数笔却精炼地表现了公牛的形与神,可以说是对剔除图表“垃圾”的一种完美诠释。

图1.2-6 《公牛》·毕加索Pablo Picasso’s 1945 ‘Bull’

■ Data-ink Ratio数据墨水比

“Data-ink ratio=data-ink/total ink used to print the graphic”

数据墨水比=数据墨水/应用在图表上的总墨水

即有多少笔墨用在数据表达,图表的简明程度就是这个指数的最大化。这意味着必须要删去那些和数据无关的墨水,比如不必要的背景色、网格线、坐标轴等。

图表中视觉的“谎言”

图1.2-1中第一个图表是真实的数据状态,在视觉上这8个柱形看起来差异非常小。第二个图表将Y轴最小刻度设在了60,第三个图表在0~70之间进行了折断处理,同一组数据绘制的8个柱形在第二、第三个图表上看起来差异非常明显。如果不认真读图(尤其第二个图表,将会导致图表反映的数据出现偏差),大脑通过视觉获取的就是错误信息。

同一组数据三种状态下的图表

图1.2-1 同一组数据三种状态下的图表

图1.2-2整个画面由于使用了积木,很有趣味性。但如果没有积木顶端的数据标识,读者根本无法直观获取到准确且有价值的数据。由于透视和单个积木高度的关系,这样的图表让人迷惑和难于理解,看过后留在大脑的仅仅是不同数量积木叠加并排列的图片,而非各类保险品种的比重信息。

关于保险的调查

图1.2-2 关于保险的调查

图1.2-3展示的图表形象直观,但详看之下却发现:数据截止位置到底是处于汽车品牌标志的顶部还是中间?这让人很困惑,不同的人会有不同的解读。汽车品牌标志位于柱形上部,模糊了柱形的准确截止位置,无法准确给出视觉参考基准,于是歧义就这样产生了。

某汽车销售公司各品牌销售一览

图1.2-3 某汽车销售公司各品牌销售一览

■ Lie Factor畸变因子

“Lie Factor=Size of effect shown in graphic/Size of effect in data”

畸变因子=图表中有效表达的数据量/所有的有效数据量

即图形在表达数据诉求时的失真程度,这个评价系数越接近1,图表的失真度越少。图表本身不会产生谎言,造成图表“谎言”的原因很多,尤其当前大多数互联网及其专业杂志的图表制作人员多为平面设计出身,他们常常没有最基本的统计学知识,过于崇尚美学效果,使图表失真度被无限放大,制作出来的图表只能是徒具图表意味的美术广告作品。

不迷失:好图表的三要素

图表视觉大师爱德华·塔夫特(Edward Tufte)告诉我们,卓越的图表:

  1. 需要明确传递有关数据的真相;
  2. 应该是在较小的图表空间内使用最少的着墨,可以在最短时间展示最大数量的信息;
  3. 包含单一诉求的多个数据点。”

以上三点概括出一个好的图表应该具有的三个要素:真实、简明、丰富。

做图表,不能盲目

图表必须是用来直观表达数据诉求的工具,不是一堆无意义图形的杂乱组合。经常看到有人在BBS中发出“有一堆数据,请代为作图”的请求,这样的请求基本没有太好的解答,不同的出发点,理解数据会有不同,自然所作的图表也会截然不同。不要为了作图而作图,开始之前请想清楚我们的图表用来干什么,要传递和表达何种信息比其他都重要。这是方向,如果没有方向或方向错误,一切的努力都是白费工夫。

图表表达诉求和截拳道追求以精简、直接、非传统为核心理念的攻击技法一样,应该做到:

  1. 具有精准简明的图表诉求表达,作为视觉沟通语言,不应该和没有重点泛泛而谈的聊天画上等号;
  2. 诉求应该直接可以从图表中获得,不要犹抱琵琶半遮面,非常不智的是让人去猜想一个图表到底想要表达什么;
  3. 不要将多个诉求塞在一个图表中,一个图表应该只有一个诉求;
  4. 图表存在的价值在于:证明图表诉求所言不虚。没有了诉求的图表毫无意义,这和成语“皮之不存,毛将焉附”是一个道理;
  5. 诉求必须建立在数据基础之上,既不是主观臆断所得,也不应该是断章取义的结论。

做图表原来我们都错了?

在制作图表的过程中,我们总是有意或是无意间制造这样和那样的错误,这些错误产生图表谎言,数据的客观和真实在这些图表上荡然无存;也许我们从未考虑过图表上某些元素,对视觉沟通根本没有丝毫帮助,反而是给视觉带来干扰的垃圾;图表上的每个元素都应该有价值,这些价值应该很好地体现在图表演绎数据的诉求上;具有专业精神的图表才会有很强的说服力。GIGO原则(Garbage In Garbage Out)告诉我们:装入的是垃圾,出来的当然也是垃圾。

玩转Excel图表不简单

要在Excel中创建一个图表非常容易:选择数据>[图表向导]>选中需要的图表类型即可完成,我们日常看到的图表大多均如图1.1-6所示的那样,千篇一律没有特点。随着Excel 2007和2010的发布,图表的默认样式有了不少改观,但这样的图表依然使人感到“审美疲劳”,引不起丝毫的兴趣。

Excel默认生成的柱状图表

图1.1-6 Excel默认生成的柱状图表

图1.1-7是一个叠加了多种诉求信息,并且使用了大量颜色的图表。这个图表在眼前一闪的第一时间,我们可能就已经失去了继续看下去的意愿,除叹服作图者所具有的Excel图表应用功底外,不得不赞叹Excel图表功能的强大。这种强大创造了大量在视觉中彼此干扰的信息,使图表实用性大打折扣,因为这样的图表并不具有可读性。

复杂且糟糕的Excel图表

图1.1-7 复杂且糟糕的Excel图表

图表是拿来阐释数据、展示诉求的语言,使用只有草图水准的简陋图表,和或将图表变成炫耀作图者Excel图表应用技巧的道具,既不尊重图表的读者,也显得我们水准业余。