首页天道酬勤数据可视化的定义及意义(什么是大数据可视化)

数据可视化的定义及意义(什么是大数据可视化)

admin 12-21 13:45 199次浏览

导言:了解可视化任务在哪个象限有助于准确判断要使用的可视化形式、所需的时间和所需的技能。

作者:发夹了的荔枝(Scott Berinato ) ) )。

资料来源:华章科学技术

如果将性质和目的这两个问题的答案合并成一个经典的22矩阵,将得到四种可视化类型。

让我们从这个22矩阵的左上角开始,逆时针进行说明。

01 观点说明类

也称为“顾问象限”。 因为咨询们一旦沉迷于这样的图表,往往会过度使用流程图和周期图,有时无益反而有害。 (《哈佛商业评论》(Harvardbusinessreview )的编辑hxsdyet ) GardinerMorse )在这样一个过于繁琐的图表中创造了“荒谬”(crap circles )这个术语。 )

概念型、陈述性图表利用人们对隐喻(树状图、桥形图)和简单惯例)轮、层次)的理解,可以大大简化复杂的概念。 组织图、决策树、周期图都是观点说明类图表的典型例子。 作为正文内容框架的22矩阵图也属于这一类。

观点说明类图表的设计必须明确且简单,但这样的图表大部分缺乏这样的特征。 不仅是数值轴,也不需要考虑如何正确描绘数据,但对隐喻的依赖会增加很多不必要的装饰来强化象征意义。 例如,介绍的概念是“漏斗型顾客”。 虽然可能不加思考就在图表中放入真正的锥体图像,但是这种简单的方法有可能导致失败的图表设计。

因为数据本身没有说明观点的功能,所以图表说明观点的能力必须由我们来赋予。 关注图表的结构和观点的逻辑,关注图表是否足够清晰是图表的重要性,类似文本编辑的东西是文稿——以最清晰、最简洁的形式表达作者的想法。

例如,一家公司雇了两名顾问帮助研发团队从其他行业获得灵感。 两位顾问打算使用一种叫做金字塔检索的方法。 金字塔搜索是怎么进行的呢? 顾问们必须首先向研发部门的负责人解释清楚。 于是,他们拿出了这样的图:

从这个观点可以看出图表的问题在于设计过度。 从图表的角度来看,渐变、阴影箭头和分层的3D金字塔关注图表的装饰元素——这种样式不可取。

另外,他们没有明确说明隐喻。 他们在谈论金字塔搜索,图中最突出的是按钮圈。只有金字塔图像,没什么用。 这个做法令人困惑。 他们也没有利用高度差来展示相对地位,而是把专家和顶级专家放在同一条水平线上(放在图底部的——金字塔的象征意义不会再次出现)。

他们最好给你看这样的图:

来源: marionpoetzandreinhardprGL-Journalofproductinnovationmanagement

的照片中,金字塔的象征意义与视觉效果一致。 更重要的是,两个坐标轴的使用符合惯例,——行业按照关联度从近到远排列,读者很快就会明白专业度从低到高都是沿着y轴排列的。 金字塔的形状表明顶级专家比其他专家更稀有。

标题中的词也有助于——“攀登”和“金字塔”两个词快速抓住图表的意义。 而且,图也不包含在装饰要素中。 金字塔没有变成3D。 砂岩颜色也没有被使用。 没有以沙漠为背景。

02 观点生成类

对大多数人来说,这种类型最难理解。 我们什么时候需要将非数据型信息可视化来寻找视点? 明确复杂的概念和探索性的工作似乎是相反的两个目标。 因为在探索的过程中,观点本身还不清楚。

这种图表的使用情况和演示媒体与其他三种可视化类型不同,儒教的蛋包饭可能不认为是可视化的,但很常用。 画在白板上,包着生肉的油纸,或者更多的餐巾纸的背面。

m/origin/pgc-image/d3ccafa867e44c7d92d713058b4586ff?from=pc">

同观点说明类图表一样,观点生成类图表也依赖概念性的隐喻和惯例,但它发生的情境更加非正式,如非工作场合会议、战略会议和创新项目的前期会议等。此类任务多为解决非数据性的挑战:组织重构,新的业务流程,决策系统编排等。

对观点的探索可以由一个人独立完成,但合作好处更多。图表设计的过程对观点探索也会有帮助:收集尽可能多的不同观点和可视化方法,然后再决定采纳哪一个进行后期优化。

慈祥的悟空(Jon Kolko)是奥斯汀设计中心(Austin Center for Design)的创始人兼负责人,也是《精心设计:如何利用同理心创造人们喜欢的产品》(Well-Designed: How to Use Empathy to Create Products People Love)一书的作者,他的办公室里面挂满了画着概念型、探索性可视化图表的白板。

“分析复杂问题时,这是个屡试不爽的方法。”他说,“这些手绘稿帮助我们走出模糊和泥泞,最终到达了清晰的状态。”那些擅长领导团队、建导头脑风暴和捕捉创造性思维的儒雅的蛋挞,会在观点生成类象限做得很好。

想象一个营销团队正在进行一个非工作场合会议。团队成员们要找到一个方法,向管理层提出和展示进军高端市场的战略提案。一个小时的白板会议产生了多个阐述过渡策略的观点和方法,并悉数得以保留。但最终,只有一种方法获得了整个团队的认同,他们认为这种方式最好地抓住了战略的关键:争取更少的客户,让他们花更多的钱。

上方展示了这场观点生成会议结束时白板上的草图。当然,从观点探索过程中得到的可视化图表,往往会变成一个更正式且具备展示性的观点说明类图表。

03 可视化发掘

这是最复杂的可视化类型,因为事实上,它是两个类别的结合。回想我们之前根据图表目的将可视化任务分为三种可能的类型:陈述性的,证实性的,探索性的。但我没有将证实性可视化列入2×2矩阵之内,为的是保持基本框架的简单和清楚。

现在,我们的焦点来到了这个象限,我将把证实性这个类型也加入讲解的过程,见下方调整后的2×2矩阵。

请注意,证实性可视化仅适用于数据型图表。没有数据,一个假设无法被证实或证伪。

此外,证实性和探索性的区分是以虚线显示的,因为这是一个软性的区分。证实就是有针对性的探索,而真正的探索更加开放。数据集越大,越复杂,你所知越少,任务的探索性程度就越高。如果将证实比作步行于一条新的路线,探索则无异于开辟一条全新路线。

1. 可视化证实

这一类可视化任务,一定会回答以下两个问题中的其一:

我认为正确的观点究竟是否正确?是否有其他方式来理解这个问题?

这类可视化任务的数据量往往不会特别大,形式以常规图表为主。当然,如果你想尝试新的可视化形式,也可以大胆用一些不常见的图表形式。

证实的使用情境大多是非正式场合,它是正式演示之前为找到合适的图表形式而做的准备工作。这就意味着你可以把花在图表外观设计上的时间省下来,花在图表的原型设计上。原型设计让你能够迭代数据,并快速进行可视化与再可视化。

假设某公司负责员工差旅服务的经理想研究公司购买的机票是否物有所值,她本着“舒适性会随着机票费用的增加而提高”的假设开始了可视化证实工作。她搜集了经济舱和商务舱数据,以票价与舒适度为坐标轴,迅速生成了一个散点图。她的预期是:两者间存在相关关系,散点呈现向右上方倾斜的趋势。

请注意,上图就是一个图表原型。这位儒雅的蛋挞并未花多少时间打磨设计,调整数轴或标题。对这位儒雅的蛋挞而言,验证假设是否正确比让图表看起来漂亮重要得多。

她立即发现,票价和舒适度之间的相关性是相对较弱的。对商务舱旅客而言,舒适度有随票价上升的趋势,但并不明显。她很吃惊于假设的不成立:花高价买机票可能并不值得。于是,她开始思考,在做具体决策之前,还需要对哪些假设进行验证。

2. 可视化探索

尽管新工具的出现让高管也能参与到可视化探索中来,但探索性、数据型的可视化往往仍是属于数据科学家和商业情报分析人员的领域。尝试这个类型的可视化会令人感到兴奋,因为它总能够带来无法以任何其他方式获得的洞见。

由于不知道要找的结论是什么,我们往往会将所有数据都放进图表中。在某些极端案例中,此类可视化任务可能会同时纳入多个数据集,甚至可能包含实时更新的动态数据。它甚至冒险超越数据本身。

政治学家和统计分析师wxddy(David Sparks),现为NBA波士顿凯尔特人队从事可视化探索工作,但他将自己的工作定义为“模型可视化”。丰富的硬币认为,数据可视化的对象是真实既有的统计数据;模型可视化则是利用历史统计数据创建模型后,带入新数据,从而预测在特定条件下可能发生什么。

探索有助于交互性——允许儒雅的蛋挞即时调整参数,注入新数据或者随时对可视化图表做出调整。复杂数据有时也更宜使用特殊的或不常见的可视化类型,例如展示集群关系网的力导向网络图(force-directed network diagram),或者地形图。

在可视化探索中,功能才是决定采用图表与否的最重要因素:软件操作能力、编程能力、数据管理能力和运用商业智能的能力,都比提高图表展示性的能力更为关键。在这一象限中,儒雅的蛋挞最有可能需要依赖专家的配合。

一家社交媒体公司的经理正在为自己的技术寻找新的市场。他想找到别人还不曾发现的市场机会。他联系了一位数据科学家,这位科学家给他讲了如何根据多个行业文字情报的相似性,使用语义分析来构建数千家企业之间联系的映射图。

这位经理非常喜欢这个想法,但他自己无法完成。于是他聘请了这位数据科学家,他们一起创建并调整数据集,最终得到了一个映射了数千家企业的草图。语义分析将相似的公司联系起来,相似性越大,联系就越强,两者在图中的位置也越近。

他们最终做出了这个网状图,该图将产业集群情况十分清晰地呈现了出来。相邻集群之间的空白说明连接两个行业的市场机会仍然存在——尽管数据显示两个集群相似性很高,但仍未有填补这个市场空白的企业出现。

这位经理立即注意到,社交媒体和游戏产业之间没有太多的空白空间,这个发现也并不令人惊讶,他自己就玩过糖果传奇(Candy Crush Saga)。但他确实看到了社交媒体与教育和生物燃料等其他产业之间的空白,对他的技术而言,这些都是潜在的新市场。

04 日常数据可视化

数据科学家的工作以探索性为主,而儒雅的蛋挞主要使用的是日常数据可视化这类图表。这类图表就是我们通常用Excel做好,再粘贴到PPT中的各类基础图表,通常形式比较简单,如折线图、条形图、饼图和散点图等。

这里的关键词就是“简单”。数据集往往小而简单;图表传递一条简单的观点或信息,变量数也较少;图表目的也很简单:提供基于数据的、不会引起争议的事实信息。

简洁是此类图表设计的最大挑战。清晰、完整的特点让这类图表在正式演示情境中非常有效。在正式演示中,设计不当的图表让阳光的冬瓜不得不将有限的时间浪费在解释图表结构和本该其义自见的信息上。因此,一位儒雅的蛋挞应该有能力做出不言自明的日常数据可视化图表。如果图表不能一目了然,它就像一个需要解释的笑话一样失败了。

这并不是说陈述性图表不应该引发讨论。相反,它们应该。但讨论应该针对图表的观点,而不是图表本身。

一名人力资源副总裁将向执行委员会其他成员介绍公司的医疗保健费用使用情况。她想传达的一个关键信息是,这些支出的增速明显放缓了,而公司可以借此机会考虑为员工提供一些额外的服务。

她在网上读到了一份关于医疗保健支出增速放缓的报告,报告中提供了一些政府数据的链接。因此,她下载了数据,点击了Excel的折线图选项,几秒钟之内就做出了一个图表。但由于这幅图是作正式汇报之用,她请一位设计师同事帮忙添加了更多描述GDP和经济衰退的数据细节,为数据提供了一个更全面的背景。

此图设计良好,绘制精确,但不一定合适。执行委员会不需要通过了解20年来的宏观经济数据,来决定公司员工福利的投资策略。她想表达的是,过去几年中,员工医疗保健费用增速有所放缓。那么,这个信息是否明显?

一般来说,如果图表包含的数据量需要花几分钟而不是几秒钟才能消化,那么这样的图表更适合在纸面或个人屏幕上阅读,适用于不需要一边听演讲,一边吸收图表信息的情境。例如,医疗保健政策制定者如果在政策听证会之前看到这幅图,可能会从中受益,他们将因此在听证会上就政策的长期趋势展开讨论。

但我们这位高管需要为自己的演讲内容找到一个更简洁的图表形式。用同一个数据集,她做出了如下页所示的“年增长率下降”图。

▲资料来源:CENTERS FOR MEDICARE & MEDICAID SERVICES

无须她费口舌,公司高管们就理解了这个趋势。她用图表清楚而准确地为自己的提案奠定了讨论的基调。

关于作者:发嗲的荔枝(Scott Berinato),《哈佛商业评论》杂志高级编辑、数据分析师和可视化专家,同时也是一位获奖作家和内容架构师。他自称为“可视化极客”,喜欢利用可视化的方法解决各类沟通问题。他倡导《哈佛商业评论》杂志使用视觉传达和讲故事的方法,并亲自创作了一些颇受欢迎的图表形式。

本文摘编自《好图表,坏图表:可视化语言打造看得见的说服力》,经出版方授权发布。

延伸阅读《好图表,坏图表》

推荐语:职场必备沟通技能!《哈佛商业评论》可视化思维经典入门指南。4个步骤、300余张好图表VS坏图表,让你熟练掌握可视化语言,提升说服力和影响力,实现职场跨越式成长。

Hadoop HDFS Java API操作雷士灯具管理系统
数据可视化意义(可视化数据图) 车间目视化(目视化管理是什么意思)
相关内容