第2版自序
2020年年初,我把多年学习Tableau的所思、所想毫无保留地写出来,配以精致的图片出版发行。《数据可视化分析:Tableau原理与实践》一书收到了众多读者的一致好评,累计印刷8次,发行逾万册,多次入围“京东大数据推荐榜单”前三名。在读者群中,笔者认识了很多Tableau粉丝、企业用户及可视化爱好者。
过去两年多,Tableau产品持续更新迭代,笔者也进一步补充了SQL、数据库、数据仓库等基础知识,并对比学习了Power BI、帆软、观远等国内外多家优秀BI产品的应用。“实践是最好的老师”,笔者在分析项目咨询、Tableau企业培训、可视化开发项目的锻炼中,日渐意识到这本书中的诸多不足甚至错误,并放弃了小修小补的计划,重写此书作为近两年学习的总结。
于是,2022年4月,笔者开始重写本书的内容,并重新绘制、调整了大部分插图,作为第2版。历经波折,多次延迟,本书终于与读者见面。
1. 第2版改进
— 增加对数字化转型的实践思考。
结合笔者多年的切身项目实践,本书总结了数据的应用及其发展阶段,数字化转型的多种路径和循序渐进的组织方案(见第1章)。
— 业务分析方法和体系更加成熟。
业务是分析的“土壤”。在项目咨询过程中,笔者提出了“业务—数据—分析”的框架体系,可以与企业业务流程相结合绘制数据地图(见第2章)。同时,围绕问题结构、聚合、聚合度和详细级别,构建了一个普适性的业务分析方法,适用于各种分析和BI工具,甚至可以作为衡量分析工具的一种尺度(见第3章)。
— 在数据合并、筛选、计算三大主题中,对比介绍了Excel、Tableau和SQL的应用场景。书中总结了“数据合并的分类矩阵”“两类筛选位置”“计算的分类”等实用方法,帮助没有相关技术背景的人更快实现超越,也有助于熟悉SQL的“技术派”更好地理解敏捷BI的精髓。高阶的BI工具绝非拖曳那般简单,在技术平民化的背后,是更巧妙的“业务灵魂”。
— 将“数据筛选和交互”独立为第6章内容,进一步强调筛选在业务分析中的重要性。筛选的类型多样、优先级复杂,应该尽可能避免滥用SUM+IF类型的条件聚合。将筛选视为分析的独立环节,是优化分析性能的关键方式。
— 强化“详细级别”的概念(替代之前的“层次”概念)。在数据表详细级别(Table LOD)、视图详细级别(Viz LOD)之外,使用“引用详细级别”(Reference LOD)代表视图之外预先指定的详细级别。笔者把数据关系、筛选和计算融为一体,这是本书最重要的知识资产,是超越Tableau理解不同工具背后的分析共性的关键。
— 调整了第3篇的知识框架。没有计算,就没有无尽的业务分析,这也是本书最重要的内容之一。
— 增加了“从数据管理到数据仓库”的内容(见第11章),相关内容是从可视化分析走向专业的数据建模、数据方法的关键。“视Tableau Server为DW/BI平台”,给了更多企业全新选择。
— 受限于篇幅,移除了之前Prep Builder数据处理、Tableau Server相关的大部分内容。
2. 致谢
每次写作完成,笔者总是迫不及待地分享。本书付梓之前,笔者在上海组织了“喜乐君精品课”线下活动,详尽介绍了本书的核心内容。教学相长,在分享过程中笔者进一步发现了自身知识体系的盲点。感谢来自天合光能、汉德车桥、上海电气、海南航空、上汽集团、英飞凌等企业的热心读者。
感谢继续支持和信任笔者的企业客户,笔者希望能用专业和热爱回报大家。
感谢Tableau,你给了笔者穿过迷雾的勇气,笔者也将无期限地支持你,对得起“Tableau传道士”的称号,对得起Tableau Zen Master/Visionary的全球荣誉。
感谢父母,感谢家人,“大爱无言”,笔者当用余生以行动回报。
喜乐君
2023年1月20日
第1版自序:鸟会飞是因为有羽毛吗——Tableau与笔者的分析之旅
笔者于2017年偶遇Tableau,从昨日的爱好到今朝的工作,仿佛一瞬,又好似半生。如今,笔者完成了之前未曾想象的任务——把笔者的所思所想、所知所悟以出版的方式分享给更多人。
理想主义者总是习惯性地低估困难,写书这件事情尤其如此。累计638张精心制作的插图,有别于博客文章,力求建立新的体系框架,你我虽隔书相望,但希望每一位读者都能感受到笔者毫无保留的写作态度与努力。2021年,有幸与Tableau艺术家Wendy一起入围Tableau Zen Master全球榜,这是读者和Tableau对笔者最好的认可。
与此同时,还是想谈一下笔者和Tableau的渊源,以此说明笔者如何以文科学历和业务背景从零开始成为今日的“Tableau大使”,这条路每个人都可以走,只需要用心与努力即可抵达。
1.笔者和Tableau的渊源
笔者在毕业后历经国企、创业、私企几番锻炼,于2017年回到婴贝儿担任总裁助理,忙里偷闲四处学习,并且获得了“买任何图书均可报销”的公司特权,受领导鼓励,也在公司义务培训Excel、消费心理学等。考虑到公司低效的“PPT数据传统”和自身专业数据分析知识的薄弱,因此私下搜寻各种大数据分析工具,最后被Tableau的灵活、易用和美观所折服。之后陆陆续续为运营、采购、人力资源等板块做了一些并非成熟的分析。
笔者是典型的“写作型”,因此从学习第一周开始,就陆陆续续记笔记、写博客,纯粹为了帮助自己增强理解,不料几年下来,竟然积累了可观的笔墨。“所有的成功都是长期主义的胜利”。数据和数据分析恰好是一个不错的“风口”,于是误打误撞地进入了这个“陌生但新鲜的行业”。
《经济学人》杂志中曾写道:“21世纪最重要的资源是数据”,但是不经分析的数据没有价值,如同“不经反省的人生不值得过”(苏格拉底),而这正是转型期的企业遇到的成长烦恼。笔者决定和Tableau同行,将自己多年的工作经验与笔者对数据的理解融为一体,认真服务每一位客户,同时获得自我的提升。笔者选择了Tableau,之后通过了Tableau Desktop和Server QA认证,并在参加Tableau峰会时认识了众多Tableau员工和爱好者,开始了开发客户、服务客户的美好旅程。
在服务客户的过程中,笔者不断积累自己的Tableau知识和业务理解,并持续更新博客以增强理解,并向更多客户传播Tableau文化。笔者从不拒绝客户的任何问题,把它视为最好的收集问题和不断学习的机会——没有什么是学习不能解决的问题,如果问题不能被解决,那就是学艺不精。追求超过预期的交付,不仅帮助笔者提高了客户的续费和增购的概率,而且不断积累了下一本书的素材。
2.从所知到所悟
在学习过程中,笔者不断阅读各类数据分析书籍,并仔细翻阅官方近万页的文档和白皮书。可惜的是,笔者找到的国内外每一本Tableau主题书籍,都只能满足笔者的初学需求,却不能满足向中高级进阶时的胃口,总觉得要义未精、框架欠明,如同武林秘籍缺少最后一章,即便各种招式纯熟,也难以在实战面前随心所欲。这种理解上的束缚,阻碍了为客户提供最高品质的培训和咨询。跟随山东大学王思悦老师学习,他教给笔者一种处事态度:“和人交往改变自己,和物交道改变对方”,因此,笔者希望重新构建Tableau的知识体系,并希望帮助初学者和高级分析师更好地使用Tableau产品。
在克里斯坦森教授《你要如何衡量你的人生》一书的开篇,提出了一个让笔者终生难忘的问题:“鸟会飞是因为有羽毛吗?”笔者曾经以为是,但正如克里斯坦森教授所言,人类上千年来一直尝试仿制轻盈的翅膀飞上天,最后,倒是成吨的钢铁飞机实现了。100年前,人类在“流体力学”和“空气动力学”领域积累了足够的知识,才实现了飞翔的梦想,这就是原理的重要性。很多人觉得掌握原理是少数人的事情,殊不知,原理是具有实践性的,它赋予了我们“举一反三”的能力。
因此,笔者迫切地希望洞察Tableau“拖曳”、可视化,特别是高级计算背后的原理,只有掌握了原理,笔者才能用最简单的语言,让所有客户以最少的时间和金钱成本换来最高效的培训和使用效果。而通往大彻大悟的道路只有一条,那就是持续的努力和深度的思考相融合的道路。
整个2019年,笔者一方面不断地向Tableau最难的高级计算和高级互动发起总攻,并持续修改博客文章作为通达明了的明证;另一方面每月组织Tableau公开课程,在分享过程中不断深化自我理解,并在为中原消费金融、以岭药业等客户提供培训的过程中不断总结本书的宏观框架。2019年在国联水产进行的客户培训中,获得了本书第5章的关键灵感。2021年,在长隆集团信息部门的内部交流中获得了“业务字段、分析字段”的关键灵感,并在平安普惠的项目中开始构思“业务数据分析地图”。
在这个过程中,笔者持续写作博客文章以作记录和思考,如今笔者的不少Tableau博客文章,特别是关于“LOD详细级别表达式”原理和案例解读系列,几乎可以与官方的介绍文章并驾齐驱。2020年年初,因疫情在家,得以从头重写每一个细节及其思路,并把基础计算和高级计算融为一体,形成了全新的讲解体系,从而保证初学者也可以快速掌握最高难度的知识环节。
最后,笔者找到了从Excel分析到Tableau数据分析的根本性差异,即层次(LOD详细级别)。客观的数据表详细级别(Table LOD)描述数据结构和颗粒度,主观的视图详细级别(Viz LOD)描述业务问题及其相关性,并通过计算的多种分类把二者融为一体。全书都贯穿了“层次分析”的思路,并在高级计算部分得以升华——高级计算的实质就是多层次问题分析。因此,读者在本书中能看到很多全新的内容,特别是用层次(详细级别)理解大数据分析的核心特征、理解数据结构并识别行级别唯一性、理解Tableau的计算并引导如何选择等。
而精心绘制的插图,旨在用可视化的方式增强理解。通过二次处理,尽可能提高每一幅插图的知识密度。
3.大数据时代的趋势与业务驱动的数据分析
随着互联网经济的蓬勃发展,大数据时代已经成为不可回避的事实。在经济竞争面前,企业更应该追求精益分析驱动的精益成长,构建以分析为中心的敏捷平台变得不可或缺。
因此,敏捷BI(商业智能)已经是大势所趋、不可抵挡。企业成长依赖于在竞争环境中不断做出最优的决策,而决策来自充分地建立假设并高效地验证,数据分析是连接数据资产与价值决策的纽带,而敏捷BI能提高数据的利用效率和企业的决策效率。“分析即选择,决策即择优”,数据分析可以直接创造企业价值,未来已来,所有的企业都将是数据驱动型的组织。
对于企业而言,Tableau提供了敏捷的“数据仓库、商业智能一体化”整体方案。不管是中小企业还是大型企业,Tableau都是极佳的企业级大数据可视化分析平台,它在面向业务方面的卓越表现,迄今难有同行产品可以比拟。
对于业务分析师而言,Tableau入门容易、使用灵活,因此它几乎适用于企业中的每一位数据用户和业务决策者。同时,Tableau博大精深、足够专业,在可视化样式、互动探索、高级计算等方面有无限空间值得探索,因此不断钻研的Tableau分析师可以为自己构建足够高的技术壁垒,从而捍卫自己的专业领地。这也是笔者的选择和道路,只要努力,人人皆可模仿,没有所谓的“学习力”,需要的只是用心和努力而已。
在这条充满光明的道路上,最大的障碍其实不是工具,而是人和文化。借助本书,衷心地希望更多的人能熟练使用Tableau,并建立自己的职业壁垒,节省时间就是拯救个人生命,提高效率就是创造企业利润。
4.致谢
从博客文章到一本书,这是之前笔者还未曾预料的事情;因为疫情在家隔离,一个春天,不料梦想就变成了现实。
特别感谢Tableau赋予的学习机会,让笔者认识了各行各业的企业客户、朋友和读者。
感谢家人,他们给了笔者生活的意义。
感谢时间,感谢充满坎坷与喜乐的人生。
喜乐君
2023年1月20日修改