书籍作者:雷元 | ISBN:9787121362057 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:6852 |
创建日期:2021-02-14 | 发布日期:2021-02-14 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
《商业智能数据分析》以实际业务为背景,介绍市面上流行的两种自助型商业分析工具―― Power BI 和 Tableau的功能和特色。
《商业智能数据分析》主要内容包括基本的商业数据分析基础、BI基础知识、数据库的搭建、数据建模、发布 Power BI 和 Tableau报表,并重点介绍智能商业分析工具Power BI 和 Tableau。同时通过使用两种工具所做的商业分析案例,让读者快速掌握商业数据分析的基本要领。
雷元,曾任职于多家IT企业,如微软、惠普、希捷。在玛氏公司从事数据分析工作已经6年;熟悉Power BI与Tableau敏捷BI的应用,负责公司用户培训服务,热心于BI知识创作与传播。
Power BI业界大咖、PowerPivot创始人以及作者Avi Singh力荐
快速掌握Power BI和Tableau,轻松驾驭数据,实现商业智能分析
序言
第一次听雷元(Benny)讲他要写一本关于Power BI和Tableau的技术书时,也是我们微软全渠道事业部(One Commercial Partner,OCP)和其他技术团队的一些同事们组成了一个虚拟团队,与合作伙伴一道大力推进云数据(Cloud Data)、Power BI、人工智能(Artifical Intelligence)这三个重要数据技术综合运用的时候。为了便于大家了解和掌握,这里就把它们简称为“ABC”,好听好记。而在“ABC”三个技术中,Power BI的热度应该是最高的,很多客户和合作伙伴都非常热切地想搭建自己的数字化业务仪表板,深入、实时洞察业务的发展,他们甚至考虑在业务大厅的大屏幕上展示,方便领导、业务团队、客户查看数据。直到今天,这个趋势仍在呈井喷式增长,热度持续高涨,非常期待这本书能够给广大技术和开发人员提供帮助。
另外,也不得不提到,在技术应用迅猛发展的背后,是云计算日益成熟、被广泛接受的现实,我们看到越来越多的客户,正把他们的业务系统、业务数据迁移到云端,通过云服务的方式提供给他们的最终用户。当然,这也对云计算提出了更高的要求,能够更高效、更安全、更开放、更全面地支持各种相关的应用。对于微软提供的Azure云平台,这些都是重中之重,需要优先保证的。在Azure云平台上,除了Power BI,客户也可以选择和部署Tableau的服务器及解决方案,而本书非常全面地对Power BI和Tableau分别进行了详细的介绍,也提供了相关的应用实践和对比,对于要在云上部署Power BI和Tableau服务的读者而言,应该是大有裨益的。另外,Power BI也是开放的,可以支持非常丰富而广泛的数据源,包括不同厂商的数据库、数据仓库、大数据(Hadoop)等,这非常有利于用户打造全面的业务数字化仪表板。
作者在这本书中深入浅出地提供了大量的实战内容,通过结合丰富的项目案例将Power BI的特性以新颖的方式淋漓尽致地展现,独树一帜。在读这本书时,你会深刻感受到作者在内容编排方面的良苦用心。相信你无论是初学者还是进阶者,都会从中有所收获。
技术只有在不断实践中,才能不断丰富、不断创新、不断发展。在微软有一种“狗(Dogfood)”文化,新的产品、工具被开发出来,内部员工要先测试使用,即吃“狗粮”。这既是抢先体验新技术,也是为了发现其中的问题和待改进的方面,可以让产品组更好、更早地改进产品和工具。对于Power BI这个成熟的产品,早就过了吃“狗粮”的阶段,在实际工作中,我们已经广泛使用Power BI。在市场和销售业务分析会上,在产品组的开发和客户分析会上,在和北京办公室大楼的智能楼宇监控大屏上,在部门例会上等,Power BI都是大家非常熟悉也乐于使用的工具。
对我而言,我会在下午或夜晚空闲的时间里,泡上一杯乌龙茶,打开Power BI网站,静静地浏览一下个人列表里的那些项目,挨个“品尝”仪表板上那些丰富多彩而又有趣的图表。这不是“狗粮”,而是悠闲的“下午茶点”时光。
Nevin Dong(董乃文)
微软全渠道事业部首席技术顾问
序二
如今,数据的重要性已无人不知。无论是《经济学人》把数据比喻成新时代的石油,还是马云经常提及的DT(Data Technology)时代,说的都是同一件事——数据将对我们的生活产生深刻的影响。这个影响是全方位的,这几年我们看到,无论是企业层面还是个人层面,都在积极地适应这种变化。
对于个人层面,在这个数据化时代,我们是否也要认真思考一下这个问题:怎么样才能在数据化时代中继续扮演中坚力量的角色?我想这个答案是很明确的,那就是主动拥抱。数据分析思维和数据分析技能将成为未来职场人必须具备的职业素养。
对于企业层面,很多有前瞻性的企业都在推进数据分析文化的建设。以我从业十几年的经验来看,几乎所有数据分析文化推广得好的企业,都非常重视数据分析文化的建设。只有让员工真正爱上数据分析,真正从数据分析中获得价值,企业的数据资产才能真正被盘活,数据文化才能生根发芽。然而,我见过太多企业员工把数据分析当作负担,觉得费时,投入产出比也低。究其原因,很大程度上是因为现有工具的学习成本高,或者由于太多环节需要IT技术的协助而使得沟通成本太大。幸运的是,得益于各种数据分析方法论的逐步完善和软硬件技术的发展,以前很多只有IT行业或统计行业从业者才能完成的数据分析工作,现在也变得更加“平民化”。也就是说,数据分析对专业性的依赖已经逐步弱化,更懂业务的员工可以发挥业务上的优势,产生更有价值的分析内容。2018年10月,Gartner在其发布的《2019年十大战略性技术趋势》中指出,到2020年,平民数据科学家数量的增长速度会比专家级数据科学家快5倍,正是对这一观点的佐证。总之,如果没有办法实现企业内部的数据“平民化”,那么企业内的数据分析文化就难以普及。
而数据分析“平民化”正和Tableau的理念不谋而合。早在2003年Tableau诞生时,这家从斯坦福校园走出来的西雅图公司就以“We help people see and understand data(帮助所有人看到并理解自己的数据)”为使命来开发产品。这里的“所有人”,不单包括专业的分析师,还包括缺乏统计背景或IT技术背景的“非专业”人士,Tableau希望他们能够享受数据分析带来的收益,甚至从中获得乐趣!你没有看错,数据分析也可以很好玩!所以,我们看到许许多多的Tableau爱好者,他们除了把Tableau用在工作上面,回家以后也把Tableau用于分析自己的买房策略,分析下一个假期应该去哪里玩等,让个人的决策更加理性。还有人将Tableau用于分析濒危动物的出没规律,以此制定保护措施;或者分析贫困地区对不同物资的依赖程度,以此作为资源调配的依据,他们用数据分析让世界变得更美好。还有一些“数据艺术家”用Tableau进行“创作”,你可曾想象过,有人曾用Tableau把凡?高的《星空》画出来?我经常被问到Tableau的最特别之处在哪里,如果只能有一个答案,那我的答案就是Tableau有大量的真爱粉丝。从Tableau社区回答问题的活跃程度,从Tableau的粉丝们对数据文化推广的热情程度,从Tableau Public上作品发布的踊跃程度(至今已有超过150万个作品,是全球最大的BI社区),都可以看到这一点。2018年10月结束的“2018 Tableau
全球用户大会”,更是吸引了17 000名Tableau用户和合作伙伴参加。如果你知道这个会议的门票是1795美元一张,你会不会被Tableau粉丝的热情所感动?这绝对是真爱啊!也正因为Tableau所具有的独特魅力,让很多人爱上了数据分析,而他们所在的企业,数据分析文化的推广往往更加顺利。
雷元(Benny)所在的公司就是在全球范围使用Tableau非常成功的公司,雷元也是一个热心的数据分析文化推广者。他结合自己的项目心得写的这本书,不同于一些功能性介绍的书籍,没有故意绕开一些技术障碍,而是把项目中会遇到的问题点出来,并提供了自己的思路和解法。虽然这些解法可能并不唯一,但相信书中的内容肯定能给读者带来一些有益的思路。
同时祝愿大家走出适合自己或企业的数据分析“康庄大道”。
(本文仅代表个人意见,不代表Tableau公司观点。)
Terence Zhang(张腾)
Tableau公司高级顾问
自序:写给数据时代的读者
如今,数据是第一生产力。无论是职场小白,还是高层管理者,每个人都可能会感受到这场数据变革所带来的冲击,每个人都在思考如何迎接数据时代的来临。对于不愿主动顺应时代的人,往往会被时代抛弃。在数据时代,我们需要主动敲开数据之门,自助式BI正是数据时代的敲门砖。
自助式BI并不是什么新鲜事物,时至今日,大多数人使用的自助式BI工具是Excel。在20年前,Excel的确是自助式BI工具中的利器。但是在今天,即使是再好的计算机及最新版本的Excel,也不足以应付海量级的数据增长。
庆幸的是,如今有了非常成熟的自助式BI工具可以弥补Excel的不足。此书的目的在于为读者打开数据分析之门,这是你与数据分析,与Power BI和Tableau的缘分。Power BI和Tableau工具的精髓在于自助和探索两方面,本书从自助和探索的角度分析数据,分享笔者使用Power BI和Tableau创建商务智能报表的历程。
如果将数据价值比喻成财富(这种财富往往埋藏在冗杂数据的深处,不为人所知),那么Power BI和Tableau就像是强大的挖掘机,你将和笔者一道参与到学习使用挖掘机掘宝的有趣游戏中。但这并非说这是一本“轻松”的书,即使书中内容由浅入深展开,其过程也必然是一趟充满挑战的旅程。
如果你希望买到一本全面、深入介绍Power BI 和 Tableau功能且按套路出牌的教科书,那么很抱歉,本书也许不是最优选择。全面铺开的教科书,表面上看似乎涵盖了丰富的知识点,然而其碎片化的结构,令读者最终真正掌握的实用知识甚少。除工具知识外,书中内容还涵盖一系列关于数据分析的方法论与思想,相当于用一条线将散落的珍珠串成一条美丽的项链。
君子不器,纵使Power BI 和 Tableau是数据挖掘的利器,但最终的商业价值是由挖掘者的智慧所决定的。本书教你如何像商业分析师一样思考,并能设计出最终成型的作品。所谓知其然,更知其所以然也。报表设计没有正确的答案,呈现出不同结果都来自于商业分析师们的智慧与独特的创造力。这就是自助式BI的精华之处。当你合上本书的那一刻,希望你掌握了数据分析与收集、建模、评估和部署商业分析的
全过程,并使用BI工具将商业智能报表成型落地。学习自助式BI绝不仅仅是学习一种技能,
而更是一种思维模式。至于为何要将Power BI 和 Tableau的学习过程编写为一本书? 笔者在了解、欣赏、使用P
第1章 商业智能的基础知识 / 2
1.1 什么是商业智能 / 2
1.2 从零开始学习商业智能知识 / 4
1.2.1 第一阶段:积累基础知识 / 4
1.2.2 第二阶段:从小处着手,改变现状 / 4
1.2.3 第三阶段:坚持不懈,持之以恒地提升自我 / 5
1.2.4 第四阶段:充分发挥你的实力 / 5
1.3 数据挖掘流程CRISP-DM / 6
1.3.1 第一阶段:商业理解 / 6
1.3.2 第二阶段:数据理解 / 6
1.3.3 第三阶段:数据准备 / 7
1.3.4 第四阶段:建立模型 / 7
1.3.5 第五阶段:模型评估 / 8
1.3.6 第六阶段:结果部署 / 8
1.4 商业智能的成熟度 / 8
1.5 商业智能基础术语 / 11
1.5.1 数据库概念 / 11
1.5.2 数据表关系 / 13
1.5.3 数据库浏览 / 16
1.5.4 BI工具 / 17
1.6 数据源:Adventure Works数据库简介 / 18
XII 1.7 安装SQL产品及数据库指南 / 21
第2章 商业智能视觉呈现理论 / 25
2.1 视觉构图的基本理念 / 25
2.1.1 视觉构图元素 / 25
2.1.2 视觉构图原则 / 27
2.1.3 视觉草图工具 / 29
2.2 视觉图形的基本介绍 / 30
2.2.1 图表分类 / 31
2.2.2 图表的功能 / 34
Power BI和Tableau建模篇
第3章 Power BI建模基础 / 36
3.1 工具安装:Power BI Desktop / 36
3.1.1 Power BI的版本、许可介绍 / 36
3.1.2 Power BI Desktop界面简介 / 38
3.2 数据准备:获取SQL或Excel数据源 / 39
3.2.1 获取SQL数据源 / 39
3.2.2 获取Excel数据源 / 42
3.3 数据准备:优化数据模型 / 43
3.3.1 集中放置度量 / 43
3.3.2 重命名字段 / 44
3.3.3 删除冗余列 / 44
3.3.4 筛选表行 / 45
3.3.5 调整字段属性 / 45
3.3.6 创建层级 / 46
3.4 数据建模:建立表关联 / 47
3.4.1 SQL表关联 / 47
3.4.2 Excel表关联 / 51
3.5 数据建模:创建度量 / 54
3.6 数据建模:创建进阶度量 / 56 3.7 数据建模:DAX基础知识 / 59
3.7.1 DAX的重要概念 / 59
3.7.2 DAX函数简介 / 61
第4章 Power BI建模进阶 / 70
4.1 销售分析――创建销售趋势报表页 / 70
4.1.1 创建销售度量 / 70
4.1.2 创建销售趋势图 / 72
4.1.3 创建销售地图 / 73
4.1.4 创建产品类别占比与销售渠道占比饼图 / 74
4.1.5 创建同比、环比卡片图 / 76
4.2 销售分析――增加销售渠道维度、优化地理表 / 78
4.2.1 增加销售渠道维度 / 78
4.2.2 优化地理表信息 / 82
4.3 产品销售分析 / 84
4.3.1 创建产品度量与草图 / 85
4.3.2 创建簇状条形图 / 86
4.3.3 创建销售利润率箱形图 / 87
4.3.4 创建产品分布散点图 / 88
4.3.5 创建层级筛选器 / 90
4.4 客户分析 / 92
4.4.1 创建客户度量和草图 / 92
4.4.2 创建客户消费排名 / 94
4.4.3 计算客户渗透率 / 95
4.4.4 创建客户消费TreeViz图 / 97
4.5 销售业绩分析 / 98
4.5.1 查询、编辑销售任务元数据 / 99
4.5.2 创建折线和簇状柱形图 / 102
4.5.3 理解隐性上下文转换 / 103
4.5.4 创建销售人员排名表 / 105
4.5.5 创建销售利润贡献率瀑布图 / 106
4.5.6 创建排名彩虹图 / 107
4.5.7 创建KPI仪表板 / 107
4.6 ABC分析 / 108
4.6.1 用EARLIER函数创建ABC分类 / 109
4.6.2 创建ABC分类矩阵图 / 111
4.6.3 创建Top销售金额排名树状图 / 111
4.6.4 创建销售利润率漏斗图 / 113
4.6.5 创建销售金额分布光圈图 / 113
4.6.6 创建ABC分类产品数 / 114
4.7 销售预测分析 / 115
4.7.1 方法一: Power BI 自带回归预测分析 / 115
4.7.2 方法二: 用户自定回归分析 / 117
4.8 财务报表分析 / 121
4.8.1 用DAX建立层级财务账目 / 122
4.8.2 修正账目表元数据 / 126
4.8.3 财务表账目的同比、等比分析 / 129
4.9 钻取明细数据 / 131
4.9.1 报表钻取设置 / 131
4.9.2 书签功能 / 133
第5章 发布Power BI报表 / 135
5.1 Power BI Online菜单介绍与发布工作簿 / 135
5.1.1 Power BI Online菜单介绍 / 135
5.1.2 发布报表内容 / 137
5.1.3 内容类型简介 / 139
5.1.4 Power BI Desktop读取Power BI Online数据源 / 140
5.2 Power BI Online的特色功能介绍 / 141
5.2.1 自然语言查询 / 141
5.2.2 快速见解 / 143
5.2.3 创建仪表板 / 143
5.3 共享仪表板和OneDrive数据源 / 145
5.3.1 共享仪表板 / 145
5.3.2 分享数据源 / 147
5.3.3 Power BI Mobile / 149
5.4 数据刷新设置 / 151
第6章 Tableau建模基础 / 153
6.1 工具安装:Tableau Desktop / 153
6.1.1 Tableau Desktop 界面简介 / 154
6.1.2 Tableau Prep 界面简介 / 155
6.2 数据准备:Tableau Prep / 156
6.3 数据建模:联合事实表 / 162
6.4 数据建模:联接多数据源 / 164
6.4.1 左侧联接 / 164
6.4.2 1表多次添加 / 165
6.4.3 手动调整联接字段 / 167
6.4.4 保存文件类型和连接 / 169
6.5 数据准备:优化数据模型 / 170
6.5.1 创建销售渠道维度 / 170
6.5.2 字段隐藏、名称改动、层级创建 / 171
6.5.3 创建文件夹 / 172
6.6 数据建模:创建基础公式 / 173
6.7 数据建模:创建进阶公式 / 178
6.7.1 Tableau的判断函数 / 178
6.7.2 Tableau的表函数 / 180
6.7.3 LOD公式 / 181
6.7.4 Tableau 筛选顺序 / 185
第7章 Tableau建模进阶 / 188
7.1 销售分析 / 188
7.1.1 创建销售趋势柱形图(A1) / 188
7.1.2 创建销售金额与销售利润双轴图(A1) / 189
7.1.3 创建销售环比、同比表(A2) / 190
7.1.4 创建线上/线下销售金额占比、产品类销售金额占比饼图(A3、A4) / 190
7.1.5 创建销售地图(A5) / 191
7.2 销售分析:创建仪表板 / 193
7.2.1 仪表板筛选器设置 / 193
7.2.2 图表位置空间调整 / 194
7.2.3 字体格式调整 / 194
7.2.4 数字格式调整 / 194
7.2.5 动态标题 / 195
7.2.6 设置图表为筛选器 / 195
7.2.7 添加筛选器 / 196
7.2.8 调整筛选器样式 / 197
7.2.9 设置浮动图例 / 197
7.2.10 下钻销售趋势 / 198
7.3 销售分析――完善地图 / 198
7.3.1 添加州地图及LOD计算字段 / 198
7.3.2 设置地图筛选器 / 200
7.3.3 制作VIZ in Tooltip / 202
7.4 产品销售分析 / 204
7.4.1 创建产品订单数量趋势图(B1) / 204
7.4.2 创建产品销售数量散点图(B2) / 205
7.5 客户分析 / 209
7.5.1 创建统计排名(C1) / 209
7.5.2 控制排序内容 / 210
7.5.3 创建显示排名参数 / 212
7.5.4 计算客户渗透率 / 213
7.6 销售业绩分析 / 218
7.6.1 运用数据混合模式 / 218
7.6.2 计算销售任务达成率 / 219
7.6.3 创建销售排名表 / 222
7.6.4 员工销售金额和利润贡献率 / 227
7.7 ABC分析 / 230
7.7.1 计算产品销售累加和占比 / 230
7.7.2 创建帕累托图 / 232
7.7.3 用帕累托图验证“二八法则” / 233
7.7.4 色阶与词云应用 / 235
7.8 销售预测分析 / 237
7.8.1 预测方法一:Tableau自带回归预测分析 / 238
7.8.2 预测方法二: 定制化分析 / 241
7.9 财务报表分析 / 245
7.9.1 创建财务明细条行图 / 245
7.9.2 子类账目的合计百分比 / 248
7.9.3 创建财务报表趋势区域图 / 249
7.9.4 设置突出显示效果 / 251
7.10 钻取销售记录明细 / 253
7.10.1 创建筛选器菜单 / 253
7.10.2 快速填充空白重复区 / 255
第8章 发布Tableau报表 / 260
8.1 Tableau Online简介与发布工作簿 / 260
8.1.1 Tableau Online简介与注册方法 / 260
8.1.2 发布工作簿 / 262
8.2 发布数据源 / 264
8.2.1 Tableau Bridge客户端简介 / 264
8.2.2 发布共享数据源 / 265
8.2.3 替换数据源 / 268
8.3 Tableau Online服务功能 / 269
8.3.1 Tableau 项目菜单 / 269
8.3.2 Tableau视图菜单 / 273
8.3.3 Tableau移动端视图 / 274
企业级应用篇
第9章 IT与商业的新型合作模式 / 277
9.1 IT与业务共同管理 / 277
9.2 创建SSAS项目 / 279
9.3 搭建SSAS数据模型 / 282
9.3.1 创建关联 / 282
9.3.2 创建度量 / 284
9.3.3 建立动态表 / 286
9.3.4 创建层级 / 286
9.3.5 部署数据模型 / 287
9.4 SSAS模式中的Power BI和Tableau应用 / 287
9.4.1 创建Power BI应用 / 287
9.4.2 创建Tableau应用 / 289
9.4.3 SSAS模式自动处理模型 / 291
9.4.4 Power BI网关的设置 / 295
9.5 未来SSBI之展望 / 295
后记 / 298