书籍作者:CDA 数据科学研究院 | ISBN:9787121443961 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:7571 |
创建日期:2023-05-09 | 发布日期:2023-05-09 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
本书是企业业务数据分析方法的集大成著作,由知名数据分析研究机构CDA 数据科学研究院组织多名行业知名专家进行研讨、策划、编辑而成。书中内容源自对各行业领军企业实际业务数据分析技能需求的提炼及总结,这些企业包括但不限于京东、腾讯、IBM、中国移动、北京电信、苏宁集团、招商银行、中国邮政集团、GrowingIO 等。全书由八大部分构成:
绪论、表格结构数据与表结构数据、数据库应用、描述性统计分析、多维数据透视分析、业
务分析方法、业务分析报告与数据可视化报表、CDA 职业发展。
CDA数据科学研究院简介
2013年,大数据行业方兴未艾,CDA数据科学研究院孕育而生,是国内率先成立的专注于数据科学领域的专业研究团队。
CDA数据科学研究院汇集数据行业专家,团队具有专业的学术素养、精湛的研究水平、扎实的企业实战经验,丰富的行业资源,通过对各类企业、社会组织等进行全面、系统、深入的调查和访问,从而获得紧跟技术发展的经验与数据,并结合数据行业的未来发展方向进行系统的研究,不断研发新的知识体系和技术应用。
近十年来,CDA数据科学研究院秉持“专业性、前沿性、科学性”的定位,深耕数据分析、大数据、人工智能等核心领域,持续推进数据科学的行业发展。
未来,CDA数据科学研究院也将顺应数字化时代浪潮,持续开拓创新,继续加大数据科学领域的内容建设,推进人才数字化赋能,助力企业数字化转型。
全面、系统地讲述业务描述性分析为企业决策行为创造价值的全流程技能,涵盖描述性数据分析方法、业务分析方法、数据分析结果应用方法等内容。条理清晰的结构、通俗易懂的语言、完整立体的知识框架为读者铺开一幅精美的业务描述性分析知识画卷。建议读者先全篇通览整幅画卷,建立完整的数据分析知识体系,再精细阅览画卷中的每个细节,深入掌握每个具体知识点。
序言
CDA,数字化人才的身份认证
数据曾经是商业“尾气”,而现在成为当今世界的“石油”,借助合适的模型、算法、技术,可以从数据中挖掘出巨大的商业价值。数据分析极大地促进了现代服务业、制造业差异化竞争格局,将来更会成为各行业获得竞争优势的助推力。
数据分析的主要目标之一就是满足组织的业务运营需求,为业务服务。大部分组织经历了从以产品为中心到以客户为中心的过程,其数据分析的重点也从关注组织经营结果到进行全方位的客户洞察,分析方法也从以管理报表为主到微观个体的行为预测。另外,IT 技术的发展使得组织可以以更低的成本存储和处理大量的数据,促使组织不断从宏观业务分析到个体微观分析,使用的数据层次从基本属性、时点状态数据,逐渐丰富到行为数据,使用的分析技术从统计分析逐渐过渡到机器学习和深度学习。
满足业务运营需求更本质的目标是通过数据分析改变决策方式,从依靠经验转向依靠数据。目前,数据分析有两个主要阶段,分别是隐性知识显性化和显性知识算法化。前者是一个概念明晰和逐渐量化的过程,后者是提取知识形成算法并固化在业务流程系统中的过程。组织核心能力从“以人为核心”转变到“以算法为核心”。
通过数据分析进行科学决策、自主决策,从而实现业务价值,使数据分析在决策过程中不可或缺,逐渐成为组织的核心竞争力。
在数据分析领域深耕多年的CDA 数据科学研究院,通过多年的业界深耕,建立起CDA 数据分析能力认证体系,助力企业实现宏、微观相结合的数字化转型,提供合格的数据化工作人才保障。
CDA 数据分析能力认证体系涵盖绩效分析、客户分析、流程分析、智能学习,助力企业成为宏、微观相结合的数字化战略中心组织。前面的分析为后面的工作指明方向,后面的活动为前面目标的实现提供能力支持。而最下层的学习活动在数字化时代,已经演变成“机器学习”,将业务知识以算法的形式固化在系统中。
CDA LEVEL Ⅰ教材主要讲解业务分析所涉及的评价指标体系的构建、数据采集与数据操作、商业智能分析、战略及运营分析报告等业务宏观分析技术;CDALEVEL Ⅱ教材主要讲解客户运营、流程分析和策略优化所涉及的标签体系、用户画像、根因分析、预测模型、运筹优化等业务宏观分析与客户微观洞察相融合的技术;CDA LEVEL Ⅲ教材主要讲解在商业机器学习运营(MLOps)框架下如何设计、开发和落地相关的算法模型,以及机器学习经典算法与案例、自然语言处理、自动学习等客户微观分析技术。教材在工具实现上选择当今比较流行的数据库语言SQL和编程语言Python 等。
很多企业将CDA 证书作为内部数据分析人才的评定标准和招聘要求。如果认真把这套教材学好,可以形成体系化、专业化的数据分析思维,通过认证考试,达到一个现代数据分析人的合格要求。
即使不参加相关认证考试,这套教材对于读者来说也是很好的数据分析参考书,常读常新,体会数据分析之美,灵活运用教材中的分析方法和案例,让数据分析和实证研究相得益彰,让数据分析和业务经验优势互补。这套教材将在数据分析行业产生影响,如春风化雨,在数据分析理念、理论、方法、技术及工具等方面,滋养各个领域孜孜不倦的数据分析学习者和工作者。
CDA 数据科学研究院
2022 年5 月
前言
“数据是企业的重要生产力”,这句话言简意赅地既概括出了数据在企业经营过程中的用途,又体现出了数据在提高企业竞争力时的重要性。“生产力”是企业创造财富的能力,掌握数据分析能力的企业将具备创造更多财富的能力。既然数据分析对企业经营如此重要,那么掌握数据分析技能的员工自然也就成为企业的中坚力量,是各企业争相抢夺的宝贵人力资源。本书的写作目的就是希望能够帮助各位读者成为企业所需的数据分析人才,为其升职加薪略尽微薄之力。
当企业管理者遇到经营问题时,一般会向两类渠道寻求解决问题的方法。第一类渠道是通过企业管理者自身具备的丰富的经营经验,第二类渠道是通过数据分析得到的分析结果。在多数情况下,企业管理者会先通过数据分析结果洞察到客观存在的经营问题,然后凭借自身丰富的经营经验制定出有效的经营策略,从而最终解决经营问题。
对企业管理者洞察业务问题有帮助的数据分析结果主要产生于两种不同类型的数据分析方法:第一种数据分析方法是业务描述性分析方法,第二种数据分析方法是数据挖掘分析方法。
业务描述性分析方法可以帮助企业管理者找到业务问题出现的关键位置。因为此种分析方法只对过去发生过的业务行为结果进行如实描述,并不对未来可能出现的业务情况进行预测,所以将其称为业务描述性分析方法。简单来讲,此种分析方法的主要作用就是向企业管理者提供业务行为在何种业务角度下的什么位置上做得是好了还是坏了、是更好了还是更坏了,以及好或者坏的程度是多少等信息,企业管理者可以依据这样的信息对好的结果出现的业务位置进行优化使其变得更好,对不好的结果出现的业务位置进行改良使其能够由坏变好,从而为企业创造价值。比如,数据分析人员可以对销售团队中每名销售人员在当前月份下的销售目标的完成情况进行分析,并将分析结果以报表或报告的形式汇报给销售经理,以帮助销售经理掌握当前月份每名销售人员的具体业绩情况。只有掌握了具体业绩情况,销售经理才有可能进一步根据自己对不同销售人员的了解,进行有针对性的销售建议,这样才能带领整个销售团队在未来的销售周期内创造更好的销售业绩。在上述案例中,“销售目标完成情况”是业务行为结果,“销售团队”是业务角度,“每名销售人员”是业务位置,通过业务描述性分析方法将三者结合在一起就可以得到在销售团队角度下针对不同的销售人员位置上的不同的销售目标完成情况的业务结果。
在武侠小说中,作者经常用“有人的地方就有江湖”这句话来形容“江湖”之广,如果将其修改后放在数据分析领域,我们也完全可以用“有业务的地方就有业务数据,有业务数据的地方就需要业务描述性分析”来形容业务描述性分析方法的广泛适用性(普适性)。试问有哪个销售经理不想知道自己带领的团队在过去一段时间内的表现情况呢?又会有哪个运营经理不想知道自己投放的推广资源在不同推广渠道下带来的流量情况呢?这些业务情况都需要使用业务描述性分析方法才能得到。
业务描述性分析方法不仅具备普适性,而且学习难度也并不算高。因为此种分析方法一般不需要使用艰涩难懂的数学理论,也很少需要用到复杂的编程语言,所以它的准入门槛对比另一种数据挖掘的分析方法要低很多,不仅专业的数据分析人员需要精通,就连不同业务岗位上的业务工作者也应该尽早掌握这项技能。这样才能通过业务描述性分析方法及时发现业务行为中的各种问题,早发现问题才能早解决问题,为自己及企业创造更大的价值。实际上,很多企业已经开始高薪招聘具备业务描述性分析能力的业务岗位人才。比如大型电商平台在招聘高薪运营岗位时,容易向应聘者提出应具备基本数据分析能力、精通×× 分析工具、会写分析报告、能够通过数据分析找到业务增长点等要求,这些要求都在业务描述性分析方法的覆盖范围内。
说完业务描述性分析方法后再说本书,本书正是以培养业务描述性分析技能人才为目的而出版的。本书内容涵盖了描述性数据分析方法、业务分析方法、数据分析结果应用方法等内容。本书将为读者全面、系统地讲述业务描述性分析为企业决策行为创造价值的全流程技能。
本书以条理清晰的结构、通俗易懂的语言、完整立体的知识框架为读者铺开一幅精美的业务描述性分析知识画卷。建议读者先全篇通览整幅画卷,建立完整的数据分析知识体系,再精细阅览画卷中的每个细节,深入掌握每个具体知识点。
本书介绍的业务描述性数据分析技能已经成为职场人员的普适性应用技能,是个人职场竞争力的有力证明,是转岗、加薪的得力助手。本书适合CDA LEVEL Ⅰ应试人员、业务工作人员、数据分析从业人员、数据分析岗位求职人员学习。过学习书中的知识,早日实现升职加薪的目的。预祝您职场之路越走越宽、越走越顺。
编著者
目录
第1 章 绪论. 1
1.1 数据分析概述 .1
1.1.1 数据分析的分类 .3
1.1.2 数据分析的基本流程 .4
1.1.3 数据分析的落地方法 .7
1.2 数据分析师概述 .8
1.2.1 数据分析师的不同角色与职责 .8
1.2.2 数据分析师职业道德和行为准则 .10
1.3 数据相关的安全与立法 13
1.3.1 各国的数据隐私相关法律 .13
1.3.2 我国大数据立法的历程和展望 .14
1.4 本章练习题 16
第2 章 表格结构数据与表结构数据. 18
2.1 表格结构数据 .19
2.1.1 表格结构数据概述 .19
2.1.2 表格结构数据特征 .20
2.2 表格结构数据的获取、引用与使用 .24
2.2.1 表格结构数据的获取 .24
2.2.2 表格结构数据的引用、查询与计算方法 .28
2.3 表结构数据 38
2.3.1 表结构数据概述 .38
2.3.2 表结构数据特征 .40
2.4 表结构数据的获取、加工与使用 45
2.4.1 表结构数据的获取 .45
2.4.2 数据库与商业智能的概念解析 .46
2.4.3 表结构数据的合并 .54
2.4.4 表结构数据的汇总 .60
2.5 本章练习题 65
第3 章 数据库应用. 71
3.1 数据库相关概念 71
3.1.1 数据库简介 71
3.1.2 认识数据库 .74
3.1.3 SQL .76
3.1.4 数据仓库 .77
3.2 数据定义语言 .79
3.2.1 DDL 在业务中的作用 .80
3.2.2 定义数据库 .80
3.2.3 数据表 .82
3.2.4 数据类型 .88
3.2.5 约束条件 .92
3.3 数据操作语言 .100
3.3.1 DML 的作用 .100
3.3.2 添加数据 .100
3.3.3 将查询结果添加到表中 .102
3.3.4 更新数据 .103
3.3.5 删除数据 .104
3.4 数据查询语言 .104
3.4.1 单表查询 .105
3.4.2 函数 .125
3.4.3 多表查询 .142
3.4.4 子查询 .158
3.5 视图 168
3.5.1 视图的作用 .168
3.5.2 创建视图 .169
3.5.3 修改视图 .169
3.5.4 删除视图 .170
3.6 本章练习题 170
第4 章 描述性统计分析. 181
4.1 统计学概述 181
4.1.1 统计学的定义及应用 .181
4.1.2 统计学的基本概念 .185
4.2 数据的描述性统计分析 192
4.2.1 集中趋势的描述 .192
4.2.2 离散程度的描述 .203
4.2.3 分布形态的描述 .208
4.2.4 描述性统计图表 .211
4.3 常用的数据分布 .218
4.3.1 两点分布与二项分布 .219
4.3.2 正态分布与标准正态分布 .221
4.3.3 c2 分布 .228
4.3.4 t 分布.229
4.3.5 F 分布 .230
4.3.6 分位点的概念 .232
4.4 相关分析 233
4.4.1 相关分析的含义 .233
4.4.2 简单线性相关关系的描述 .234
4.4.3 简单线性相关关系的度量 .235
4.5 本章练习题 239
第5 章 多维数据透视分析 246
5.1 多维数据模型 .246
5.1.1 多维数据模型概述 .247
5.1.2 多维数据模型创建方法 .248
5.2 5W2H 思维模型 .261
5.2.1 5W2H 思维模型概述 .261
5.2.2 5W2H 思维模型应用案例 262
5.3 多维数据透视分析应用案例 .265
5.3.1 业务场景介绍 .265
5.3.2 案例设计制作过程 .265
5.4 本章练习题 267
第6 章 业务分析方法 274
6.1 业务指标分析 .274
6.1.1 通用指标计算方法 .276
6.1.2 场景指标 .286
6.1.3 指标体系 .302
6.2 业务模型分析 .307
6.2.1 分类模型 .308
6.2.2 漏斗模型 .312
6.3 业务分析方法论 .318
6.3.1 帕累托分析方法 .318
6.3.2 A/B 测试分析方法 .320
6.3.3 同期群分析方法 .320
6.3.4 因果分析方法 .321
6.4 本章练习题 322
第7 章 业务分析报告与数据可视化报表. 330
7.1 可视化分析图表 .330
7.1.1 业务图表决策树 .330
7.1.2 比较类图表 .331
7.1.3 序列类图表 .338
7.1.4 构成类图表 .339
7.1.5 描述类图表 .340
7.2 业务分析报表 .340
7.2.1 业务分析报表的分类与区别 .341
7.2.2 业务分析报表的创建方法 .342
7.3 业务分析报告 345
7.3.1 业务分析报告的分类 .346
7.3.2 业务分析报告撰写注意事项 .346
7.3.3 业务分析报告案例1 348
7.3.4 业务分析报告案例2 352
7.4 本章练习题 355
第8 章 CDA 职业发展 360
8.1 CDA 职业概述 360
8.1.1 CDA 职业背景 .360
8.1.2 CDA 职业特点 .361
8.1.3 CDA 职业前景 .362
8.2 CDA 认证简介 363
8.2.1 CDA 认证标准 .363
8.2.2 CDA 认证方式 .364
8.2.3 CDA 认证流程 .365
8.2.4 CDA 认证证书 .366
8.3 CDA 持证人与会员 .367
8.3.1 成为CDA 会员 367
8.3.2 CDA 持证人权益 .368
8.3.3 年检和继续教育 .369
附录A 数据类型列表 370
附录B 练习题答案及解析. 373