书籍作者:李渝方 | ISBN:9787121428340 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:7220 |
创建日期:2023-01-14 | 发布日期:2023-01-14 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
本书以数据思维为主题,以数据分析全流程为主线,融合了与数据思维相关的编程语言、统计学基础及案例分析等内容,全书分为4 篇,囊括了数据思维的概念和培养方法、数据来源及体系建设、数据分析三大思维方式及用户流失、用户转化实战等共11 章的内容。本书囊括了数据分析中常用的分析方法,包括经典的海盗(AARRR)模型、麦肯锡的MECE 模型、逻辑树、漏斗分析、路径分析、对比分析、A/B 试验、RFM 模型、K-Means 算法、5W2H 等分析方法,还包括各类方法的实践案例及Python 实操项目。可以说本书是数据分析方法论与统计学知识、编程语言及应用案例的完美结合。
本书适合工作了1~3 年的初级数据分析师;已经掌握了数据分析工具,需要培养数据思维的转行人员;数据科学行业的人力专家和猎头等。
李渝方,网名森夏恩,复旦大学硕士,生物医学专业转行互联网数据分析,先后就职于游族网络、 阿里巴巴,现就职于某互联网大厂担任数据分析师。知乎数据分析话颖的优秀回答者, 公众号“数据万花筒”运营者,累计创作 “100+”篇数据分析原创文章,原创文章在全网累计阅读量超过百万!
随书配套的数据资源可在公众号“数据万花筒”后台回复 “数据思维” 获取,或者扫描封底二维码添加博文小助手来获取。
本书作者是互联网大厂资深数据分析师
作者累计创作 “100+”篇数据分析原创文章,全网累计阅读量超1000000
本书是数据分析方法论与统计学知识、编程语言及应用案例的完美结合
本书适合工作了1~3 年的初级数据分析师
已经掌握了数据分析工具,需要培养数据思维的转行人员
数据科学行业的人力专家和猎头等
前 言
为什么会写这本书
市面上大部分数据分析相关的书籍都是从工具的介绍开始的,但很多时候数据分析主要依靠数据思维。特别是面对复杂业务场景时,对于业务的熟悉程度及数据思维显得尤为重要。因为数据思维决定了分析问题的角度及合理性,只要数据分析师能够针对特定问题提出分析方案,无论用什么工具都可以得到结果,因此数据思维是数据分析师成长进阶路上的必修课。
而市面上关于数据思维的书籍较少且部分书籍讲授的知识点较浅,能够将数据思维、编程语言、统计学思想及案例分析等融为一体的书籍少之又少,于是我萌生了写一本以数据分析全流程为主线的数据思维相关书籍的想法。由于我长期坚持在自媒体上分享数据分析相关的转行经验、数据思维相关的思考,几年下来积淀了不少受大家欢迎的文章,为书籍的创作奠定了一定基础,因此有编辑陆续邀请我写书。最终,选择和电子工业出版社张慧敏老师合作,也开始了我的写书历程。
本书特色
本书以数据思维为主题,以数据分析全流程为主线,融合了编程语言、统计学基础及
案例分析等内容,全书分为4 篇,囊括了数据思维的概念和培养方法、数据来源及体系
建设、数据分析三大思维方式及用户流失、用户转化实战等共11 章的内容。本书囊括了
数据分析中常用的分析方法,包括经典的海盗(AARRR)模型、麦肯锡的MECE 模型、
逻辑树、漏斗分析、路径分析、对比分析、A/B 试验、RFM 模型、K-Means 算法、5W2H
等分析方法,还包括各类方法的实践案例及Python 实操项目。可以说本书是数据分析方
法论与统计学知识、编程语言及应用案例的完美结合。
第1 篇是入门篇,主要通过具体示例介绍数据思维是什么、数据思维在数据分析师
成长过程中的重要性及数据思维养成的三种方法。
第2 篇是预备篇,想要做数据分析,就得有数据,因此本篇首先介绍了互联网企业
的数据来源,即通过数据埋点获得用户数据。在此过程中,数据分析师主要基于业务需
求设计埋点方案,所以这也是本篇的重点内容之一。有了数据之后,对数据进行一定处
理和加工是十分必要的。数据标签体系是数据加工处理的重要一环,数据分析师在其中
承担了一部分数据标签开发工作,这部分会用一章的篇幅进行阐述。除此之外,想要通
过数据监控业务,就需要建立数据指标体系。至于什么样的数据指标体系才是好的指标
体系,如何才能搭建一套能够反映业务的指标体系,如何通过指标体系排查数据异动,
就是第6 章的内容了。
第三篇是方法论篇,在完成数据埋点及数据体系化之后,便可进入分析环节。这一篇
主要介绍了数据分析过程中常用的三种思维方式:对比思维、分群思维及相关思维。对
比思维是第7 章的内容,这一章主要介绍数据分析中各种比较的方法,包括同比、环比、
定比等。但在对比分析中较为重要的是线上试验——A/B 试验,因此本章大部分篇幅会
介绍A/B 试验流程、统计学原理以及利用Python 完成案例实操。分群思维是第8 章的内
容,这一章主要从结构化分析、同期群分析等分析方法出发介绍其在用户分群中的应用,
同时会通过开源数据集利用RFM 模型及K-Means 算法实现用户分群。相关思维是第9
章的内容,分析两个或多个变量之间的相关性是数据分析师的日常工作之一,但变量间
具有相关性并不代表具有因果性,因此这一章会从相关性出发讨论相关与因果之间的
关系。
第四篇是实战篇,这一篇立足于用户生命周期中流失与转化两大重要阶段,总结用
户流失的分析方法论及用户转化相关的分析方法。用户流失分析是本书第10 章的内容,
这一章会从流失用户的定义出发,介绍用户流失的内因分析、外因分析方法论;同时介
绍如何设计问卷验证从数据层面分析出的内因和外因是否正确;最后,通过生存分析预
测用户流失周期以辅助运营人员进行用户干预,以减少用户流失。用户转化与付费分析
是本书第11 章的内容,这一章会介绍活动转化率的预估方法、漏斗分析在用户转化中的
应用,以及营销增益模型在用户付费及转化中的应用。
读者定位
本书适合以下几类人群:
l 工作了1~3 年的初级数据分析师。
l 已经掌握了数据分析工具,需要培养数据思维的转行人员。
l 数据科学行业的人力专家和猎头,用于标定候选人的数据分析能力。
本书以数据思维为主题,其中的实践案例涉及Python 及SQL 语言,但本书不会讲解
Python、SQL 的基础编程知识,所以本书面向已经掌握了Python 及SQL 等数据分析语言
的数据分析师和相关转行人员。
学习建议
数据思维并不是一蹴而就的,也不是学完本书就会立刻拥有的。本书不具备赋予读
者数据思维的“超能力”。数据思维不同于数据分析工具,数据思维较为抽象,需要在业
务实战中积累经验。但是本书会总结分析方法论、分享实践案例,引导读者树立数据思维。
当然这是远远不够的,培养数据思维最好的方式还是在实战中积累和总结。本书只是抛砖
引玉地为读者建立一个系统框架,最终还需要读者在自己的行业中不断实践和积累。
本书并不是空洞而抽象地讲数据思维,而是基于完整的数据分析流程阐述数据思维
在整个流程中的应用,涉及数据分析的每一阶段。从通过数据埋点获取用户数据到数据
标签化处理,再到指标体系监控业务变化,是数据分析的准备工作;对比思维、分群思维
及相关思维是数据分析各个阶段都会用到的思维方式;将各类分析方法及分析思维恰到
好处地运用到业务场景中,以揭示业务问题才是数据分析真正要解决的问题。
本书从数据埋点到各类分析方法的应用,为读者搭建了一套系统的分析框架,读者
需要在掌握Python、SQL、Excel 等数据分析工具的前提下进行实践。Python 实操部分属
于进阶内容,这部分工作在大公司中多由算法工程师承担,数据分析师可以将其作为拓
展和提升内容进行了解。
勘误与支持
由于作者水平有限,书中难免出现一些疏漏,恳请读者批评、指教。读者可以将文中
发现的错误、不准确的描述、代码问题、文字问题及有疑惑的地方反馈到邮箱
[email protected] 或者反馈到公众号“数据万花筒”后台,我们会对相关内容进行修订。
全书的代码除了通过扫描封底小助手二维码领取,还可以从公众号“数据万花筒”后台
获取,期待得到你们真挚的反馈!
致谢
本书是在长期的工作中总结出来的经验和方法,首先,要感谢从实习到正式工作这
几年中陪我一路走来的同事们及前同事们,没有你们的指导,就没有我的成长!
特别感谢黄毅斐、杨昊明两位领导对本书的指导,感谢周晟、李姣阳、贾彦龙为本书
写推荐语,同时感谢孙志杰、王倩倩、曾思皓、蔡俊君、李海钊、黎芮琦等对本书进行校
正,并提出修改意见。
其次,感谢父母,是你们给了我生命,给了我受教育的机会,在困难和挫折面前鼓励
我、帮助我,才有了今天的我!
当然,也要感谢公众号的读者,是你们的支持使我有了持续更新技术文章的动力,也
才有了这本书!同时要感谢在做公众号时遇到的各位优秀的同仁。
更要感谢电子工业出版社的张慧敏老师,从选题到立项,再到一遍一遍地修改书稿,
她提出了很多有建设性的意见和建议。
目 录
第1 篇 数据思维
第1 章 数据思维是什么 1
1.1 从数据治理流程浅谈数据思维 1
1.1.1 什么是数据治理 2
1.1.2 数据治理流程介绍 2
1.1.3 从数据治理流程谈数据部门岗位职责 . 3
1.1.4 数据分析师在数据治理流程中所需要的数据思维 . 4
1.2 数据思维到底是什么 5
1.2.1 应用数据思维的工作 5
1.2.2 数据思维是可以培养的 .. 6
1.3 数据思维最直观的解释 6
1.3.1 构建有效的监控体系和客观的评价标准 . 7
1.3.2 用合理的分析方法探究原因以及评价效果 . 7
1.3.3 综合运用统计学知识对活动效果进行预估 . 8
第2 章 为什么数据思维如此重要 . 9
2.1 数据思维是数据分析师必备的技能 9
2.1.1 数据分析师必备的硬技能 9
2.1.2 数据分析师必备的软技能 10
2.1.3 为什么软技能比硬技能重要 10
2.2 数据思维是数据分析师成长晋升的必备技能 11
2.3 数据思维能帮助数据分析师建立影响力 11
第3 章 数据思维如何培养 14
3.1 熟悉常用的数据分析方法 14
3.1.1 三大分析思维 14
3.1.2 不同生命周期的分析方法 15
3.2 树立目标意识,寻找潜在分析点 16
3.2.1 为什么需要树立目标意识 17
3.2.2 通过多问“为什么”,树立目标意识 . 18
3.3 不预设立场,通过客观的标准代替主观的判断 19
3.3.1 不预设立场才能做到客观 19
3.3.2 预设立场与假设检验的区别 20
3.4 基于数据分析结果为业务方提出切实可行的解决方案 21
3.4.1 数据分析师提出合理建议需要经历的三个阶段 21
3.4.2 数据分析师需要避免的几种提建议的方式 23
第2 篇 数据指标体系
第4 章 数据埋点 . 27
4.1 数据埋点简介 27
4.1.1 从数据产生流程浅谈数据埋点 28
4.1.2 为什么需要进行数据埋点 29
4.1.3 数据埋点能够采集哪些用户数据 29
4.1.4 数据埋点与隐私保护 30
4.2 数据埋点分类及主流的数据上报技术 30
4.2.1 数据埋点的分类及方式 30
4.2.2 主流的数据上报技术 31
4.3 数据埋点方案设计 32
4.3.1 数据埋点流程 33
4.3.2 通过六个步骤实现数据埋点设计 34
4.3.3 以电商成交为例实现数据埋点设计 35
第5 章 数据标签体系 . 38
5.1 数据标签体系与用户画像 38
5.1.1 什么是数据标签体系 38
5.1.2 数据标签体系的作用 39
5.1.3 数据标签的分类 39
5.1.4 用户数据标签的层级分类 40
5.1.5 数据标签体系与用户画像的关系 41
5.2 如何构建数据标签体系 42
5.2.1 数据标签体系构建的流程 42
5.2.2 数据分析师在标签体系构建过程中承担的角色 43
5.2.3 以某App 付费用户的数据标签体系的构建为例,浅析数据标签体系构
建过程 44
5.3 数据标签体系的应用场景 47
5.3.1 数据标签体系辅助运营人员进行决策分析 . 48
5.3.2 数据标签体系可提升数据分析师的分析效率 . 48
第6 章 数据指标体系 49
6.1 从中国人口数据初识指标体系构建 49
6.1.1 什么是指标体系 49
6.1.2 为什么需要指标体系 50
6.1.3 指标体系的评价标准及注意事项. 53
6.2 用四个模型梳理数据指标体系构建的方法论 53
6.2.1 构建数据指标体系的方法 54
6.2.2 用三个步骤、四个模型梳理数据指标体系的方法 . 54
6.2.3 以GMV 为例搭建数据指标体系 . 57
6.3 如何搭建一套通用的指标体系并快速落地应用 60
6.3.1 多部门配合搭建数据指标体系的流程 . 60
6.3.2 搭建通用的指标体系 61
6.4 定位异动因素 65
6.4.1 数据波动多少才能称为数据异动. 65
6.4.2 数据波动分析的方法论 65
6.4.3 从数据埋点到指标体系再到指标异动的闭环 . 70
第3 篇 数据分析方法论
第7 章 对比思维 . 71
7.1 利用对比分析得出结论 71
7.1.1 对比分析的作用 71
7.1.2 确定对比的对象 72
7.1.3 如何对比 72
7.1.4 对比分析的可比性原则 77
7.2 A/B 试验设计及容易忽略的误区 . 78
7.2.1 什么是A/B 试验 . 78
7.2.2 A/B 试验能解决什么问题 . 78
7.2.3 A/B 试验的流程 . 79
7.2.4 A/B 试验常见的误区 82
7.3 A/B 试验背后涉及的统计学原理 . 87
7.3.1 什么是抽样 87
7.3.2 样本为什么可以代表总体 88
7.3.3 通过假设检验判断A、B 两组样本是否存在差异 . 90
7.3.4 如何通过样本估计总体 91
7.3.5 如何确定足够的样本量,以达到所希望的边际误差 92
7.3.6 如何衡量试验效果 94
7.3.7 多重比较中P 值修正的三方法 96
7.4 Python 实战:A/B 试验在广告方案选择中的应用 96
7.4.1 试验背景 96
7.4.2 数据基本情况探索 97
7.4.3 A/B 试验结果分析 98
第8 章 分群思维 . 102
8.1 从用户生命周期浅谈分群思维 102
8.1.1 什么是分群思维 102
8.1.2 为什么需要用户分群 104
8.1.3 用户分群方法论 106
8.2 用数据分箱进行结构化分析 107
8.2.1 结构化分析是什么 107
8.2.2 如何更加高效地做结构化分析 109
8.3 同期群分析解读用户生命周期,剖析真实用户行为和价值 110
8.3.1 同期群分析是什么 111
8.3.2 做同期群分析的意义 112
8.3.3 数据分析师如何快速地做同期群分析 113
8.4 Python 实战:基于RFM 模型及K-Means 算法实现用户分群 . 115
8.4.1 RFM 模型与K-Means 算法介绍 116
8.4.2 RFM 模型实现用户分群 . 118
8.4.3 K-Means 算法实现用户分群 123
第9 章 相关与因果 . 133
9.1 相关性分析简介 133
9.1.1 相关性分析与相关系数 133
9.1.2 常用的三种相关系数 134
9.1.3 相关系数实战 136
9.2 因果推断方法论 138
9.2.1 相关性不等于因果性的示例 139
9.2.2 从辛普森悖论谈因果推断 139
9.2.3 因果推断的三个层级 141
9.2.4 因果推断的方法 141
9.2.5 因果推断常用的框架 144
9.3 Python 实战:利用DoWhy 框架实现因果推断 . 144
9.3.1 DoWhy 因果推断框架简介 . 145
9.3.2 数据来源及预处理 145
9.3.3 数据相关性探索 148
9.3.4 因果推断实现 149
第4 篇 数据分析案例实战
第10 章 用户流失分析 159
10.1 用户流失分析方法论 159
10.1.1 用户流失分析总体方法论 160
10.1.2 定义流失用户的方法 161
10.1.3 分析用户流失的原因 164
10.1.4 生成流失用户标签 164
10.1.5 预测潜在流失用户 165
10.1.6 分层运营及用户召回 165
10.2 案例分析:用5W2H 方法分析游戏用户流失原因 165
10.2.1 情景介绍 165
10.2.2 5W2H 方法介绍 . 166
10.2.3 以游戏用户流失为例,详解5W2H 方法 167
10.3 用5 个理论模型构建外部因素分析框架 170
10.3.1 通过SWOT 模型全面认识产品 . 171
10.3.2 PEST 模型分析外部宏观环境的四个视角 171
10.3.3 用波特五力模型分析竞品的五个维度 . 172
10.3.4 用4P 理论指导竞品分析 173
10.3.5 用户体验五要素模型优化产品功能,减少用户流失 . 174
10.3.6 几个模型之间的关联 175
10.4 如何设计问卷验证用户流失的原因 176
10.4.1 问卷可以做什么 176
10.4.2 如何设计问卷 176
10.4.3 问卷的投放 180
10.4.4 数据分析及报告撰写 181
10.4.5 通过问卷获取信息可能存在的问题 181
10.5 Python 实战:通过生存分析预测用户流失周期 182
10.5.1 生存分析 182
10.5.2 数据基本情况探索 184
10.5.3 探索变量之间的相关性 188
10.5.4 用KM 模型分析用户留存率 189
10.5.5 Cox 风险比例模型 190
第11 章 用户转化与付费分析 197
11.1 用户转化与付费分析概述 197
11.1.1 从用户转化谈数据分析师的职责 197
11.1.2 用户转化与付费常用的分析方法介绍 198
11.2 贝叶斯公式在用户转化中的应用 198
11.2.1 贝叶斯公式简介 199
11.2.2 用贝叶斯公式预估特定群体的转化率 199
11.3 案例分析:用漏斗模型分析某电商平台换货业务,提升用户转化率 201
11.3.1 什么是漏斗分析 201
11.3.2 漏斗分析的核心步骤 202
11.3.3 以某电商平台逆向上门取件换货业务为例,详解漏斗分析法. 203
11.4 用营销增益模型实现用户分群,辅助运营人员识别营销敏感人群 208
11.4.1 什么是营销增益模型 208
11.4.2 为什么需要营销增益模型 209
11.4.3 营销增益模型的建模方法 210
11.4.4 营销增益模型的评价指标 211
11.5 Python 实战:利用营销增益模型识别营销敏感人群 212
11.5.1 数据初步探索 212
11.5.2 数据预处理及数据可视化 214
11.5.3 构建营销增益模型 216
附录A 缩略词及中英文对照 . 219
参考文献 . 221