猜你喜欢
数据化运营速成手册

数据化运营速成手册

书籍作者:胡晨川 ISBN:9787121312670
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:1836
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

《数据化运营速成手册》用于提升互联网公司员工的数据应用能力,即数据化运营能力。首先,从常用的数据图表切入,帮助执行层正确地绘图,管理层正确地看图;接着,梳理运营中最基本的数据应用知识,涉及数据获取、数据清洗、数据认知、分析框架、指标体系、运营实验等内容。然后,介绍作者认为必要的统计学知识,包括假设检验、方差分析、回归分析和时间序列分解,并引入了管理科学中的规划求解方法。最后,介绍了数据分析工具的发展趋势,并分享了作者近些年的工作及学习心得。

《数据化运营速成手册》适用于互联网公司的数据分析师、运营人员、产品经理和中层管理人员。


作者简介

胡晨川,统计学硕士,一个对数据分析充满热爱并努力成为数据科学家的年轻人。在数据分析工作上积累了些许经验。现任职于国内知名网上订餐平台“饿了么”。作者先后就读于浙江工商大学、云南财经大学及立信会计学院。个人微信公众号“川术”,希望通过工作经验的总结和知识的积累,形成切实可用的数据分析内容,帮助越来越多的人从数据分析中受益。



编辑推荐

本书适读人群:互联网公司的数据分析师、运营人员、产品经理,以及中层管理人员。

●掌握基础图表的高级特性

●梳理数据化运营的基本方法、原则、思维模式

●深度量化分析方法(朴素贝叶斯模型、假设检验、方差分析、回归分析、时间序列分析模型等)

●帮助你科学地决策


前言

尊敬的读者,您能翻开本书,是我的荣幸。虽然书名中含有“速成”两字,但我相信理性的读者都不会期待真的有学习捷径。我发现,数据分析的入门者往往不能快速形成合适的知识框架,导致其走了许多弯路。因此,本书不遵从教科书逻辑,而从实际应用出发,相信能够提高读者的学习效率。总的来说,这是一本关于商业数据应用的书。希望本书的内容能给读者的工作和生活带来实质性的帮助。

为什么写本书

长久以来,我都有成为数据科学家的梦想。虽然朝着这个目标奋斗了几年,但是若问我数据科学家到底是什么,我依然没有明确的答案。两件事儿,是数据科学家必须做到的:一是运用合理的数据分析方法,从数据中形成商业决策;二是能让越来越多的人正确地理解并应用数据分析方法。这两件事儿,也就成为我的奋斗目标。所以,当电子工业出版社的编辑联系我写作本书时,我欣然应允了。

谁适合阅读本书

“让读者正确地理解并应用数据分析”是本书的主要目的。广义地说,本书的内容浅显,适合所有对数据分析感兴趣的人。但依我的初衷,本书是写给互联网公司的运营、产品和管理者的。毕竟,我的工作经验均来自互联网背景,因此认知会有一定的局限性,故而这些内容不一定适用于所有行业。

如何阅读本书

首先,建议读者在阅读本书的同时上手操练。本书内容所涉及的实践操作,全部基于Excel 2016。Excel上手简单、功能全面且运行稳定,它的实用性无须多言。

本书的内容结构比较“怪异”。先通过前三章解决“如何正确地作图”这个问题。为什么要将作图放在最前面呢?因为,运营和产品人员要在工作中制作大量图表,管理者要阅读大量图表;若图表做得不正确,难免出现信息扭曲,导致管理者决策失误。所以,作图者应该正确地作图,管理者应该正确地看图。因此,作者从作图切入,进而展开本书的内容,比较符合实际。

接着,在第4章介绍了运营中最基本的数据应用知识。本章涵盖的内容较多。作者的写作逻辑是“缺什么补什么”,即以作者的认知为基础,填补作者认为本书目标读者所欠缺的数据知识(涉及数据库基本结构、数据获取、数据清洗、数据认知、建立分析框架、构建指标体系、运营活动量化等)。

第5章介绍一些简单实用且必不可少的统计学知识。通过这些知识,读者能够培养自己的量化分析思维,并能体会到统计学的强大。第6章篇幅不长,但希望能为读者打开“管理科学”这扇大门,即应用运筹学中的规划求解方法。让读者体会到:做决策绝不仅是定性分析,它可以一步步量化获得最优解。

第7章简单介绍了数据分析的工具和运营工具。里面的部分内容由GrowingIO创始人张溪梦先生和神策数据创始人桑文锋先生执笔。第8章写了一些作者近年的心得体会,希望这些经验能帮助读者少走弯路。

作者建议初次阅读本书的读者先按章节顺序快速通读。在通读之后,若在工作中遇到了某些难处,可以有针对性地精读某一部分。另外,本书中所提及的参考书目,希望读者重视,这些书都是很好的学习资源。

建议读者关注作者的微信公众号“川术”。作者会不定期地分享自己的感悟。本书中的数据都是“模拟的”,建议读者将本书所提的方法应用在自己的数据中。若有强烈的需要,读者可以在作者的微信公众号留言。

感谢

首先,感谢出版方电子工业出版社,给予我机会将自己的经验分享给大家。接着,感谢本书的编辑郑柳洁及其他工作人员,在本书的撰写和出版过程中给予的极大帮助。然后,要感谢我的老师、朋友和同事们,没有他们,就没有我经验的积累和认知的提高。还要感谢本书的推荐人和其他专家,是他们的指导和关怀,让我能高效地前进。最后,感谢我的家人,尤其是我有孕在身的妻子,在每一个伏案写作的夜晚,给予我莫大的理解和无微不至的照顾。


目录

第1章 全面认识数据图表 1

1.1 详解数据图表的基本构成 1

1.2 控制数据图表中的信息量 9

1.3 真的需要作图吗 10

第2章 建立数据图表的认知 14

2.1 利用散点图探究数据间的关系 14

2.1.1 最基本的散点图样例 15

2.1.2 散点图的制作 16

2.1.3 散点图的变种1:添加平滑线 19

2.1.4 散点图的变种2:利用气泡图观察更多指标间的关系 20

2.1.5 散点图的变种3:用分类矩阵形成决策 22

2.1.6 散点图的局限性 23

2.2 利用柱形图将“对比”做到极致 24

2.2.1 利用累加柱形图对比数据结构的变化 25

2.2.2 多指标组合对比 27

2.2.3 用平均值优化单指标的对比 29

2.2.4 用瀑布图观察总量分解后的对比 32

2.2.5 如何正确对比数值指标与比率指标 33

2.3 用折线图观察时间序列数据 35

2.3.1 如何观察趋势 36

2.3.2 探寻趋势变化的原因 38

2.4 利用面积图观察数据结构的变化趋势 44

2.4.1 观察动态的数据结构变化:堆积面积图 44

2.4.2 用于队列分析:堆积面积图 45

2.5 用雷达图进行静态的多维对比 48

2.6 其他类型图表概述 50

2.6.1 使用饼图的6个“坑” 50

2.6.2 提升视觉冲击力:树状图 52

2.6.3 量化流程各环节间的转化率:漏斗图 52

第3章 数据图表进阶 54

3.1 数据图表到底是什么 55

3.2 如何正确地选择图表 59

3.3 数据图表中的细节 60

3.3.1 图表背景和绘图区背景 60

3.3.2 坐标轴 65

3.3.3 灵活使用辅助线 68

3.3.4 线性趋势线的应用 69

3.3.5 应用移动平均趋势线做时间序列的预测 72

3.3.6 添加信息增强线 74

3.3.7 用标注线指示必要的信息 75

3.4 能让图表升级的高级技巧 76

3.4.1 运用组合图表增加信息承载量 76

3.4.2 运用子母图增加图表中的信息量 79

3.4.3 条件格式中的几项实用功能 80

3.4.4 使用迷你图表压缩空间 85

3.4.5 用不等宽技术优化柱形图和条形图 86

3.4.6 使用Bullet图进行绩效评价的可视化 89

第4章 数据化运营的基础知识 93

4.1 最基本的数据获取能力 94

4.1.1 认知数据库的一般构造 94

4.1.2 能够阅读最基本的取数代码 95

4.1.3 用Excel获取数据 98

4.2 快速认知数据 105

4.2.1 仔细审核数据源的质量 106

4.2.2 提升数据集的质量 107

4.2.3 统一数据类型和单位 111

4.2.4 描述统计分析 111

4.2.5 利用相关系数理解数据之间的关系 122

4.2.6 通过多维交叉深入认知数据集 125

4.3 几套有用的分析思维框架 132

4.3.1 66 法则与SQVID 原则 133

4.3.2 麦肯锡的“七步成诗” 135

4.4 创造指标,应用指标 141

4.4.1 什么是指标 142

4.4.2 如何设计高质量的指标 143

4.4.3 指标组合:综合指数 143

4.4.4 需要关注哪些核心指标 144

4.5 运营活动的量化 148

4.5.1 优秀的运营活动应具备哪些要素 148

4.5.2 需要哪些过程型和结果型指标 149

4.5.3 如何评价运营活动 149

4.5.4 从纵向与横向两个角度全面对比 151

4.5.5 一种更严谨的测试效果量化方法:DID 154

4.5.6 相似活动间效果的对比 155

4.5.7 关于运营活动量化的小结 156

4.6 数据化运营的思维方式 156

4.7 运营数据报告的必备要素 167

4.8 小结 170

第5章 快速提升量化分析能力. 171

5.1 用朴素贝叶斯模型进行预测 171

5.1.1 利用全概率公式的一个例子 174

5.1.2 让大数定律给你自信 175

5.1.3 窥一斑而见全豹:中心极限定理 176

5.2 使用假设检验进行理性的推断 177

5.2.1 统计分布是一切推断的基础 179

5.2.2 以正态分布为例,阐述假设检验的过程 181

5.2.3 双侧检验与单侧检验 183

5.2.4 假设检验的细节补充 184

5.3 利用方差分析辨别方案的有效性 185

5.3.1 用户激活措施的有效性判断 186

5.3.2 运用置信区间增强数值估计的可靠性 189

5.3.3 两两比较寻找最精确的结论 190

5.3.4 理解方差分析的思维 191

5.4 浅谈回归技术的应用 191

5.4.1 因变量与自变量的相关关系是回归的基础 191

5.4.2 线性回归建模的详细过程 192

5.4.3 线性回归分析中的注意点 204

5.5 用时间序列分解模型观察波动 204

5.5.1 怎样观察时间序列数据 205

5.5.2 何为时间序列分解 206

5.5.3 时间序列分解的步骤解析 208

5.5.4 时间序列分解方法的应用局限性 212

5.6 如何优化调查问卷 213

5.6.1 态度型问题,增加选项以支撑量化分析 214

5.6.2 问题要有必要且贴合业务需求 215

5.6.3 设置过滤器,识别无效回答 215

5.6.4 避免双重问题和一重半问题 216

5.6.5 动态地调查,设置问题库以保障多次调查的质量 216

第6章 科学地决策 217

6.1 从数据中形成决策 217

6.2 线性规划是什么 219

6.3 线性规划建模的操作过程 220

6.3.1 建立逻辑清晰的表格 220

6.3.2 设置输出单元格、目标单元格与可变单元格之前的运算关系 221

6.3.3 设置线性规划建模参数 222

6.4 如何从数据中形成决策 223

6.5 4 类典型且实用的线性规划模型 223

6.5.1 资源分配模型 224

6.5.2 成本收益平衡模型 226

6.5.3 网络配送模型 227

6.5.4 混合模型 229

6.6 线性规划模型小结 231

第7章 应用优秀的工具 233

7.1 互联网数据分析工具的演进 234

7.1.1 流量时代 234

7.1.2 用户时代 235

7.1.3 订单时代 235

7.2 行为事件分析工具的简单介绍 236

7.3 数据分析平台简介及趋势 238

7.3.1 数据展现 238

7.3.2 数据处理 238

7.3.3 数据收集 239

7.4 值得推荐的小工具 240

7.4.1 团队协作工具 240

7.4.2 其他小工具 241

第8章 工作经验杂谈 242

8.1 这些年犯过的错误 242

8.1.1 迷信业务模型,浪费公司资源 243

8.1.2 活跃率陷阱 244

8.1.3 不加选择地进行数据追踪 245

8.1.4 为了KPI 而做数据分析 246

8.1.5 忽略数据质量的保障机制 247

8.1.6 轻视业务执行,重视数据表现 248

8.1.7 不重视数据认知,盲目建模 248

8.1.8 只重视完成任务,忽略了团队成员的个人发展需求 249

8.2 认清数据分析的边界 250

8.2.1 数据库并不能记录一切 250

8.2.2 不可能分离多重因素影响 251

8.2.3 数据不能替代逻辑推理 251

8.2.4 预测的根基未必牢固 251

8.2.5 大多数人会因数据而变懒 252

8.3 我们需要读些什么书 252


产品特色