书籍作者:周景阳 | ISBN:9787113300166 |
书籍语言:简体中文 | 连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 | 下载次数:3835 |
创建日期:2024-03-30 | 发布日期:2024-03-30 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
本书内容以技术知识与业务实战相结合,同时全书穿插多个实战项目,从而帮助读者更好地理解数据分析技术在业务上的应用。前半部分为技术章节,主要围绕 Python 语言的编程方法展开,其中包括数据录入、数据可视化、数值计算、办公自动化等内容 ;后半部分为业务章节,主要围绕不同业务场景的分析方法展开,其中包括广告投放、电商运营、用户画像、商品画像、商业分析等内容。
本书主要面向电商数据分析师和电商运营人员,也适合对技术感兴趣的产品经理。
周景阳
贪心科技联合创始人
曾就职于百度、国美等大型互联网公司及传统行业10余年工作经验,擅长数据分析、数据挖掘、大数据、软件研发、测试等多方向实战技术。
叶鹏飞
电子商务领域书籍销量TOP 10作者,代表作《亚马逊跨境电商数据化运营指南》个人IP“旭鹏”,在知乎、喜马拉雅、今日头条等内容平台拥有数据分析、电子商务关注者超过5万人先后于亚马逊、bilibili、腾讯担任数据与运营相关工作亚马逊中国官方跨境电商广告业务讲师、腾讯课堂“数据分析师”专业课程业务模块主讲人。
献给陪伴我的朋友、家人,以及我所热爱的事业
随着互联网行业的发展,被称为新时代能源的数据显得愈发重要,无论是千人千面的淘宝,还是个性化推荐的抖音,都验证了同一个事实:依托以算法为代表的前沿技术, 数据可以挖掘出巨大的商业价值与潜力。与此同时,如今互联网行业已经进入了“产业互联网”的下半场,各个领域都在进行数字化的转型和升级,而数据分析能力的强弱则决定了产业互联网数字化水平的高低。因此,希望通过本书的内容,给相关行业的从业者提供一些数据分析的思维和执行方法,从而帮助更多的人在行业转型的大背景下获得先机。
我从2017 年进入国内的跨境电子商务行业发展,如今在帮助服饰行业的中小企业做数字化转型,这五年间经历了跨境电商的热潮,也看到了“产业数字化”带来的机会, 但更多时候我面对的则是,众多企业经营者在处理茫茫数据中的不知所措和无奈。例如, 许多跨境电商创业者在面对海外数据时,不知道如何搭建用户画像体系来提升运营效率, 而国内中小门店经营者想要做数字化转型时,面对“将现有线下顾客资源转换成线上数据资产”的问题时也是一头雾水。针对这些问题,我认为,仅仅只是从技术角度进行指导是不够的,还需要结合具体的场景,梳理出其背后的业务逻辑,再针对有价值的环节进行分析。基于上述判断,我作为业务内容编写与技术专家周景阳(贪心科技联合创始人兼副总裁)一同创作了本书,旨在连接业务与技术,从而更高效地解决数据分析从业者遇到的问题。
不同于市面上已经存在的大部分数据分析书籍,本书内容的亮点在于“技术+ 业务” 的结合,同时全书会穿插多个实战项目,从而帮助读者更好地理解数据分析技术在业务上的应用。本书的前半部分为技术章节,主要围绕Python 语言的编程方法展开。其中包括数据录入、数据可视化、数值计算、办公自动化等;后半部分为业务章节,主要围绕
I
不同业务场景的分析方法进行展开。其中包括广告投放、电商运营、用户画像、商品画像、商业分析等。在业务部分,为了兼顾不同技术能力的读者,我会同时结合Excel 与
Python 来做讲解,确保部分技术能力较弱的读者也可以使用基本的办公软件处理数据、分析问题。
在创作形式上,本书会结合视频、代码、文本等多种样式对内容进行呈现。例如, 在具体项目讲解中,读者可以下载具体的项目文档(包括数据包与执行代码),再结合书中的内容一步一步进行操作,在涉及复杂性操作时,也录制了相关视频供读者参考。读者可以通过链接下载本书附带的数据资源(http://www.m.crphdm.com/2023/0426/14590.shtml)。
自从2019 年5 月我出版了第一本电商运营书后,很多读者问后续能不能针对更多的互联网场景写一本数据分析的实战教程,如今这本书的出版希望能达到众多读者的期望。在这里,首先要感谢读者,感谢大家对于我内容的包容与肯定。也非常感谢中国铁道出版社有限公司编辑的支持,以及本书另一名作者周景阳老师在创作上的合作,还要感谢日本筑波大学的教授TURNBULL Stephen John 以及其产业技术综合研究所HARC 研究员周宇轩,在我学习Python 时给予的帮助。与此同时,还感谢张银露在本书创作过程中给予的支持,感谢好友陈昭瑾、李易燊、谷天一、郭苗苗、陈文君、何嘉俊、郭晓龙在我生活或工作中陷入困顿时给予的鼓励,感谢行业前辈苏畅、蒋雪琦、郑颖、庄莹、郑国弘、金剑、赵梦圆、茹璇、滕雨玫、李瑾瑾在个人事业与感情发展上的建议,感谢陈琛在个人成长道路上给予的陪伴,感谢伙伴廖可若、徐启涵、袁子馨在行业探索时一同经历的时光,祝福各位能在未来的发展中实现自己的理想与幸福。在腾讯微信工作的这一年让我意识到了什么才是真正优秀的互联网人,同时让我看到了在产业互联网的大潮下有无数行业的数字化机会等着从业者们去探索和挖掘。作为产业互联网大海下的渺小个体,我也将开始新的航程,让我们在未来的数字化彼岸再见!
最后,我觉得还应该感谢这五年来坚持本心的自己,从杭州到上海再到广州,中间经历过很多让人失望的时刻,也遇到过困顿和迷茫,感谢自己有一颗积极向上的心,也很庆幸自己依旧在做着喜欢的事,做着自己认可的事。
亲爱的读者,希望你能在阅读本书后有所收获,也祝福你能找到自己热爱的事业并坚持下去;愿你出走半生,归来仍是少年。
叶鹏飞
2022 年7 月18 日于广州T I T 创意园
文件处理
1.1 基本环境介绍 /1
1.2 Pandas 文件的读取 /1
1.3 初识 DataFrame 数据类型 /3
1.4 DataFrame 数据类型的访问 /5
1.4.1 如何使用 head() 方法查看数据 /5
1.4.2 如何查看数据类型 /6
1.4.3 如何同时访问多列数据 /7
1.4.4 如何进行数据类型的筛选 /7
1.5 区域访问的方法 /8
1.6 DataFrame 数据类型的新增、删除 /11
1.6.1 DataFrame 数据类型的新增操作方法 /11
1.6.2 DataFrame 数据类型的删除操作方法 /13
1.7 探索性分析项目实战 /15
企业数据分析与挖掘项目标准化流程
2.1 基本流程介绍 /22
2.2 如何进行目标定义 /23
2.2.1 在线产品 /23
2.2.2 线下服务业 /23
2.2.3 内部分析目标 /24
2.3 数据的来源与获取 /25
2.4 数据抽样的常用方法 /25
2.5 数据探索的目标与任务 /26
I
2.6 数据预处理 /28
2.7 数据建模与评价 /29
使用 Python 进行科学运算
3.1 Pandas 计算利器 Series /30
3.1.1 DataFrame 与 Series 的关系 /30
3.1.2 声明一个 Series 类型 /31
3.1.3 Series 判断缺失值 /32
3.1.4 Series 的运算 /33
3.2 一个必不可少的运算库 NumPy /34
3.3 类型推断 /35
3.4 NumPy 的矢量化操作 /36
3.5 NumPy 的切片 /37
3.6 花式索引 Fancy Indexing /39
3.7 降维运算 /41
3.8 堆叠运算 /42
3.9 广播运算 /44
Matplotlib 数据可视化
4.1 销售额走势的折线图 /48
4.1.1 环境安装及引入 /48
4.1.2 Excel 中整数日期的处理 /49
4.1.3 绘制简单折线图 /50
4.1.4 解决 x 轴刻度重叠问题 /51
4.1.5 调整画布大小问题 /52
4.1.6 多项数据对比绘制折线图 /52
4.2 长尾分布的柱状图 /55
4.2.1 简单柱状图 /55
4.2.2 边框颜色与隐藏问题 /56
4.2.3 刻度显示问题 /57
II
4.3 躺着的柱状图就是条形图 /58
4.4 说明占比的饼图 /60
4.4.1 基本饼图 /60
4.4.2 饼图的数据计算 /60
4.4.3 丰富饼图属性 /61
4.5 观察分布的散点图 /63
4.5.1 普通散点图 /63
4.5.2 由散点图到气泡图的演变 /63
4.5.3 自开发 RGB 颜色生成器 /64
全面了解 MySQL
5.1 掌握数据库的结构 /66
5.1.1 实例与库 /66
5.1.2 表与字段的创建 /70
5.2 SQL 的数据操作 /72
5.2.1 数据写入 /72
5.2.2 数据更新 /73
5.2.3 数据的物理删除与逻辑删除 /74
5.3 使用 Python 操作 MySQL /75
5.3.1 表结构的创建 /75
5.3.2 外部数据导入 /76
使用 Python 进行 SQL 的查询与计算
6.1 有条件限制的查询语句 /78
6.1.1 基本查询语句 /78
6.1.2 单一条件限制的查询语句 /79
6.1.3 模糊的条件限制 /81
6.1.4 多条件限制的查询语句 /82
6.1.5 关于空值的判断 /83
6.1.6 返回部分结果的控制 /84
III
6.2 多个表查询结果展示在一起的联合查询 /85
6.3 统计结果中的分组方法与筛选技巧 /86
6.3.1 掌握结果分组 /86
6.3.2 过滤筛选分组后的结果 /87
6.3.3 排序中的大小顺序 /89
6.4 多表之间的子查询 /90
6.4.1 两表之间的子查询 /90
6.4.2 三表之间的子查询 /91
6.5 多表之间的关联查询 /92
6.5.1 先给数据起个别名 /92
6.5.2 两表之间的左关联 /93
6.5.3 两表之间的右关联 /94
6.5.4 两表之间的全关联 /95
6.6 使用 Python 进行 SQL 数据查询 /95
6.6.1 一般的查询方法 /95
6.6.2 使用 Pandas 的查询方法 /96
基于用户行为的用户价值分析
7.1 项目数据介绍 /98
7.1.1 项目介绍及脱敏 /98
7.1.2 数据介绍 /98
7.2 项目开始前的数据预处理 /100
7.2.1 数据获取 /100
7.2.2 数据预处理 /101
7.3 指标分析与价值分析 /102
7.3.1 流量指标分析 /102
7.3.2 转化指标分析 /104
7.3.3 基于 RFM 模型的用户价值分析 /104
IV
数据分析的具体介绍
8.1 数据与信息的关系 /107
8.2 数据能做什么——以微信私域流量数字化经营为例 /108
8.3
数据分析基本概念及数学基础
9.1 数据分析的基本思路 /119
9.2 描述性分析 /120
9.2.1 数值分析 /120
9.2.2 分布分析 /121
9.2.3 可视化分析 /124
9.3 诊断性分析 /129
9.3.1 关联分析 /129
9.3.2 波动分析(以周权重指数为例) /130
9.4 预测性分析 /131
9.4.1 线性回归 /131
9.4.2 非线性回归 /133
9.5 仿真模拟 /136
9.5.1 仿真模拟的理论应用 /136
9.5.2 仿真模拟的业务应用 /137
V
数据分析思维在业务中的应用——以 B 站广告增长投放为例
10.1 B 站基本信息及广告形式 /144
10.1.1 B 站基本信息 /144
10.1.2 B 站的广告形式 /145
10.2 影响 CPC 广告投放效果的要素 /147
10.2.1 广告投放营销漏斗转化模型 /147
10.2.2 CPC 广告展示量(曝光量)涉及要素 /148
10.2.3 CPC 广告点击量涉及要素 /153
10.2.4 CPC 广告访问量涉及要素 /157
10.2.5 CPC 广告成交量(转化量)涉及要素 /157
10.3 B 站内 CPC 广告业务场景与优化 /159
10.4 B 站内 CPC 广告业务优化思路与数据分析 /160
10.4.1 针对广告投放 ROI 偏低问题的数据汇总 /160
10.4.2 针对广告投放 ROI 偏低问题的优化思路 /161
10.4.3 针对广告曝光点击率偏低问题的业务背景 /164
10.4.4 针对广告曝光点击率偏低问题的优化思路 /165
10.5 B 站内 CPC 广告优化在复杂业务环境下考虑的要素 /168
数据分析在电商平台订单分析中的应用——以 B 站会员购电商平台为例
11.1 B 站会员购平台业务背景介绍 /172
11.2 B 站会员购平台相关数据介绍 /173
11.3 订单数据的数据分析基本思路 /175
11.4 B 站会员购时间相关订单数据的分析思路及业务应用 /178
11.4.1 订单时间分布分析 /178
11.4.2 订单价格分布分析 /179
11.4.3 订单时间分布与价格分布的交叉分析 /180
11.4.4 不同时间相关订单数据的分析汇总 /180
VI
11.5 B 站会员购商品相关订单数据的分析思路及业务应用 /181
11.5.1 商品客单价分布分析 /181
11.5.2 商品销量分布分析 /182
11.5.3 商品销量波动趋势分析 /183
11.5.4 商品地区客单价分析 /185
11.6 B 站会员购多日订单数据的汇总 /186
11.7 B 站会员购订单数据针对地区品牌渗透度基本判别的分析 /186
数据分析在商业分析中的应用——以商品多渠道管理为例
12.1 什么是商业分析 /190
12.2 商业分析和数据分析的区别是什么 /190
12.3 多渠道商业分析项目背景介绍 /193
12.4 相关数据介绍 /196
12.5 多渠道商业分析的数据处理 /198
12.5.1 多渠道商业分析的数据背景及分析价值 /198
12.5.2 多渠道商业分析的操作步骤 /200
12.5.3 多渠道商业分析的数据分析思路及操作 /200
12.6 不同渠道对销量影响程度的判断 /209
12.7 多渠道商业分析在销售管理上的应用 /211
数据分析在市场调研的应用——商品画像分析
13.1 什么是商品画像体系 /212
13.2 商品画像体系的数据来源 /212
13.2.1 平台数据来源 /212
13.2.2 第三方数据来源 /220
13.3 商品画像数据的抓取方法 /223
13.3.1 人工采集 /223
13.3.2 第三方爬虫工具采集 /223
13.3.3 自有编程爬虫脚本采集 /224
VII
13.4 商品画像体系的应用 /225
13.4.1 数据维度说明 /225
13.4.2 数据清洗及有效数据筛选 /228
13.4.3 商品曝光价格分布分析 /229
13.4.4 商品曝光价格趋势分析 /230
13.4.5 商品评分及数量分布分析 /231
13.4.6 商品评分趋势分析 /235
13.4.7 商品排名分布趋势分析 /236
13.4.8 商品标题词频分析 /237
13.4.9 商品评价词频分析 /244