猜你喜欢
谁说菜鸟不会数据分析(Python篇)

谁说菜鸟不会数据分析(Python篇)

书籍作者:方小敏 ISBN:9787121364587
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:6054
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

  《谁说菜鸟不会数据分析(Python篇)》从解决工作实际问题出发,提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习理解的前提下,尽可能地避免使用晦涩难懂的Python 编程、统计术语或模型公式。

  《谁说菜鸟不会数据分析(Python篇)》定位是带领Python 数据分析初学者入门,并能解决学习、工作中大部分的问题或需求。入门后如还需要进一步进阶学习,可自行扩展阅读相关书籍或资料,学习是永无止境的,正所谓“师傅领进门,修行在个人”。


作者简介

  方小敏,“数据分析实战”公众号主理人,资深机器学习工程师;曾服务于BAT等知名互联网企业,熟练掌握Python、R、Spark、Hive、TensorFlow等工具进行机器学习。

  张文霖,新浪博客“小蚊子数据分析”博主,资深数据分析师,曾服务于国内知名市场研究公司、中国移动等公司,具有多年移动互联网数据分析经验,略懂Excel、PPT、SPSS、水晶易表等工具。


编辑推荐
适读人群 :市场营销、金融、财务、人力资源管理、产品经理;咨询、研究、分析、各级管理人士,甚至可以涵盖所有职场人员。

  《谁说菜鸟不会数据分析》系列自面世以来赢得众多有分量的行业奖项,影响几十万读者

  Python篇系“小蚊子数据分析”团队精心打磨的又一力作

  沈浩教授、《数据化管理》作者黄成明、《统计之美》作者李舰博士、张文彤博士、“路人甲TM”等专家力荐


  适合人群

  ★ 需要提升自身竞争力的职场新人。

  ★ 从事咨询、研究、分析等专业人士。

  ★ 在市场营销、产品运营、项目管理、开发运维等工作中需要进行数据分析的人士。


前言

  《谁说菜鸟不会数据分析》系列图书自上市以来,已拥有数十万读者与粉丝,口口相传,成为职场人士案头必备的参考用书。同时非常荣幸地获得书刊发行业协会授予的“全行业优秀畅销品种”称号,这离不开广大读者的厚爱与支持。有读者告诉我们,每次阅读都会有新的体会与收获,这让我们很开心。

  随着云计算、互联网、电子商务和物联网的飞速发展,世界已经逐步迈入大数据时代。数据分析、机器学习等数据科学技术也相应流行起来,主流的数据科学技术,都将Python 作为主要的计算工具。Python 越来越被大家熟悉和认可,成为数据分析师的新宠儿,特别是在互联网行业。

  市面上Python 数据分析的相关书籍基本上多数由IT 人员编写,写作角度相对侧重技术层面,很多基础知识点和编写的代码并无详细介绍,并且在数据分析思维体系方面相对薄弱,学习门槛非常高,让非IT 专业朋友学起来较为痛苦。

  鉴于此,本书作者于2015 年开始提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧,并录制成了视频课程《Python 数据分析实战》,发布于网易云课堂。课程上线后,受到了大量学员的支持与肯定。同时,课程上线后,根据热心学员的宝贵反馈意见,对课程不断进行升级更新。

  通过《Python 数据分析实战》视频课程的录制、升级过程中,沉淀了大量的Python 数据分析实战教学经验。同时大量的学员与读者不断来信咨询希望早日出版《谁说菜鸟不会数据分析(Python篇)》。经过两年时间的打磨,这本书终于与读者见面了。

  整个写作过程是艰辛的,但是也很有成就感。

  本书从解决工作实际问题出发,提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧。本书与其他《谁说菜鸟不会数据分析》系列图书一样,力求通俗易懂地介绍相关知识,在不影响学习理解的前提下,尽可能地避免使用晦涩难懂的Python 编程、统计术语或模型公式,如需了解相关的知识,可查阅相关的书籍或资料。

  本书的定位是带领Python数据分析初学者入门,并能解决学习、工作中大部分的问题或需求。入门后如还需进一步进阶学习,可自行扩展阅读相关书籍或资料,学习是永无止境的,正所谓“师傅领进门,修行在个人”。

  本书结构

  本书以数据分析主要流程为主线,介绍如何用Python 进行数据分析。

  第1 章 数据分析概况:主要通过3W 模型介绍数据分析相关知识,让读者了解与认识数据分析。

  第2 章 Python 概况: 主要介绍了什么是Python,Python 的特点,Python 的函数与模块,Python 的使用场景,以及Anaconda 的安装与使用,让读者了解与认识Python。

  第3 章 编程基础:主要介绍了Python 进行数据分析所需要的编程基础,包括数据类型、赋值和变量、数据结构、向量化运算、for 循环,让读者对Python 在数据分析方面的使用有基本的了解与认识。

  第4 章 数据处理:主要介绍了在Python 中如何使用Pandas 进行数据处理操作,包括数据导入与导出、数据清洗、数据转换、数据抽取、数据合并、数据计算,让读者能够使用Python 进行常用的数据处理操作。

  第5 章 数据分析:主要介绍了在Python 中如何使用Pandas、sklearn 进行相关的数据分析操作,包括描述统计分析、分组分析、结构分析、分布分析、交叉分析、RFM 分析、矩阵分析、相关分析、回归分析等常用分析方法,让读者能够使用Python进行常用的数据分析操作。

  第6 章 数据可视化:主要介绍了在Python 中如何使用matplotlib.pyplot 进行常用的数据可视化图形绘制,包括散点图、矩阵图、折线图、饼图、柱形图、条形图,让读者能够使用Python 进行常用的数据可视化图形绘制。

  本书主要基于Python 3 进行介绍,故部分方法可能在Python 2 中无法实现。


  案例数据下载

  本书配套案例数据下载方式:

  (1)扫码关注微信订阅号:小蚊子数据分析(wzdata),回复“1”或“Python篇”获取案例数据下载链接

  (2)http://blog.sina.com.cn/xiaowenzi22


  致谢

  感谢广大读者与学员的支持,让笔者下定决心写这本书。在此要衷心感谢成都道然科技有限责任公司的姚新军先生,感谢他的提议和在写作过程中的支持。感谢参与本书优化的朋友:王斌、李伟、范霈璐、李萍、王晓、景小艳、余松。非常感谢本书的插画师朴提的辛苦劳动,您的作品也让本书增色不少。感谢沈浩、张文彤、路人甲、黄成明、阿橙、许树淮、肖骁、严婷、刘志军、崔庆才、齐德胜、数据小人、郑来轶、李舰、gashero、肖凯、郑跃平等书评作者,感谢他们在百忙之中抽空阅读书稿,撰写书评,并提出宝贵意见。最后,要感谢两位作者的家人,感谢他们默默无闻的付出,没有他们的理解与支持,同样也没有本书。尽管我们对书稿进行了多次修改,仍然不可避免地会有疏漏和不足之处,敬请广大读者批评指正,我们会在适当的时间进行修订,以满足更多人的需要。

目录

第1 章 数据分析概况 /1

1.1 数据分析定义(What) /2

1.2 数据分析作用(Why) /4

1.3 数据分析步骤(How) /5

1.3.1 明确分析目的和思路 /6

1.3.2 数据收集 /7

1.3.3 数据处理 /9

1.3.4 数据分析 /9

1.3.5 数据展现 /10

1.3.6 报告撰写 /10

1.4 数据分析的三大误区 /12

1.5 常用的数据分析工具 /13

1.5.1 Excel /13

1.5.2 SPSS /14

1.5.3 R语言 /15

1.5.4 Python语言 /16


第2 章 Python 概况 /17

2.1 Python简介 /18

2.2 Python特点 /19

2.3 Python模块 /20

2.3.1 函数 /20

2.3.2 模块 /24

2.4 Python使用场景 /27

2.5 Python 2与Python 3 /28

2.6 Python与数据科学 /29

2.7 Anaconda简介 /30

2.8 安装Anaconda /31

2.8.1 下载Anaconda /31

2.8.2 安装Anaconda /33

2.9 使用Anaconda /37

2.9.1 PyCharm 与Spyder /37

2.9.2 Anaconda 开始菜单 /38

2.9.3 Spyder 工作界面简介 /39

2.9.4 项目管理 /40

2.9.5 代码提示 /43

2.9.6 变量浏览 /44

2.9.7 图形查看 /44

2.9.8 帮助文档 /45


第3 章 编程基础 /47

3.1 数据类型 /48

3.1.1 数值型 /48

3.1.2 字符型 /50

3.1.3 逻辑型 /56

3.2 赋值和变量 /57

3.2.1 赋值和变量 /57

3.2.2 变量命名规则 /58

3.3 数据结构 /59

3.3.1 列表 /59

3.3.2 字典 /63

3.3.3 序列 /66

3.3.4 数据框 /72

3.3.5 四种数据结构的区别 /80

3.4 向量化运算 /81

3.5 for 循环 /83

3.6 Python 编程注意事项 /87


第4 章 数据处理 /90

4.1 数据导入与导出 /91

4.1.1 数据导入 /91

4.1.2 数据导出 /99

4.2 数据清洗 /100

4.2.1 数据排序 /101

4.2.2 重复数据处理 /102

4.2.3 缺失数据处理 /106

4.2.4 空格数据处理 /109

4.3 数据转换 /110

4.3.1 数值转字符 /110

4.3.2 字符转数值 /112

4.3.3 字符转时间 /113

4.4 数据抽取 /115

4.4.1 字段拆分 /116

4.4.2 记录抽取 /121

4.4.3 随机抽样 /127

4.5 数据合并 /130

4.5.1 记录合并 /130

4.5.2 字段合并 /133

4.5.3 字段匹配 /135

4.6 数据计算 /140

4.6.1 简单计算 /140

4.6.2 时间计算 /141

4.6.3 数据标准化 /142

4.6.4 数据分组 /144


第5 章 数据分析 /148

5.1 对比分析 /149

5.2 基本统计分析 /152

5.3 分组分析 /155

5.4 结构分析 /158

5.5 分布分析 /159

5.6 交叉分析 /162

5.7 RFM 分析 /164

5.8 矩阵分析 /173

5.9 相关分析 /176

5.10 回归分析 /178

5.10.1 回归分析简介 /178

5.10.2 简单线性回归分析 /180

5.10.3 多重线性回归分析 /185


第6 章 数据可视化 /189

6.1 数据可视化简介 /190

6.1.1 什么是数据可视化 /190

6.1.2 数据可视化常用图表 /190

6.1.3 通过关系选择图表 /191

6.2 散点图 /192

6.3 矩阵图 /203

6.4 折线图 /210

6.5 饼图 /215

6.6 柱形图 /217

6.7 条形图 /222


产品特色