Python数据科学入门
书籍作者:德米特里·齐诺维耶夫 |
ISBN:9787115470607 |
书籍语言:简体中文 |
连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 |
下载次数:4183 |
创建日期:2021-02-14 |
发布日期:2021-02-14 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
内容简介
《Python数据科学入门》以Python 语言讲解数据科学基础知识,涵盖了数据采集、清洗、存储、检索、转换、可视化、高级数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python 核心特性,文本数据、数据库、表格形式的数值数据、series 和frame、网络数据的使用,数据的绘制,概率与统计,机器学习。
《Python数据科学入门》面向研究生和本科生、数据科学教员、刚入门的数据科学专业人员,以及那些想拥有一本参考手册来帮助记住所有Python 函数及参数的开发人员。
作者简介
Dmitry Zinoviev
计算机科学教授,自2001年起一直在萨福克大学任教。研究兴趣包括计算机模拟与建模、网络科学、社交网络分析以及数字人文。拥有莫斯科国立大学物理学硕士学位和纽约州立大学石溪分校计算机科学博士学位。
编辑推荐
不同类型文本数据的获取、清洗、组织和可视化
如何用NumPy和Pandas模块处理数值数据
探索用MySQL和MongoDB配置、填充、查询数据
网络创建、度量和分析
概率与统计以及机器学习的相关基本概念
目录
第1 章 什么是数据科学 1
第1 单元 数据分析步骤 2
第2 单元 数据获取途径 3
第3 单元 报告的结构 4
轮到你了 5
第2 章 数据科学的Python 核心 6
第4 单元 理解基本的字符串函数 6
第5 单元 选择合适的数据结构 8
第6 单元 通过列表推导式理解列表 9
第7 单元 使用计数器 10
第8 单元 使用文件 11
第9 单元 上网 12
第10 单元 使用正则表达式实现模式匹配 13
第11 单元 globbing 文件名与其他字符串 17
第12 单元 Pickling 和Unpickling 数据 18
轮到你了 18
第3 章 使用文本数据 20
第13 单元 处理HTML 文件 20
第14 单元 处理CSV 文件 24
第15 单元 读取JSON 文件 25
第16 单元 处理自然语言中的文本 27
轮到你了 31
第4 章 使用数据库 33
第17 单元 设置MySQL 数据库 33
第18 单元 使用MySQL 数据库:命令行 36
第19 单元 使用MySQL 数据库:pymysql 39
第20 单元 改善文档存储:MongoDB 41
轮到你了 44
第5 章 使用表格形式的数值数据 45
第21 单元 创建数组 46
第22 单元 转置和重排 48
第23 单元 索引和切片 49
第24 单元 广播 51
第25 单元 揭秘通用函数 52
第26 单元 理解条件函数 54
第27 单元 数组的聚合与排序 54
第28 单元 将数组用作集合 56
第29 单元 数组的保存和读取 57
第30 单元 生成合成正弦波 57
轮到你了 59
第6 章 使用series 和frame 61
第31 单元 pandas 数据结构 62
第32 单元 数据重塑 67
第33 单元 处理缺失数据 72
第34 单元 组合数据 75
第35 单元 数据的排序和描述 78
第36 单元 数据转换 82
第37 单元 掌握pandas 的文件读写功能 87
轮到你了 90
第7 章 使用网络数据 91
第38 单元 概念剖析 91
第39 单元 网络分析序列 94
第40 单元 使用networkx 95
轮到你了 101
第8 章 绘图 103
第41 单元 使用PyPlot 进行基本绘图 104
第42 单元 了解其他绘图类型 106
第43 单元 精通绘图装饰 107
第44 单元 用pandas 绘图 109
轮到你了 111
第9 章 概率与统计 113
第45 单元 回顾概率分布 113
第46 单元 回顾统计度量 115
第47 单元 以Python 的方式完成统计 117
轮到你了 120
第10 章 机器学习 122
第48 单元 设计预测实验 122
第49 单元 线性回归拟合 124
第50 单元 用k 均值聚类实现数据分组 129
第51 单元 在随机决策森林中生存 131
轮到你了 133
附录1 扩展阅读 135
附录2 单星项目的解决方案 137
参考文献 146