Anaconda数据科学实战
书籍作者:[美] 严玉星 |
ISBN:9787115534507 |
书籍语言:简体中文 |
连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 |
下载次数:8021 |
创建日期:2021-02-14 |
发布日期:2021-02-14 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
内容简介
Anaconda是一个强大的开源数据科学平台,它将很多好的工具整合在一起,极大地简化了使用者的工作流程,并能够帮助使用者解决一系列数据科学难题。
《Anaconda数据科学实战》旨在通过一系列示例,引导读者在编码和图表中了解Anaconda的强大之处。本书包括12章,结合R、Python、Octave和Julia等4种编程语言,从平台的安装和配置开始,循序渐进地引导读者掌握数据集的获取、数据可视化、统计建模、管理包、Anaconda的优化、无监督学习、监督学习、数据预测分析、云、分布式计算等内容。
本书示例丰富,讲解细致,作者不仅在金融领域有着深厚的积累,还有着丰富的教学经验。对于那些有兴趣了解金融领域数据科学的读者,以及普通的数据分析师或数据科学从业者,本书都是一个不错的选择。在阅读本书之前,我们希望读者具备R或Python的基本编程知识,以及线性代数相关的基本知识。
作者简介
严玉星博士毕业于麦吉尔大学,获得金融学博士学位。他曾在加拿大、新加坡和美国的8 所大学教授各种金融课程,发表23篇研究和教学相关的论文,并著有6本书。此外,他还精通R、Python、SAS、MATLAB、Octave 和C 语言,是金融数据分析方面的专家。
詹姆斯·严当前在多伦多大学攻读计算机科学和统计学双学位。他还精通Python、R、Java、MATLAB 和SQL等。
编辑推荐
1.金融大数据专家带你学习Python神器—Anaconda,了解Anaconda强大的包和各项功能;
2.借助开源免费的Python平台,丰富实用的案例,轻松驾驭金融大数据并解决常见的数据科学难题。
目录
第 1章 Anaconda生态系统 1
1.1 简介 1
1.1.1 通过Anaconda使用
Jupyter的理由 2
1.1.2 在无须预装的情况下
使用Jupyter 2
1.2 Miniconda 5
1.3 Anaconda云 5
1.4 查找帮助 6
1.5 总结 8
1.6 问题回顾及练习 9
第 2章 Anaconda安装 11
2.1 安装Anaconda 11
2.2 测试Python 13
2.3 使用IPython 14
2.4 通过Jupyter使用Python 16
2.5 Spyder简介 17
2.6 通过Conda安装R 19
2.7 安装Julia并链接到Jupyter 20
2.8 安装Octave并链接到Jupyter 21
2.9 查找帮助 23
2.10 总结 25
2.11 问题回顾及练习 25
第3章 数据基础 27
3.1 数据源 28
3.2 UCI机器学习 28
3.3 Python包pandas简介 31
3.4 输入数据的几种方式 32
3.4.1 使用R输入数据 33
3.4.2 使用Python输入数据 34
3.5 Quandl数据分发平台简介 36
3.6 处理缺失数据 39
3.7 数据排序 42
3.7.1 切割数据集 45
3.7.2 合并不同数据集 45
3.7.3 数据输出 48
3.8 Python包cbsodata简介 49
3.9 Python包datadotworld简介 50
3.10 R包haven和foreign简介 51
3.11 R包dslabs简介 52
3.12 生成Python数据集 53
3.13 生成R数据集 55
3.14 总结 56
3.15 问题回顾及练习 56
第4章 数据可视化 59
4.1 数据可视化的重要性 59
4.2 R数据可视化 60
4.3 Python数据可视化 66
4.4 Julia数据可视化 69
4.5 绘制简单图形 71
4.5.1 各种条状图、饼图和
直方图 74
4.5.2 添加趋势 75
4.5.3 添加图解和其他说明 76
4.6 R可视化包 79
4.7 Python可视化包 81
4.8 Julia可视化包 82
4.9 动态可视化 83
4.9.1 将图片存储为pdf 86
4.9.2 将动态可视化存储
为HTML文件 86
4.10 总结 87
4.11 问题回顾及练习 87
第5章 在Anaconda中统计建模 90
5.1 线性模型简介 91
5.2 在R、Python、Julia和Octave
中运行线性回归 92
5.3 临界值和决策规则 96
5.4 F检验、临界值和决策规则 97
5.5 处理缺失数据 104
5.5.1 清除缺失数据 104
5.5.2 用其他值替换缺失
数据 105
5.6 检测及处理异常值 106
5.7 几个多元线性模型 108
5.8 共线性及其解决方案 111
5.9 一个模型的性能测量 113
5.10 总结 113
5.11 问题回顾及练习 113
第6章 管理包 117
6.1 包、模块和工具箱简介 118
6.2 使用包的两个示例 118
6.3 查找所有R包 123
6.4 查找所有Python包 124
6.5 查找所有Julia包 125
6.6 查找所有Octave包 126
6.7 R中的任务视图 126
6.8 查找手册 128
6.9 包依赖 129
6.10 R包管理 130
6.11 Python包管理 132
6.12 Julia包管理 133
6.13 Octave包管理 134
6.14 包管理器conda 135
6.15 在R和Python中创建
程序集 137
6.16 查找环境变量 138
6.17 总结 140
6.18 问题回顾及练习 140
第7章 Anaconda的优化 142
7.1 为何优化很重要 142
7.2 优化的一般问题 144
7.3 二次优化 148
7.3.1 R中的优化 149
7.3.2 Python中的优化 151
7.3.3 Julia中的优化 153
7.3.4 Octave中的优化 156
7.4 股票投资组合优化 159
7.5 最优的税收政策 161
7.6 R中用于优化的包 162
7.7 Python中用于优化的包 164
7.8 Octave中用于优化的包 165
7.9 Julia中用于优化的包 165
7.10 总结 166
7.11 问题回顾及练习 166
第8章 Anaconda中的无监督学习 168
8.1 无监督学习简介 169
8.2 层次聚类 173
8.3 k-均值聚类 177
8.4 Python包scipy简介 179
8.5 Python包contrastive简介 181
8.6 Python包sklearn(scikit-learn)
简介 181
8.7 R包rattle简介 185
8.8 R包randomUniformForest
简介 187
8.9 R包Rmixmod简介 189
8.10 Julia实现 190
8.11 聚类分析的任务视图 191
8.12 总结 192
8.13 问题回顾及练习 192
第9章 Anaconda中的监督学习 194
9.1 监督学习概览 194
9.2 分类 199
9.2.1 k-最近邻算法 200
9.2.2 贝叶斯分类器 202
9.2.3 强化学习 204
9.3 监督学习的R实现 205
9.4 Python实现 209
9.5 Octave实现 213
9.6 Julia实现 217
9.7 总结 219
9.8 问题回顾及练习 220
第 10章 数据预测分析:建模和验证 223
10.1 理解数据预测分析 223
10.2 有用的数据集 224
10.2.1 R包AppliedPredictive
Modeling 226
10.2.2 时间序列分析 228
10.3 预测未来事件 229
10.3.1 季节性 232
10.3.2 可视化组件 233
10.3.3 R包LiblineaR 234
10.3.4 R包datarobot 236
10.3.5 R包eclust 236
10.4 模型选择 238
10.4.1 Python包model-
catwalk 240
10.4.2 Python包sklearn 240
10.4.3 Julia包QuantEcon 242
10.4.4 Octave包ltfat 243
10.5 Granger因果关系检验 245
10.6 总结 247
10.7 问题回顾及练习 247
第 11章 Anaconda云 250
11.1 Anaconda云简介 250
11.2 深入学习Jupyter Notebook 251
11.2.1 Jupyter Notebook
格式 254
11.2.2 Notebooks分享 256
11.2.3 项目分享 258
11.2.4 环境分享 260
11.3 复制他人的环境到本地 261
11.4 总结 265
11.5 问题回顾及练习 265
第 12章 分布式计算、并行计算和
HPCC 267
12.1 分布式和并行计算简介 267
12.1.1 并行处理的任务视图 268
12.1.2 Python示例程序 269
12.2 理解MPI 270
12.2.1 R包Rmpi 270
12.2.2 R包plyr 271
12.2.3 R包parallel 272
12.2.4 R包snow 276
12.3 Python并行处理 276
12.3.1 单词频率的并行
处理 278
12.3.2 Monte-Carlo期权定价
并行处理 278
12.4 计算节点 280
12.5 Anaconda附加组件 280
12.6 HPCC简介 281
12.7 总结 283
12.8 问题回顾及练习 283
短评
书的质量挺不错的,每次买书都是在这买,多学习很好,希望以后有更多优惠。
2020-05-26 23:09:53
不错,,,,,,,,,,,,,,,,,,,,,
2020-05-20 13:49:51