猜你喜欢
零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析

零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析

书籍作者:李仁钟 ISBN:9787302510802
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:4906
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

本书共分14章,内容主要有R语言简介、数据读取与写入的方法,条件判断、循环等流程控制以及自定义函数,高级绘图、低级绘图、交互式绘图的说明,决策树、支持向量机、人工神经网络的介绍,基本统计、机器学习、数据挖掘、文本挖掘、大数据分析的应用,层次聚类法、K平均聚类算法、模糊C平均聚类算法、聚类指标、基因算法及人工蜂群算法的应用。

本书适合没有程序设计经验、想要接触R语言的人以及对统计、机器学习、数据挖掘、文本挖掘、大数据分析有兴趣的人阅读。


编辑推荐

R语言与生俱来就拥有数据统计和分析的DNA,而且R语言本身并不是独立存在的程序设计语言。更准确地说,R语言以集成在一个R系统或环境中的方式呈现在我们面前,这个R系统集数据计算、数据处理、统计分析和图形绘制等软件包于一体,是一个完整的数据科学工具软件。

如今,以互联网大数据分析为基础的人工智能,如机器学习、商业智能、数据挖掘、文本挖掘、数据可视化等领域都渴求强大、高效的数据科学工具,这种渴求让R大放异彩。R 系统本身就是一个开放的系统,除了传统的数据统计分析/绘图等软件包,现在更增加了机器学习、数据和文本挖掘、大数据分析等相关的诸多程序包,让R语言在这些领域成为“光彩夺目”的明星。

如果你对上述热门的领域之一感兴趣,并且想将R引入你的工作或研究中,那么本书就是一本快速参考指南。本书也可以作为完全不懂 R 软件及数据分析的读者自学R语言的本读物。


前言
前 言
  随着 R 软件的流行及普及化,许多学者和专家转而使用 R 作为研究与开发的工具。R软件有 Windows、UNIX、Linux及Apple MacOS等不同操作系统的免费版本,更有一万种以上免费程序包可供使用,所以学习R软件是睿智的选择。
  本书内容共有14章,前4章先介绍 R 软件的基本操作和应用,第5章对本书所使用的程序包做完整的介绍,包含 R 软件在机器学习(Machine Learning)、数据挖掘(Data Mining)、文本挖掘(Text Mining)及大数据(Big Data)分析的相关程序包,第6~9章介绍各类学习算法,第10~12章介绍关联规则、网络社群分析及文本挖掘、图形化数据分析工具,最后两章介绍 Hadoop 和 Spark 大数据分析。
  本书是作者多年来从事教学的心血结晶,适合作为大专院校信息类相关科系的教材,同时书中范例的程序代码丰富,也可作为练习的补充教材。本书的撰写以完全不懂R软件及数据分析的读者为对象,对于有意愿自学的读者而言,本书也是一本不错的入门参考书。
  本书配套范例程序可从下面的网址(注意区分数字和字母大小写)下载或扫描右边的二维码获取:
  https://pan.baidu.com/s/17b-xnYfhICguW4wSz8pWXA
  如果下载有问题,请联系[email protected],邮件主题为“零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析”。
  本书的撰写虽已力求完美,但难免会有疏漏之处,欢迎各位读者指教。
  李仁钟、李秋缘
  2018年6月
目录
第1章 R简介 1

1.1 开始使用R软件 1

1.2 R对象 4

1.2.1 向量 4

1.2.2 数组 5

1.2.3 矩阵 7

1.2.4 数据框 9

1.2.5 因子 11

1.2.6 列表 11

1.2.7 对象转换 12

第2章 数据的读取与写入 14

2.1 数据的读取 14

2.2 数据的写入与数据集 17

2.3 RData 格式数据的写入与读取 18

2.4 读取 SQL Server 数据库的数据 19

第3章 流程控制及自定义函数 20

3.1 条件执行 20

3.2 循环控制 22

3.3 自定义函数 25

第4章 绘图功能及基本统计 27

4.1 高级绘图 27

4.2 低级绘图 30

4.3 交互式绘图 31

4.4 图形参数 32

4.5 基本统计 34

第5章 相关程序包的介绍 39

5.1 机器学习 39

5.2 数据挖掘 40

5.3 社交网络分析及文本挖掘 40

5.4 大数据分析 41

5.5 程序包的介绍 41

第6章 监督式学习 51

6.1 决策树 51

6.2 支持向量机 61

6.3 人工神经网络 65

6.4 组合方法 70

6.4.1 随机森林 70

6.4.2 推进法 71

第7章 无监督式学习 72

7.1 层次聚类法 72

7.2 K 平均聚类算法 75

7.3 模糊C平均聚类算法 77

7.4 聚类指标 83

第8章 进化式学习 86

8.1 基因算法 86

8.2 人工蜂群算法 92


第9章 混合式学习 95

9.1 使用 C50 和 ABCoptim 程序包范例 95

9.2 使用基因算法来调整人工神经网络参数的范例 97

第10章 关联规则 107

10.1 关联规则简介 107

10.2 Apriori 算法 108

第11章 社交网络分析和文本挖掘 117

11.1 社交网络分析 117

11.2 文本挖掘 122

第12章 图形化数据分析工具 125

12.1 导入数据 126

12.1.1 处理数据集 130

12.1.2 设置变量 131

12.2 探索和测试数据 131

12.3 转换数据 135

12.4 建立、评估和导出模型 137

第13章 大数据分析 (R+Hadoop) 141

13.1 Hadoop 简介 141

13.2 R+Hadoop 142

第14章 SparkR 大数据分析 170

14.1 dplyr 数据处理程序包 172

14.2 SparkR 数据处理 175

14.3 SparkR 与 SQL Server 181

14.4 SparkR 与 Cassandra 184

14.5 Spark Standalone 模式 186

14.6 SparkR 数据分析 189

附录A 下载和安装 R 197

附录B 安装RStudio Desktop 203

附录C 安装ODBC 209

附录D 指令及用法 214

附录E 在虚拟机上安装 R+Hadoop 218

附录F 在虚拟机上安装 SparkR 247

参考文献 272


短评

正版书,到货速度快,正视自己所需要的

2018-10-17 06:46:00

产品特色