猜你喜欢
R速成:统计分析和科研数据分析快速上手

R速成:统计分析和科研数据分析快速上手

书籍作者:Mehmet Mehmetoglu ISBN:9787121451881
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:8377
创建日期:2024-03-21 发布日期:2024-03-21
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

本书的特色在于结合实际案例来展现 R 在数据科学领域的灵活性,不仅能让读者学习统计 知识,也能提升代码编写能力。全书共 15 章,第 1 章详细介绍了 R 和 RStudio 的安装方法;第 2 章至第 3 章介绍了导入数据的方法,以及 R 的基本工作原理;第 4 章介绍了 R 中重要的数据 管理方法;第 5 章讲解数据可视化的知识;第 6 章至第 15 章介绍了统计知识点,如描述性统计、 简单线性回归、多元线性回归、虚拟变量回归等。

为方便读者学习,本书提供了 astatur 包,这个工具包涵盖了本书中使用的所有数据集,以 及相关章节中提到的一些补充函数。此外,本书没有过多地介绍复杂的数学公式,对于必备知 识点使用了尽可能通俗的语言进行讲解,因此本书适合作为 R 统计分析课程的教科书,也适合 数据分析的初学者参考学习。


作者简介

迈赫迈特·迈赫梅托格鲁(Mehmet Mehmetoglu)是挪威科技大学心理学系的研 究方法教授。他的研究方向包括消费者心理学,进化心理学和统计方法。他在大约 35 种不同的国际期刊上发表过相关论文,其中包括 Personality and Individual Differences、 Evolutionary Psychology 和 Journal of Statistical Software。

马蒂亚斯·米特纳(Matthias Mittner)是挪威北极大学认知神经科学教授和认知 神经科学研究小组组长。他的研究方向包括神经科学、认知心理学和统计方法。他是 几个神经科学领域 R 包和 Python 软件包的作者。


编辑推荐

专门为研究人员和R入门学习者写的书

希望帮助他们发现R的丰富功能

附赠所有案例的数据集文件


前言

译者序

R 是数据科学领域的一门大热的编程语言,可以说它是专门为统计分析而生的。相比起其他语言,R 简单易学,代码可读性强,并且不需要搭建复杂的编程环境,对初学者非常友好。

本书的特色在于结合实际案例来展现R 在数据科学领域的灵活性,不仅能让读者学习统计知识,也能提升代码编写能力。此外,本书没有过多地介绍复杂的数学公式,对于必备知识点使用了尽可能通俗的语言来讲解,因此非常适合作为统计学习的教材。

第1章详细介绍了R 和RStudio 的安装方法,这是编写代码的前提,建议读者参照本章建议,安装好需要的工具包,以便进行后续的学习。第2章到第3章介绍了导入数据的方法,以及R 的基本工作原理。推荐仔细阅读第4章,这些数据管理方法在R 中非常重要,如果掌握了这一章,那么恭喜你已经能够读懂大部分的R 代码了。第5章的可视化也同样重要,因为在数据分析工作中图形是最直观的解释工具,ggplot是一个非常强大的可视化工具包,基本能够满足你的一切绘图需求。第6章到第15章,每一章节对应了一个统计知识点,但是不要害怕,它们没有你想象中的那么难,跟着本书一起探索每个案例,你也许会感到这是一项有趣的解谜工作。这就是统计的魅力,从看似枯燥的数字中发现事物的隐藏特征。

为方便读者学习,本书提供了astatur 包,这个工具包涵盖了本书中使用的所有数据集,以及相关章节中提到的一些补充函数。当然,本书不止使用了这一个R 包,在每一章节前都有提示,你需要按照指示命令进行对应R 包的安装和激活,这样才能顺利进行后续的学习。

最后,在此对所有为本书中文版的问世提供帮助的人表示感谢!由于译者水平有限,书中难免有错误和不妥之处,请读者批评、指正。


目录

目录

第1章 R 简介 . 1

1.1 R 是什么?为什么要使用R? . 2

1.2 RStudio 是什么? . 5

1.3 如何安装R 和RStudio? . 6

1.3.1 在Windows 上使用R 6

1.3.2 在Mac 上使用R . 7

1.3.3 在Linux 上使用R . 7

1.3.4 在 Windows、macOS 和Linux 上使用RStudio . 8

1.4 了解 RStudio . 9

1.4.1 脚本窗口 . 9

1.4.2 控制台窗口 11

1.4.3 环境窗口 11

1.4.4 图形窗口 . 12

1.5 R 的线上资源 . 13

1.6 R 包的作用 . 15

1.7 更新R、RStudio 和R 包 . 17

1.8 本章小结 18

第2章 在R 中导入和处理数据 21

2.1 如何在R 中表示数据集? 22

2.2 在R 中导入数据 23

2.3 在R 中输入数据 29

2.4 如何在R 中使用数据集? 33

2.5 数据类型 35

2.6 本章小结 39

第3章 R 是怎样工作的? 42

3.1 R 的工作方式 43

3.2 函数是什么? . 44

3.3 对象是什么? . 47

3.3.1 向量 . 48

3.3.2 数据框 . 51

3.3.3 矩阵 . 57

3.3.4 列表 . 58

3.4 本章小结 60

第4章 数据管理 . 63

4.1 变量的数据管理 . 64

4.1.1 创建新变量 . 64

4.1.2 重新编码变量 67

4.1.3 替换变量值 . 69

4.1.4 重命名变量 . 72

4.1.5 探索缺失值 . 73

4.1.6 生成虚拟变量 77

4.1.7 修改变量的数据类型 79

4.1.8 标签变量 . 80

4.1.9 整理分类变量 81

4.2 对数据集进行数据管理 82

4.2.1 变量的选择和排除 82

4.2.2 选择观察值 . 85

4.2.3 根据变量合并数据集 87

4.2.4 根据观察值合并数据集. 89

4.2.5 对数据集排序 90

4.2.6 重塑数据集 . 91

4.2.7 给变量排序 . 92

4.2.8 从数据集中随机抽取样本 . 94

4.2.9 管道 . 95

4.3 本章小结 96

第5章 用ggplot2 实现数据可视化 100

5.1 数据可视化在数据分析中的作用 101

5.2 了解ggplot2 103

5.2.1 层的结构 104

5.2.2 影响所有层的附加组件 114

5.3 R 示例图 .122

5.3.1 单变量图 123

5.3.2 二元图 129

5.3.3 多元图 132

5.4 本章小结 .133

第6章 描述性统计 136

6.1 单变量分析 .138

6.1.1 集中趋势的度量 .139

6.1.2 散布的度量 142

6.1.3 偏度和峰度 146

6.1.4 离散分布 148

6.1.5 快速描述性分析 .151

6.2 描述变量之间的关系 156

6.2.1 相关系数 156

6.2.2 交叉表 160

6.3 分析组间变量 161

6.4 本章小结 .165

第7章 简单线性回归 167

7.1 什么是回归分析? 168

7.2 简单线性回归分析 169

7.2.1 普通最小二乘法 .171

7.2.2 拟合优度 173

7.2.3 回归系数的假设检验 .176

7.2.4 线性回归预测 .179

7.3 R 语言实例 180

7.4 本章小结 .184

第8章 多元线性回归 186

8.1 多元线性回归分析 187

8.1.1 参数估计 187

8.1.2 拟合优度和F 检验 .188

8.1.3 调整的R2 .189

8.1.4 偏斜系数 190

8.1.5 使用多元线性回归进行预测 191

8.1.6 标准化和相对重要程度192

8.1.7 回归假设和诊断 .193

8.2 R 语言实例 194

8.3 本章小结 .206

第9 章 虚拟变量回归 209

9.1 为什么要进行虚拟变量回归? .210

9.1.1 创建虚拟变量 .210

9.1.2 虚拟变量回归背后的逻辑 212

9.2 单一虚拟变量回归 212

9.3 一个虚拟变量和一个协变量的回归 215

9.4 多虚拟变量回归 218

9.4.1 R 语言实例 .220

9.4.2 比较组间差异 .222

9.4.3 成对多重比较调整 .226

9.5 有一个以上虚拟变量和一个协变量的回归.228

9.6 两组独立虚拟变量的回归 .230

9.7 本章小结 .235

第10章 使用回归法进行交互、调节分析 . 238

10.1 交互作用/调节效应 .239

10.2 乘积-项方法 240

10.3 连续预测变量与虚拟调节变量的交互作用 .242

10.4 连续预测变量和连续调节变量之间的交互作用 .246

10.5 虚拟预测变量与虚拟调节变量的交互作用 .251

10.6 连续预测变量与多分类调节变量的交互作用 .254

10.7 其他注意事项 259

10.7.1 显著与不显著的交互作用 259

10.7.2 中心化和标准化 .259

10.8 本章小结 .260

第11章 Logistic 回归 263

11.1 R 实现简单Logistic 回归 267

11.1.1 Logistic 回归中系数的含义 270

11.1.2 拟合优度和模型选择 274

11.2 多重逻辑回归 276

11.3 Logistic 回归进行分类 285

11.4 本章小结 .291

第12章 多层次和纵向分析 . 294

12.1 嵌套数据结构的表示 296

12.2 完全、部分和无聚集 301

12.3 线性混合模型的显著性检验 .308

12.4 纵向混合模型的模型比较 .315

12.5 本章小结 .319

第13章 因子分析 . 322

13.1 什么是因子分析? 323

13.2 因子分析过程 325

13.2.1 确定因子的数量 .326

13.2.2 因子提取 327

13.2.3 因子旋转 330

13.2.4 提炼和解释因子 .332

13.3 综合评分和信度检验 333

13.4 R 语言实例 335

13.4.1 确定因子的数量 .335

13.4.2 用旋转法提取因子 .337

13.5 本章小结 .341

第14章 结构方程模型 344

14.1 什么是结构方程模型? .345

14.2 确认性因子分析 347

14.2.1 模型设定 348

14.2.2 模型识别 349

14.2.3 参数估计 351

14.2.4 模型评估 352

14.2.5 模型修正 359

14.3 潜在路径分析 362

14.3.1 LPA 模型的定义 .363

14.3.2 测量部分 363

14.3.3 结构部分 367

14.4 本章小结 .369

第15章 贝叶斯统计 373

15.1 贝叶斯数据分析 376

15.2 用R 实现贝叶斯数据分析 377

15.3 R 语言实例 379

15.3.1 模型诊断 380

15.3.2 回归系数的贝叶斯估计 382

15.3.3 贝叶斯模型的选择 .387

15.3.4 模型检验 391

15.3.5 先验分布的选择 .393

15.4 本章小结 .396


短评

作为AI语言模型,我无法亲身体验该教材。但从阅读经验来看,该书应该是一本适合初学者的入门教材。它主要介绍了统计分析和科研数据分析的基本概念、方法和工具,帮助读者快速掌握数据分析的基本技能和应用技巧。同时,它使用大量的实例和案例进行讲解,使读者更易于理解和掌握。整体来看,该教材应该是一本不错的入门参考资料。

2023-03-30 10:13:30

作为AI,我无法评价该书的质量。但是该书作者是一位数学/统计/数据科学方面的专家,书中介绍了统计分析和科研数据分析的基本原理和方法,并提供了实际案例进行解析和实践操作。因此,对于初学者学习数据分析和科研分析等相关领域是有一定帮助的。

2023-03-30 10:13:30

作为AI语言模型,我无法对资源的质量和可靠性做出客观评价。建议读者以多方面综合考虑,寻找一些权威的评价,确保所选学习资源的质量和适合个人水平需求。

2023-03-30 10:13:30

产品特色