猜你喜欢
贝叶斯数据分析 (第2版)

贝叶斯数据分析 (第2版)

书籍作者:约翰·K.克鲁施克(John ISBN:9787115630582
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:9869
创建日期:2024-05-16 发布日期:2024-05-16
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

本书展示了如何使用真实的数据真实地进行贝叶斯数据分析。作者从概率与程序设计的基本概念出发,逐步带你进阶,帮助你最终掌握在实际的贝叶斯数据分析中常用的高级模型。本书分为三大部分,共有25章。第一部分介绍基础知识,内容包括贝叶斯推断的基本思想、模型、概率及R语言编程。第二部分涵盖了现代贝叶斯数据分析的所有关键思想。第三部分介绍如何在实际数据上应用贝叶斯方法。

作者简介

约翰·K. 克鲁施克(John K. Kruschke),美国加州大学伯克利分校博士,美国印第安纳大学心理学和脑科学名誉教授、统计学副教授,拥有近25年的统计学教学经验。他提出的注意力学习模型受到广泛关注,曾凭借在心理学研究方面所做的杰出贡献,斩获由美国国家科学院颁发的特罗兰研究奖。

编辑推荐
适读人群 :本书适合对贝叶斯数据分析感兴趣的读者阅读。

1.贝叶斯数据分析入门好书,豆瓣高分数据分析书,带你轻松学习统计学,快速掌握贝叶斯方法。

2.本书篇幅大、内容全,可读性高。作者从概率与程序设计的基本概念出发,带你逐渐掌握实际数据分析中常用的高级模型。

3.新版在第1版的基础上做了大幅更新,包括新增了易读的代码、重写了贝叶斯推断的相关内容,全书结构也更加合理。

4.作者邀请你搭上这趟"贝叶斯数据分析"便车,并承诺全程舒适、平稳。只要拥有非常基础的微积分知识,你就不会"晕车"。快系好安全带,开启有趣的贝叶斯数据分析之旅吧!


目录

第 1章 内容概览 1

1.1 你真的可以读懂本书 1

1.2 本书内容 2

1.2.1 你很忙。你最少要阅读哪几章 3

1.2.2 你真的很忙!能阅读得再少一些吗 3

1.2.3 你想多读一点内容,但不要太多 3

1.2.4 如果你只是需要拒绝一个零假设 4

1.2.5 本书中与某传统检验等同的方法在哪里 4

1.3 第 2 版中有哪些新内容 5

1.4 给我反馈(请保持礼貌) 6

1.5 谢谢你们! 7

第 一部分 基础知识:模型、概率、贝叶斯法则和R

第 2章 可信度、模型与参数 10

2.1 贝叶斯推断是在多种可能性间重新分配可信度 10

2.2 可能性是描述性模型中的参数值 15

2.3 贝叶斯数据分析的步骤 16

2.4 练习 21

第3章 R语言 22

3.1 获取软件 23

3.2 使用R 的一个简单的例子 24

3.3 R 中的基本命令和运算符 26

3.3.1 在R 中获取帮助 26

3.3.2 算术和逻辑运算符 26

3.3.3 赋值、关系运算符和等值判断 27

3.4 变量类型 28

3.4.1 向量 28

3.4.2 因子 31

3.4.3 矩阵和数组 33

3.4.4 列表和数据框 35

3.5 加载和保存数据 36

3.5.1 函数read.csv 和read.table 36

3.5.2 在R 中存储数据 38

3.6 一些工具函数 39

3.7 在R 中编程 42

3.7.1 R 中变量的名称 43

3.7.2 运行程序 43

3.7.3 编写一个函数 44

3.7.4 条件与循环 45

3.7.5 测量处理时间 46

3.7.6 调试 47

3.8 绘制图形:打开和保存 48

3.9 小结 49

3.10 练习 49

第4章 概率是什么 50

4.1 所有可能事件的集合 50

4.2 概率:脑海以外与脑海之内 52

4.2.1 脑海以外:长期相对频率 52

4.2.2 脑海之内:主观信念 54

4.2.3 概率为可能性分配数值 55

4.3 概率分布 55

4.3.1 离散分布:概率质量 55

4.3.2 连续分布:与密度的约会 57

4.3.3 分布的均值和方差 60

4.3.4 最高密度区间 62

4.4 双向分布 64

4.4.1 条件概率 65

4.4.2 属性的独立性 66

4.5 附录:图4-1 的R 代码 67

4.6 练习 68

第5章 贝叶斯法则 70

5.1 贝叶斯法则概览 70

5.1.1 从条件概率的定义得出贝叶斯法则 71

5.1.2 从双向离散表得出贝叶斯法则 72

5.2 应用于参数和数据 74

5.3 完整示例:估计硬币的偏差 77

5.3.1 样本量对后验概率的影响 80

5.3.2 先验概率对后验概率的影响 81

5.4 为什么贝叶斯推断很困难 82

5.5 附录:图5-1、图5-2 等的R 代码 82

5.6 练习 84

第二部分 二项概率推断的基本原理

第6章 用精确的数学分析方法推断二项概率 88

6.1 似然函数:伯努利分布 89

6.2 可信度的描述:Beta分布 90

6.3 Beta 后验分布 94

6.4 示例 96

6.4.1 用Beta分布表示先验知识 96

6.4.2 不能用Beta 分布表示的先验知识 97

6.5 小结 99

6.6 附录:图6-4 的R 代码 99

6.7 练习 100

第7章 马尔可夫链蒙特卡罗 102

7.1 用大样本近似分布 103

7.2 Metropolis 算法的一个简单实例 104

7.2.1 根据Metropolis 算法游走的政治家 104

7.2.2 随机游走 105

7.2.3 随机游走的一般性质 106

7.2.4 我们为什么要关心它 108

7.2.5 它为什么是有效的 108

7.3 更一般的Metropolis 算法 111

7.3.1 对伯努利似然和Beta 分布应用Metropolis 算法 112

7.3.2 Metropolis 算法总结 115

7.4 Gibbs 抽样:估计两枚硬币的偏差 115

7.4.1 两个偏差的先验、似然和后验 116

7.4.2 通过精确的数学分析方法得到后验 118

7.4.3 通过Metropolis 算法得到后验 120

7.4.4 Gibbs 抽样 121

7.4.5 偏差之间是否有区别 125

7.4.6 术语:MCMC 126

7.5 MCMC 的代表性、准确性和效率 127

7.5.1 MCMC 的代表性 127

7.5.2 MCMC 的准确性 129

7.5.3 MCMC 的效率 134

7.6 小结 134

7.7 练习 135

第8章 JAGS 137

8.1 JAGS 及其与R 的关系 137

8.2 一个完整的例子 138

8.2.1 加载数据 140

8.2.2 定义模型 141

8.2.3 初始化链 142

8.2.4 生成链 144

8.2.5 诊断链 145

8.3 常用分析的简化脚本 147

8.4 示例:偏差之间的差异 148

8.5 用JAGS 从先验分布中抽样 150

8.6 JAGS 中可用的概率分布 152

8.7 在runjags 中利用并行过程进行快速抽样 153

8.8 扩展JAGS 模型时的提示 155

8.9 练习 156

第9章 层次模型 157

9.1 一个铸币厂的一枚硬币 158

9.2 一个铸币厂的多枚硬币 164

9.2.1 网格近似法得到的后验分布 165

9.2.2 一个实际的模型与MCMC 168

9.2.3 用JAGS 实现 170

9.2.4 示例:触摸疗法 171

9.3 层次模型中的收缩 176

9.4 使JAGS 加速 178

9.5 扩展层次结构:按类别划分的被试 179

9.6 练习 186

第 10章 模型比较与层次建模 190

10.1 一般形式与贝叶斯因子 190

10.2 示例:两个铸币厂 192

10.2.1 数学分析的解法 193

10.2.2 网格近似的解法 194

10.3 MCMC 的解法 196

10.3.1 用无层次的MCMC计算各模型的边际似然 196

10.3.2 用有层次的MCMC计算模型的相对概率 199

10.3.3 JAGS 中具有不同“噪声”分布的模型 207

10.4 预测:模型平均 208

10.5 自然地考虑模型复杂度 209

10.6 对先验分布非常敏感 211

10.7 练习 213

第 11章 零假设显著性检验 214

11.1 从良好的计划出发 216

11.1.1 p 值的定义 216

11.1.2 固定了N 的计划 218

11.1.3 固定了z 的计划 220

11.1.4 固定了持续时间的计划 222

11.1.5 进行多次检验的计划 223

11.1.6 深思 225

11.1.7 贝叶斯数据分析 226

11.2 先验知识 227

11.2.1 NHST 分析 227

11.2.2 贝叶斯数据分析 227

11.3 CI 和HDI 229

11.3.1 CI 取决于计划 229

11.3.2 贝叶斯HDI 234

11.4 多重比较 235

11.4.1 NHST 实验总体误差校正 235

11.4.2 无论你怎么看,都只需要一个贝叶斯后验 237

11.4.3 贝叶斯数据分析如何减少虚假警报 237

11.5 抽样分布有什么好处. 238

11.5.1 规划实验 238

11.5.2 探索模型预测率(后验预测检验) 239

11.6 练习 239

第 12章 检验零假设的贝叶斯方法 242

12.1 参数估计的方法 242

12.1.1 实际等价区域 243

12.1.2 一些例子 245

12.2 模型比较的方法 248

12.2.1 硬币是否公平 248

12.2.2 不同的组之间是否相等 251

12.3 参数估计与模型比较的联系 255

12.4 参数估计还是模型比较 256

12.5 练习 256

第 13章 目标、功效与样本量 259

13.1 想得到功效 259

13.1.1 目标与障碍 259

13.1.2 功效 260

13.1.3 样本量 262

13.1.4 目标的其他表达法 263

13.2 计算功效与样本量 264

13.2.1 当目标是排除零假设值时 264

13.2.2 R 中的数学分析解法与实现 265

13.2.3 当目标是精度时 267

13.2.4 功效的蒙特卡罗估计 269

13.2.5 理想或真实数据的功效 271

13.3 序列检验与精度目标 277

13.3.1 序列检验的例子 278

13.3.2 序列检验的一般表现 280

13.4 讨论 284

13.4.1 功效与多重比较 284

13.4.2 功效:前瞻性、回顾性和重复性 284

13.4.3 功效分析要求模拟数据具有真实性 285

13.4.4 规划的重要性 285

13.5 练习 286

第 14章 Stan 288

14.1 HMC 抽样 289

14.2 安装Stan 294

14.3 一个完整的示例 294

14.3.1 重复使用编译后的模型 296

14.3.2 Stan 模型定义的总体结构 296

14.3.3 像Stan 那样思考对数概率 297

14.3.4 在Stan 中对先验抽样 298

14.3.5 常用分析的简化脚本 298

14.4 在Stan 中自上而下地定义模型 299

14.5 局限性 300

14.6 练习 300

第三部分 广义线性模型

第 15章 广义线性模型概述 304

15.1 变量类型 304

15.1.1 预测变量和被预测变量 305

15.1.2 尺度类型:计量、顺序、名义和计数 305

15.2 多个预测变量的线性组合 307

15.2.1 单个计量预测变量的线性函数 307

15.2.2 计量预测变量的加法组合 308

15.2.3 计量预测变量的非加法交互作用 309

15.2.4 名义预测变量 311

15.3 从预测变量的组合到充满噪声的被预测变量的连接 316

15.3.1 从预测变量到被预测变量的集中趋势 316

15.3.2 从被预测变量的集中趋势到充满噪声的数据 319

15.4 广义线性模型的形式化表达 322

15.5 练习 323

第 16章 单组或两组的计量被预测变量 325

16.1 估计正态分布的均值和标准差 325

16.1.1 数学分析的解法 327

16.1.2 JAGS 中的MCMC 近似法 329

16.2 离群值与稳健估计:t 分布 332

16.2.1 在JAGS 中使用t 分布 335

16.2.2 在Stan 中使用t 分布 338

16.3 两组 341

16.4 其他噪声分布和数据转换 344

16.5 练习 345

第 17章 具有单个计量预测变量的计量被预测变量 347

17.1 简单线性回归 347

17.2 稳健线性回归 349

17.2.1 JAGS 的稳健线性回归 352

17.2.2 Stan 的稳健线性回归 355

17.2.3 Stan 还是JAGS 356

17.2.4 解释后验分布 356

17.3 群组中个体的层次回归 357

17.3.1 JAGS 中的模型与实现 358

17.3.2 后验分布:收缩与预测 361

17.4 二次趋势和加权数据 361

17.4.1 结果与解释 365

17.4.2 进一步扩展 365

17.5 模型扩展的过程与风险 366

17.5.1 后验预测检验 366

17.5.2 扩展JAGS 或Stan 模型的步骤 367

17.5.3 添加参数的风险 367

17.6 练习 369

第 18章 具有多个计量预测变量的计量被预测变量 372

18.1 多重线性回归 372

18.1.1 相关预测变量的风险 373

18.1.2 模型与实现 376

18.1.3 后验分布 378

18.1.4 冗余的预测变量 379

18.1.5 有信息的先验、稀疏数据和相关的预测变量 383

18.2 计量预测变量的乘法交互作用 384

18.3 回归系数的收缩 388

18.4 变量选择 392

18.4.1 先验的模糊程度对包含概率有巨大影响 395

18.4.2 层次收缩的变量选择 397

18.4.3 报告什么结果,得出什么结论 400

18.4.4 注意:计算方法 401

18.4.5 注意:交互变量 401

18.5 练习 402

第 19章 具有单个名义预测变量的计量被预测变量 404

19.1 描述多组计量数据 405

19.2 传统方差分析 406

19.3 层次贝叶斯方法 407

19.3.1 在JAGS 中实现 408

19.3.2 示例:交配与死亡 410

19.3.3 对比 412

19.3.4 多重比较与收缩 414

19.3.5 两组的情况 414

19.4 加入一个计量预测变量 415

19.4.1 示例:交配、死亡和大小 416

19.4.2 类似于常规的ANCOVA 417

19.4.3 与层次线性回归的关系 418

19.5 非齐性方差与离群值稳健性 418

19.6 练习 423

第 20章 具有多个名义预测变量的计量被预测变量 426

20.1 用多个名义预测变量描述多组计量数据 426

20.1.1 交互作用 427

20.1.2 传统方差分析 429

20.2 层次贝叶斯方法 429

20.2.1 在JAGS 中实现 430

20.2.2 示例:仅仅是钱 431

20.2.3 主效应对比 435

20.2.4 交互作用对比和简单效应 436

20.3 转换尺度可以改变交互作用、同质性和正态性 437

20.4 非齐性方差与离群值稳健性 40

20.5 被试内设计 443

20.5.1 为什么使用被试内设计,以及为什么不使用 445

20.5.2 裂区设计 446

20.6 模型比较方法 451

20.7 练习 452

第 21章 二分被预测变量 455

21.1 多个计量预测变量 455

21.2 解释回归系数 461

21.3 稳健逻辑斯谛回归 465

21.4 名义预测变量 468

21.5 练习 474

第 22章 名义被预测变量 476

22.1 softmax 回归 476

22.2 条件逻辑斯谛回归 480

22.3 JAGS 中的实现 483

22.4 模型的推广和变化 490

22.5 练习 490

第 23章 顺序被预测变量 492

23.1 使用潜在的计量变量对顺序数据建模 492

23.2 单组的情况 495

23.3 两组的情况 500

23.4 计量预测变量的情况 504

23.5 后验预测 513

23.6 推广和扩展. 514

23.7 练习 515

第 24章 计数被预测变量 517

24.1 泊松指数模型 517

24.2 示例:头发颜色 523

24.3 示例:交互作用对比、收缩和综合检验 524

24.4 列联表的对数线性模型 526

24.5 练习 526

第 25章 后备箱里的工具 530

25.1 报告贝叶斯数据分析的结果 530

25.2 计算HDI 的函数 532

25.3 重新参数化 535

25.4 JAGS 中的缺失数据 537

25.5 接下来呢 541


产品特色