猜你喜欢
SPSS进阶分析与实务

SPSS进阶分析与实务

书籍作者:石鹏 ISBN:9787121436048
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:4744
创建日期:2023-04-11 发布日期:2023-04-11
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

本书以统计理论为主线,以解决实际问题为导向,详细介绍了SPSS在多变量方差分析、协方差分析、线性回归分析、主成分分析、因子分析、聚类分析、判别分析、决策树、神经网络、时间序列分析、对应分析、典型相关分析、简单效应、简单简单效应、调节效应、中介效应及多重响应分析中的应用。
本书结合理论与实践,具有较强的技术应用性和针对性,主要面向各个专业的初、中级SPSS的使用者,以及想要深入学习和应用统计学的读者。


作者简介

石鹏,中国医科大学博士,国家重点研发计划项目骨干,公众号“SPSS学堂”成员,研究方向为环境危害暴露及其健康效应、疾病负担测算及数据可视化、临床试验设计与统计分析。以第一作者或共同第一作者发表SCI论文5篇,累计影响因子34.177分,包括ESI高被引论文1篇;中文核心期刊论文2篇;担任《中国循证医学》杂志审稿人,《Life Research》青年编委,主编《SPSS进阶分析与实务》、《环境污染健康损害因果关系判定方法》,参与制定团体标准一项,授权软件著作权三项。

编辑推荐
适读人群 :本书主要面向院校学生、数据分析人士、市场营销人士、专业的咨询管理人士。

1.详细介绍16个统计学方法在SPSS中的实现,以及这些方法的原理和适用条件。
2.36个典型案例帮助读者理解相关知识点。
3.有一个专用的SPSS公众号“SPSS学堂”帮助读者答疑解惑。

前言

序言
C.R.Rao 说过:“在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,一切判断都是统计学。”

统计学的任务是研究有关数据的收集、整理、分析,从而对所研究问题做出一定结论。统计学有坚实的理论基础,也是一门技术性很强的科学,一直受到科学技术进步的影响。大规模数据越来越多、新兴数据研究问题越来越复杂等情况都将引起数据科学生态的变化,这些都将筑牢统计学在解决社会、经济、精准医学、环境科学、生物信息学等领域问题中的中心地位。


统计学的核心价值在于它能够帮助我们科学地理解世界,探索事物运行的规律。例如,由于生物技术的飞速发展,生命科学、医学及公共卫生领域的研究方向已经发生了重大转变。这些转变将科学生产力的瓶颈从数据产生转移到了数据分析与解释。在个人层面,医生可以根据个体基因组、表观遗传、环境、生活方式等信息提出精准的治疗策略,并指导个人更有效地进行健康管理;在公共卫生层面,政府机构将更精准地了解不同环境因素、生活方式和其他相关因素对健康的影响,从而降低医疗保健成本。


统计和数据科学的研究和教育必须着眼于解决现实世界的问题,在当今的大数据时代,科学、理性地运用统计知识和统计思维去辩证,在鱼龙混杂的信息中去伪存真,正确使用统计学方法尤为重要。本书详细讲解 SPSS 多元统计分析的运用方法,指引读者驾驭复杂的数据,快速掌握 SPSS 软件,本书有很好的实用性和参考价值,对数据分析与挖掘技术的研究与推广将发挥重要作用。


席淑华
2022 年 1 月 7 日

于中国医科大学



写在前面

数据分析是从数据中提取有价值信息的过程,在此过程中需要对数据进行各种处理和归类。只有真正地掌握了数据分类方法和数据处理模式,我们才能得到正确的结果及解释,从而指导实践。然而,面对丰富且错综复杂的数据资料,想要做到选择合理的统计方法快速得出正确的结论并非易事。


作为一款功能强大、方便易用的数据分析软件,SPSS 深受数据分析爱好者和从业者的喜爱,所有的功能都以对话框选项的形式呈现,界面统一、规范,用户只要掌握一定的Windows 操作技能,通晓一定的统计分析原理,就可以使用该软件。随着版本的升级,SPSS的功能愈发强大,被广泛应用于诸多行业及学术研究中。


本书作为《菜鸟学 SPSS 数据分析》的进阶版,既与前作相辅相成,又具有自身的独特性。前作的内容循序渐进,力求使各位读者(尤其是初学者)能更好地理解、运用 SPSS,重在对基础性的知识及操作进行讲解,但面对复杂的数据分析与挖掘显得力有不逮,这也促使了本书的编写。


本书主要面向各个专业的初、中级 SPSS 的使用者及想要深入学习和应用统计学的读者,定位为一本讲解高级统计分析技术的字典式的工具书,以统计理论为主线,以解决实际问题为导向,详细介绍了回归建模及其他多元统计方法,其中,每章都介绍了一个独立的统计方法,从理论到操作,每一章都配有实例,每一部分都有细致的讲解,读者可以根据需求到相应的章节重点研读。


本书特色
1. 以统计理论为主线,严格筛选统计方法

本书介绍的统计方法是基于对各个学科专业常用方法的大量研究,由知识储备丰富且有大量实战经验的作者编写而成的,每章介绍一个独立的统计方法,可以让读者对比学习。而学科性较强的方法并未在本书中体现,如果读者想要深入学习,可以关注“SPSS 学堂”微信公众号,获取相应的学习资源。


2. 以解决实际问题为导向

本书的目的不在于让各位读者了解 SPSS 的操作方法,而是掌握分析数据的统计方法,了解这些方法背后的实际用途,以开阔思路,并真正掌握相关技能。同时笔者建议读者不要拘泥于某一个统计软件,只要能方便、快捷地得出正确结论,我们就需要学习并加以使用。


3. 标题体现用途

本书每章内容的标题均体现了该章节所讲解统计方法的用途,让读者快速理解并判断该方法的适用性。


4. 微信公众号推文与图书内容的完美结合

微信公众号“SPSS 学堂”邀请来自海内外各大知名高校不同专业的硕士、博士定期撰写文章,精选优秀论文进行深度剖析并解读,以开拓读者分析数据的思路及增强实战能力,同时更新一些统计方法的小技巧与小知识点,以便读者的学习效果更上一层楼。


本书由“SPSS 学堂”的多位作者共同编写,其中,陈联、蔡伟杰共同编写了第 1 章、第 3 章的 3.1~3.3、3.5、3.6 节;陈汝男编写了第 3 章的 3.4、3.7~3.9 节、第 4 章;付梦瑶编写了第 5 章的 5.1、5.3 节、第 14~15 章;石鹏编写了第 5 章的 5.2、5.5 节;林梦茹编写了第5 章的 5.4 节;张楷露编写了第 6~7 章;柏安之、蔡伟杰共同编写了第 8~10 章;王亚北编写了第 12~13 章;张琪编写了第 16 章;林梦茹、王鹏共同编写了第 2 章和第 11 章。但婉欣审校了第 1~5 章;柏安之审校了第 6~10 章;石鹏审校了第 11~16 章。余羿提供了第 8~10 章的数据。在此致以感谢!

本书得以付梓,特别感谢中国医科大学公共卫生学院席淑华教授为本书撰写序言,特别感谢中国科学院国家重点研发计划项目首席科学家、全国红医联盟执行理事长、中国医药卫生文化协会副会长朱京海教授为本书撰写推荐语,特别感谢中国医科大学公共卫生学院贺淼教授为本撰写推荐语,特别感谢华中师范大学徐旋同学为本书拟定书名,特别感谢中国医科大学公共卫生学院杨华杰同学校读了文稿。需要特别说明的是,一本书的编写需要投入大量的时间与精力,各位作者在编写时会尽可能确保内容正确与严谨,但也难免会存在疏漏之处,还请各位专家和广大读者批评指正。


联系我们:请关注微信公众号“SPSS 学堂”(微信号:spss2333)并在后台留言。

相关案例下载:请关注微信公众号“SPSS 学堂”(微信号:spss2333)并回复“进阶案例”。

目录

第 1 章 多个因变量的假设检验:多变量方差分析 1
1.1 多变量方差分析 1
1.1.1 多变量方差分析简介 1
1.1.2 多变量方差分析的应用条件 1
1.2 多变量方差分析案例:不同舞蹈学校的分数差异分析 . 2
1.2.1 选择变量 3
1.2.2 设置模型选项 3
1.2.3 设置事后选项 4
1.2.4 选项设置 4
1.2.5 输出结果 5
1.3 本章小结 8

第 2 章 校正混杂因素:协方差分析 9
2.1 协方差分析简介 9
2.2 协方差分析案例:早读对成绩的影响 10
2.2.1 回归拟合线平行性检验 11
2.2.2 计算和检验修正均数(正式进行协方差分析) . 15
2.3 本章小结 18

第 3 章 因变量为连续变量的估计与预测:线性回归分析 . 19
3.1 线性回归分析简介 19
3.1.1 简单线性回归分析简介 19
3.1.2 多重线性回归分析简介 20
3.2 简单线性回归分析 20
3.2.1 简单线性回归分析的假设条件 21
3.2.2 简单线性回归分析案例:身高和体重的关系 . 26
3.3 多重线性回归分析 27
3.3.1 多重线性回归分析的假设条件 28
3.3.2 多重线性回归分析案例:年收入的影响因素 . 28
3.4 回归诊断 33
3.4.1 异常值判断 33
3.4.2 独立性检验 37
3.4.3 正态性检验 39
3.4.4 方差齐性检验 40
3.4.5 多重共线性诊断 41
3.5 权重估计 43
3.5.1 权重估计简介 43
3.5.2 权重估计案例:收入影响因素分析. 43
3.6 加权最小二乘法 46
3.6.1 加权最小二乘法简介 46
3.6.2 加权最小二乘法案例:收入影响因素分析 . 46
3.7 二阶最小二乘法 48
3.7.1 二阶最小二乘法简介 48
3.7.2 二阶最小二乘法案例:影响成绩的数据 . 49
3.8 分层回归分析 51
3.8.1 分层回归分析简介 51
3.8.2 分层回归分析案例:影响个人收入的因素 . 52
3.9 本章小结 56

第 4 章 因变量为离散变量的估计与预测:Logistic 回归模型 . 58
4.1 Logistic 回归模型简介 58
4.1.1 Logistic 回归模型的公式 58
4.1.2 Logistic 回归分析的目的 59
4.1.3 Logistic 回归模型的适用条件 59
4.1.4 Logistic 回归分析的主要用途 60
4.2 二元 Logistic 回归模型 . 60
4.2.1 二元 Logistic 回归模型简介 . 61
4.2.2 二元 Logistic 回归分析案例:学业成就数据 61
4.3 多元 Logistic 回归模型 . 67
4.3.1 多元 Logistic 回归模型简介 . 67
4.3.2 多元 Logistic 回归分析案例:数学成绩调查数据 68
4.4 有序回归模型 71
4.4.1 有序回归模型简介 71
4.4.2 有序回归分析案例:影响个人收入水平的因素 . 71
4.5 本章小结 74

第 5 章 回归模型进阶:其他回归模型 76
5.1 最优尺度回归模型 76
5.1.1 最优尺度回归模型简介 76
5.1.2 最优尺度回归分析案例:师生关系的预测因素 . 77
5.2 非线性回归模型 83
5.2.1 曲线估计回归模型 84
5.2.2 非线性回归模型简介 87
5.2.3 曲线估计回归模型与非线性回归模型的比较 . 90
5.3 多层线性模型 91
5.3.1 多层线性模型简介 92
5.3.2 多层线性模型(零模型)案例:语文成绩预测因素 . 93
5.3.3 多层线性模型(全模型)案例:语文成绩预测因素 . 95
5.4 对数线性模型 98
5.4.1 对数线性模型简介 98
5.4.2 对数线性模型案例:不同学历人员的收入水平数据 . 99
5.5 本章小结 101

第 6 章 简化多变量复杂关系:主成分分析与因子分析 . 102
6.1 主成分分析 102
6.1.1 主成分分析简介 102
6.1.2 主成分分析案例:各省市特征指标的降维 . 104
6.2 因子分析 106
6.2.1 因子分析简介 106
6.2.2 因子分析案例:学生知识结构状况. 106
6.3 本章小结 112

第 7 章 数据归约技术:聚类分析 114
7.1 聚类分析简介 114
7.2 K 均值聚类 115
7.2.1 K 均值聚类简介. 115
7.2.2 K 均值聚类案例:土壤样本聚类 . 116
7.3 系统聚类 119
7.3.1 系统聚类简介 119
7.3.2 系统聚类案例:土壤指标聚类 120
7.4 二阶聚类 123
7.4.1 二阶聚类简介 123
7.4.2 二阶聚类案例:潮间带大型动物的群落结构 . 124
7.5 本章小结 127

第 8 章 建立分组预测模式:判别分析 128
8.1 Fisher 判别分析 . 128
8.1.1 Fisher 判别分析简介 . 128
8.1.2 Fisher 判别分析案例:鸢尾花分类 128
8.2 Bayes 判别分析 . 133
8.2.1 Bayes 判别分析简介 . 133
8.2.2 Bayes 判别分析案例:鸢尾花分类 133
8.3 本章小结 138

第 9 章 预测变量的二元分离:决策树 139
9.1 决策树简介 139
9.2 C4.5 算法 . 139
9.2.1 构造决策树 140
9.2.2 决策树剪枝 141
9.3 SPSS Modeler 的 C5.0 算法实现 143
9.3.1 SPSS Modeler 简介 143
9.3.2 C5.0 算法分析案例:患者用药策略 144
9.4 本章小结 154

第 10 章 自适应、自学习:神经网络 155
10.1 神经网络简介 155
10.2 神经网络模型 155
10.2.1 激励函数表达方式 156
10.2.2 传播方式 158
10.2.3 神经网络模型案例:鸢尾花分类 159
10.3 本章小结 165

第 11 章 时序数据的预测:时间序列分析 . 166
11.1 时间序列分析简介 166
11.2 指数平滑模型 167
11.2.1 指数平滑模型简介 167
11.2.2 指数平滑模型案例:药品产量 . 168
11.3 自回归综合移动平均模型 176
11.3.1 自回归综合移动平均模型简介 . 176
11.3.2 自回归综合移动平均模型实例分析案例:体检中心收入 . 176
11.4 本章小结 181

第 12 章 发现多个分类变量间的潜在关系:对应分析 182
12.1 对应分析简介 182
12.2 简单对应分析 183
12.2.1 简单对应分析实现 183
12.2.2 简单对应分析案例:家庭结构与学历 . 187
12.3 基于均数的对应分析 190
12.3.1 基于均数的对应分析简介 190
12.3.2 基于均数的对应分析案例:各行业经济增长状况比较 . 191
12.4 基于最优尺度变换的多重对应分析 194
12.4.1 基于最优尺度变换的多重对应分析简介 . 194
12.4.2 基于最优尺度变换的多重对应分析案例:家庭结构与学历 . 201
12.5 本章小结 205

第 13 章 两组变量的相关分析:典型相关分析 . 206
13.1 典型相关分析简介 206
13.2 典型相关分析案例:旅游前的旅游信息搜索动机与旅游行为之间的关系 . 207
13.2.1 使用 Canonical 宏程序进行典型相关操作 207
13.2.2 使用 MANOVA 语法进行典型相关操作 . 211
13.2.3 输出结果 215
13.3 基于最优尺度变换的非线性典型相关分析 216
13.3.1 基于最优尺度变换的非线性典型相关分析简介 . 216
13.3.2 基于最优尺度变换的非线性典型相关分析案例:家庭结构与学历 . 217
13.4 本章小结 221

第 14 章 交互效应分析进阶:简单效应与简单简单效应 . 222
14.1 重复测量设计的简单效应与简单简单效应 222
14.1.1 简单效应简介 223
14.1.2 简单简单效应简介 224
14.1.3 分析策略 224
14.1.4 简单效应案例:不同教学方法与智力的关系 . 224
14.1.5 简单简单效应案例:不同教学方法与智力的关系 . 228
14.2 被试间设计的简单效应与简单简单效应 231
14.2.1 分析策略 232
14.2.2 简单效应案例:心理学反应时研究 . 232
14.2.3 简单简单效应案例:心理学反应时研究 . 235
14.3 本章小结 239

第 15 章 调节变量与中介变量分析方法:调节效应与中介效应 243
15.1 调节效应 243
15.1.1 调节效应简介 243
15.1.2 自变量和调节变量均为连续变量的调节效应分析 . 245
15.1.3 自变量为连续变量、调节变量为分类变量的调节效应分析 . 249
15.1.4 自变量为分类变量、调节变量为连续变量的调节效应分析 . 254
15.1.5 自变量、调节变量均为分类变量的调节效应分析 . 257
15.2 Process 插件 . 258
15.2.1 Process 插件的安装及应用 . 258
15.2.2 Bootstrap 方法及其应用 260
15.2.3 使用 Process 插件检验调节效应 260
15.2.4 使用 Process 插件检验中介效应 264
15.2.5 中介效应与调节效应的混合模型 270
15.3 本章小结 274

第 16 章 多项选择题的分析处理:多重响应分析 275
16.1 多重响应分析 275
16.1.1 多重响应分析案例:注册某软件时选过的标签 . 276
16.1.2 多重响应变量集的频率差异卡方检验案例:标签选择 . 280
16.1.3 多重响应变量集的交叉表分析案例:标签选择 . 282
16.2 本章小结 284
参考文献 . 285

短评

不错不错,送货超级快

2022-07-18 16:27:28

产品特色