Python金融大数据风控建模实战:基于机器学习
书籍作者:王青天 |
ISBN:9787111655794 |
书籍语言:简体中文 |
连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 |
下载次数:7939 |
创建日期:2021-02-14 |
发布日期:2021-02-14 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
内容简介
《Python金融大数据风控建模实战:基于机器学习》是一本基于Python语言的金融大数据风控建模入门读物。书中结合人工智能领域流行的机器学习算法进行信用评分卡模型构建,从而解决金融领域核心的风险控制问题。
《Python金融大数据风控建模实战:基于机器学习》共19章,分为4篇。第1篇“智能风控背景”,旨在由浅入深地代领读者走进金融科技领域,带领他们了解智能风控的相关知识,并全面、系统地认识评分卡;第2篇“评分卡理论与实战基础”,围绕评分卡构建的完整流程,向读者一一讲述每个环节的理论知识,并进行代码实践,帮助读者获得从0到1构建评分卡模型的工程能力;第3篇“评分卡理论与实战进阶”,旨在从建模中可能遇到的问题出发,提供一些解决问题或提升模型效果的思路,使建立的评分卡具有更好的业务适应能力及预测能力;第4篇“Lending Club数据集实战”,结合真实信贷场景的数据集,带领读者完成从数据分析到评分卡生成的各个流程,旨在让读者体验真实的场景,掌握评分卡实战技能,同时为读者在实际工作中构建评分卡提供参考。
《Python金融大数据风控建模实战:基于机器学习》适合有一定Python语言基础的金融风控从业人员阅读,也适合想要学习人工智能如何应用于金融场景中的开发人员及业务人员阅读。另外,金融、计算机等相关专业的学生,以及金融科技从业人员及相关培训学员也可将该书作为教材或者兴趣读物阅读。
作者简介
王青天,硕士,曾任某互联网金融公司机器学习研究工程师,从事风控建模工作。对机器学习、风控建模、工业互联网等方向有浓厚的兴趣和广泛的研究。
孔越,博士,曾留学英国剑桥大学。涉猎金融风控和“AI+药物研发”等多个人工智能应用领域。曾参与多项国家自然科学基金项目和欧洲科研基金项目,发表多篇SCI论文。
前言
自2016年以来,金融科技(Fintech)开始风靡国内外金融行业,备受关注。Fintech基于大数据、云计算和人工智能等一系列创新技术,全面应用于支付清算、借贷融资、财富管理、零售银行、保险、交易结算六大金融领域,是金融业未来的主流趋势。Fintech以数据和技术为核心驱动力,正在改变金融行业的生态格局。
Fintech在技术上带来的创新,对金融领域的业务模式、应用和产品产生了深刻的甚至颠覆性的影响。人工智能呼啸而来,催生了智能投顾、智能客服和智能风控等行业的发展。本书聚焦智能风控,结合人工智能技术解决金融行业最核心的问题——风险控制。进行风险控制的关键在于解决信息不对称性,信用评分卡模型是解决这一问题的关键策略。尤其是在金融领域积累了大量数据的前提下,为了充分发挥人工智能的优势,评分卡模型正在逐渐成为信用审核等环节的必要且倚重的手段,其发展前景不可估量。
纵观国内,智能风控领域的图书以信贷理论和业务指导类书籍居多,鲜有能帮助技术人员将业务需求落地实现的工程代码类书籍。本书旨在填补这一空缺,结合真实信贷数据,配合代码实践,引领读者从0至1地构建评分卡模型。
本书采用Python语言进行代码实战。Python在各行各业的应用越来越普及,从云端到客户端,再到物联网终端,Python应用无处不在。更为重要的是,Python语言是人工智能的首选编程语言,本书聚焦的智能风控领域,正是人工智能对金融数据的应用场景,对此,Python具有无可比拟的优势。关于Python语言实践和人工智能算法理论与实践的书籍颇为丰富,而结合信贷领域场景的算法应用类图书却比较稀缺,本书的出版将会改变这一现状。本书的核心内容包括算法理论与Python代码实践,旨在在构建评分卡的全流程内,先进行算法理论讲解,然后再进行代码实践,全面提升读者构建评分卡的理论造诣和工程能力。本书特色
1.深入剖析业务背景,易学易用
本书覆盖了大量的业务知识,并力争以对比的方式展现不同业务需求下的建模差异。
·介绍风控建模流程;
·以全生命周期为主线介绍不同模型的特点;
·对建模过程中的每一步都力求给出原因、思考思路和解决办法。
2.简明介绍机器学习的建模思想,覆盖广泛
本书力争以简明的语言阐述算法原理,并借助少量的公式推导让读者理解算法的实质,广泛覆盖大部分常用算法,梳理并对比不同算法族类的异同。
·详细介绍机器学习体系,并以整个建模流程为主线展开介绍;
·重点阐明算法思想,弱化繁杂的公式推导;
·力争以算法族为基础,比较同一问题的不同解决方法;
·由浅入深,从基本建模流程开始逐步介绍建模过程,进阶部分还介绍大量的复杂模
型以提升建模效果。
3.全程使用Python 3编程语言,通用、方便
本书用Python语言完成评分卡模型的代码编写,易学易用。
·评分卡实战章节的最后都会给出Python代码,方便读者学习和开发;
·算法部分以scikit-leam包为基础,对算法的关键参数力争给出详细说明,方便读者
调参;
·不同章节采用同一组实验数据,方便读者对比不同算法的实战效果;
·给出详细充足的代码注释,以方便读者理解。
4.真实数据建模,注重实战
本书最后一章以真实的数据为基础展示了完整的建模流程,注重提升读者从理论到实践的动手能力。
·以真实的数据为例,复现建模过程;
·阐明建模过程中需要注意的问题与处理方法;
·给出代码,实现从0到1的全流程代码实战。
目录
前言
第1篇 智能风控背景
第1章 金融科技介绍
1.1 金融科技的前世今生
1.2 金融科技正深刻地改变和塑造着金融业态
1.3 新兴科技不断强化金融科技的应用能力
1.4 金融风险控制面临着的挑战
1.5 智能风控和评分卡
1.6 评分卡模型的开发流程
第2章 机器学习介绍
2.1 机器学习的概念
2.2 机器学习的分类
2.2.1 有监督学习
2.2.2 无监督学习
2.2.3 强化学习
2.3 机器学习与人工智能的关系
2.4 机器学习与数学的关系
2.5 机器学习与深度学习
第3章 评分卡模型介绍
3.1 申请评分卡
3.1.1 数据获取
3.1.2 好坏样本定义
3.1.3 观察期与表现期确定
3.1.4 样本分层
3.1.5 数据清洗与预处理
3.1.6 特征工程
3.1.7 模型训练与优化
3.2 行为评分卡
3.2.1 数据获取
3.2.2 时间窗口
3.2.3 特征工程
3.3 催收评分卡
3.3.1 催收评分卡分类
3.3.2 催收策略
3.4 反欺诈模型
3.4.1 欺诈风险与信用风险比较
3.4.2 欺诈模型好坏样本定义
3.4.3 欺诈主体分析
3.4.4 反欺诈方法介绍
第2篇 评分卡理论与实战基础
第4章 数据清洗与预处理
4.1 数据集成
4.2 数据清洗
4.3 探索性数据分析
4.4 Python代码实践
4.4.1 数据集成
4.4.2 数据清洗
4.4.3 探索性数据分析
第5章 变量编码方法
5.1 无监督编码
5.1.1 One-hot编码
5.1.2 Dummy variable编码
5.1.3 Label编码
5.2 有监督编码
5.2.1 WOE编码
5.2.2 WOE编码与One-hot编码比较
5.3 Python代码实践
5.3.1 One-hot编码
5.3.2 Dummy variable编码
5.3.3 Label编码
5.3.4 WOE编码
第6章 变量分箱方法
6.1 变量分箱流程
6.2 优Chi-merge卡方分箱方法
6.3 Best-KS分箱方法
6.4 优IV分箱方法
6.5 基于树的优分箱方法
6.6 Python代码实践
6.6.1 优Chi-merge分箱
6.6.2 优IV分箱
6.6.3 基于树的分箱
第7章 变量选择
7.1 过滤法变量选择
7.2 包装法变量选择
7.3 嵌入法变量选择
7.4 Python代码实践
7.4.1 过滤法变量选择
7.4.2 包装法变量选择
7.4.3 嵌入法变量选择
第8章 Logistic回归模型
8.1 Logistic回归模型原理
8.2 过拟合与欠拟合
8.3 Python代码实践
第9章 模型的评估指标
9.1 正负样本的选择
9.2 标准评估指标
9.3 概率密度评估指标
9.4 概率分布评估指标
9.5 Python代码实践
第10章 评分卡分数转化
10.1 由概率到分数的转换
10.2 变量的分值计算
10.3 评分卡性能评估
10.4 Python代码实践
第11章 模型在线监控
11.1 稳定性监控
11.2 单调性监控
11.3 性能监控指标
11.4 Python代码实践
第3篇 评分卡理论与实战进阶
第12章 样本不均衡处理
12.1 数据层下采样样本不均衡的处理方法
12.1.1 随机下采样方法
12.1.2 样本邻域选择的下采样方法
12.1.3 样本邻域清理的下采样方法
12.1.4 Bagging集成的下采样方法
12.1.5 Boosting集成的下采样方法
12.2 数据层上采样样本不均衡的处理方法
12.2.1 随机上采样方法
12.2.2 SMOTE样本生成方法
12.2.3 Borderline-SMOTE样本生成方法
12.3 算法层样本不均衡的处理方法
12.4 模型评估层样本不均衡的处理方法
12.5 Python代码实践
12.5.1 数据层下采样样本不均衡处理代码实现
12.5.2 数据层上采样样本不均衡处理代码实现
第13章 特征工程进阶
13.1 数据层特征工程
13.2 算法层特征工程
13.2.1 基于树模型的特征生成
13.2.2 FM特征交
13.3 Python代码实践
13.3.1 数据层特征工程代码实现
13.3.2 算法层特征工程代码实现
第14章 决策树模型
14.1 决策树模型的原理
14.2 决策树学习
14.3 决策树与过拟合
14.4 Python代码实践
第15章 神经网络模型
15.1 神经元模型
15.2 神经网络的网络结构
15.3 神经网络的学习策略
15.4 Python代码实践
第16章 支持向量机模型
16.1 感知器模型
16.1.1 感知器模型的原理
16.1.2 感知器与支持向量机模型
16.2 线性可分支持向量机
16.3 线性支持向量机
16.4 非线性支持向量机
16.5 感知器相关模型比较
16.6 Python代码实践
16.6.1 线性支持向量机模型代码实现
16.6.2 非线性支持向量机模型代码实现
第17章 集成学习
17.1 Bagging与Boosting对比
17.2 Random Forest模型原理
17.3 Adaboost模型原理
17.4 GBDT模型原理
17.5 Xgboost模型原理
17.6 Python代码实践
17.6.1 Random Forest模型
17.6.2 Adaboost模型
17.6.3 GBDT模型
17.6.4 Xgboost模型
第18章 模型融合
18.1 Blending方法原理
18.2 Stacking方法原理
18.3 Python代码实践
18.3.1 Blending模型融合代码实现
18.3.2 Stacking模型融合代码实现
第4篇 Lending Club数据集实战
第19章 完整的模型开发实现
19.1 数据源介绍
19.2 数据的获取与预处理
19.2.1 数据准备
19.2.2 好坏样本定义
19.2.3 数据清洗与预处理
19.3 特征工程
19.3.1 简单的特征工程
19.3.2 变量分箱与编码
19.3.3 变量选择
19.4 模型构建与评估
19.4.1 模型构建与优化
19.4.2 模型评估
19.5 评分卡生成
附录A 主要符号表
附录B 开发环境简介
参考文献
短评
正版书籍,质量好,价格亲民,当天即到,给力!
2020-08-03 09:28:21
配送速度很快,书的内容也不错。
2020-07-11 21:54:54
?还可以,看个知识体系吧!
2020-06-25 10:16:07
很接地气的读物,非常实际的介绍
2020-06-15 12:18:08