猜你喜欢
数据隐私与数据治理

数据隐私与数据治理

书籍作者:孟小峰 ISBN:9787111728184
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:1592
创建日期:2024-04-30 发布日期:2024-04-30
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介
本书以《中华人民共和国数据安全法》和《中华人民共和国个人信息保护
法》为背景,旨在从概念和技术的角度对数据隐私与数据治理进行系统概述。
首篇从历史与系统的角度介绍数据隐私与数据治理的基础,后三篇分别侧重大
规模数据收集、机器学习,以及数据治理中的隐私问题,介绍其相应的技术基
础,总结当下的关键问题与技术方案。本书从全新的数据生态的角度介绍数据
隐私与数据治理,在内容介绍上,以技术与算法的讲解为主,辅以案例,详略
得当。
编辑推荐
适读人群 :本书既可以供技术人员查阅,亦可以供感兴趣的普通用户阅读,建立对数 据隐私与数据治理的基本认识,培养数据素养。
本书以《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》为背景,旨在从概念和技术的角度对数据隐私与数据治理进行系统概述。篇从历史与系统的角度介绍数据隐私与数据治理的基础,第二到四篇分别侧重大规模数据收集、机器学习,以及数据治理中的隐私问题,介绍其相应的技术基础,总结当下的关键问题与技术方案。本书从全新的数据生态的角度介绍数据隐私与数据治理,在内容介绍上,以技术与算法的讲解为主,辅以案例,详略得当。本书既可以供技术人员查阅,亦可以供感兴趣的普通用户阅读,建立对数据隐私与数据治理的基本认识,培养数据素养。
前言
前言

2021年可以说是数据隐私与数据治理元年。社会各界都在觉醒,并探讨其规范与解决方案,这与2006年我开始关注这个问题时的社会环境大不相同!
在数据隐私方面,《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》相继出台,全面、多领域构筑了我国信息与数据安全的法律保障,隐私问题不再是模糊不清的法外之地。在数据治理方面,《“十四五”数字经济发展规划》《互联网信息服务算法推荐管理规定》分别关注了数据与算法中的治理问题。而继《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》提出将数据纳入生产要素后,中共中央网络安全和信息化委员会办公室更是在《“十四五”国家信息化规划》中进一步提出“加强数据治理”。
紧随国家的战略导向,企业也在不断尝试。在数据隐私方面,小米等手机厂商突破性地在系统中内置拦截网和隐匿面具等隐私功能,为用户隐私保驾护航。
如何将数据隐私与数据治理从法律文字落到实际应用仍不明晰,诸多问题依赖“行业自律”,而大多数企业仅聚焦于“合规”问题。社会各界都翘首以盼一套系统讲述数据隐私与数据治理概念和技术的读本!这正是本书关注的重点,以期对当下数据要素驱动下的数字经济所面临的数据挑战给出基本的应对之策。
本书由笔者的团队依据多年的研究编写而成,旨在从概念和技术的角度对数据隐私与数据治理进行系统阐述,为学术研究机构、政府部门、企业等梳理数据隐私与数据治理的知识体系提供入口,为提高全民的数据素养提供辅导材料。同时,要厘清问题,解决问题,需要从提升大家的“数据素养”着手。数据素养未来可能是科学素养的重要组成部分,而数据素养首要的任务就是让大家具备对数据与隐私的认识和处置能力。这也是促使我们编写此书的直接动力!
本书从四个方面对数据隐私与数据治理进行了深入浅出的论述。
第一篇“基础知识”,主要阐述数据隐私与治理的基础概念与方法体系。该篇基于对数据发展主线的认识,揭示数据隐私和治理产生的根源,并结合当下应用现状概述隐私的构成要素、管理框架、治理体系和治理实践。其核心要点是针对数据要素和数字经济,提出数据隐私要由被动保护变为主动防护,数据治理要由大数据全生命周期治理转变为后大数据时代的数据生态治理,更好地服务数字经济的发展。该篇内容尽可能减少晦涩的专业定理与描述,从多角度讲解数据隐私与数据治理,既可以帮助相关专业的技术人员建立完善的隐私保护与数据治理体系,也可以供普通用户阅读以增加认知。
第二篇“大数据隐私保护技术”,主要阐述面向共享与发布的隐私保护技术。该篇重点介绍当下主流的隐私保护技术,包括云平台场景下中心化的差分隐私技术,边缘计算场景下本地化的差分隐私技术,以及为提高数据可用性的隐私放大理论、差分隐私与密码学相结合的混合方法等。该篇内容较为专业翔实,具备前沿性,主要面向该方向的专业人员。
第三篇“人工智能隐私保护技术”,主要阐述面向机器学习模型的隐私保护技术。该篇重点介绍集中式机器学习和联邦学习两种场景下的隐私方法设计,包括机器学习中存在的因数据非法窃取导致的直接隐私泄露问题和因外部隐私攻击导致的间接隐私泄露问题,以及为提高模型可用性的个性化差分隐私方法。该篇内容与机器学习密切相关,具备前沿性,主要面向该方向的专业人员。
第四篇“数据生态与数据治理”,主要阐述面向数据市场和数据生态的治理技术。该篇基于数据要素的发展理念,重点介绍数据市场中数据交易与数据流通治理体系,以及数据生态中数据垄断、算法公平的治理方法。其核心要点是要建立数据透明的治理体系,实现对数据全链条、透明化的监督治理,做到治理的事前预警、事中防护、事后溯源,为数字经济的发展保驾护航。该篇内容从全新的视角介绍数据作为生产要素在市场流通中会产生的诸多问题,探讨其可能的解决方案,可供相关领域的专业人员、政务人员,以及普通用户阅读,帮助他们全面认识数据治理。
总之,本书梳理了数据隐私与数据治理的基本解决之道,并打破传统的认知体系,实现观念、技术、架构的转变,即观念上从数据生命周期观到数据生态观的转变、技术上从隐私保护到隐私防护(管理)的转变和架构上从溯源问责到数据透明的转变,才能跟上形势,从而保证数据要素在市场中发挥关键作用。希望本书为教育机构的人才培养和政府部门的管理提供有价值的参考资料,促进我国数字经济的发展。
该书构思于2020年年初,笔者与团队中的王雷霞、刘俊旭、范卓娅、叶青青、刘立新和李梓童一起,历经数次编撰、修改,形成了当前的版本。笔者团队尽可能将本书中所涉及的内容描述得清晰易懂,如有疑惑,可联系笔者团队进行交流。希望大家都能从本书中有所收获,能更加清晰地看到生活中无处不在的隐私问题,亦能有所行动!

孟小峰
中国人民大学
2023年1月1日
目录

前言
第一篇基础知识
第1章绪论2
1.1数据隐私的产生2
1.1.1社会发展视角下的隐私3
1.1.2数据发展视角下的隐私6
1.2数据隐私技术7
1.2.1模糊技术7
1.2.2扰动技术8
1.2.3加密技术9
1.2.4混合隐私技术10
1.2.5分布式计算框架11
1.2.6区块链技术12
1.2.7技术的比较12
1.3数据隐私面临的挑战13
1.3.1大数据隐私挑战13
1.3.2人工智能隐私挑战15
1.3.3数据治理挑战16
1.4小结18
参考文献19
第2章数据隐私的概念21
2.1引言21
2.2数据隐私的定义与特征22
2.2.1数据隐私的定义22
2.2.2数据隐私的基本特征22
2.2.3数据隐私和信息安全的区别22
2.3数据隐私的分类24
2.3.1数据隐私的构成要素24
2.3.2显式隐私与隐式隐私24
2.3.3数据隐私保护场景26
2.4数据隐私的框架29
2.4.1隐私风险监测31
2.4.2隐私风险评估31
2.4.3隐私主动管理32
2.4.4隐私溯源问责32
2.4.5法律法规保障33
2.5小结34
参考文献34
第3章数据治理的概念36
3.1引言36
3.2数据治理的体系38
3.3数据治理的法律法规39
3.4数据治理的实践42
3.5小结43
参考文献43
第二篇大数据隐私保护技术
第4章差分隐私方法46
4.1基础知识46
4.1.1基本定义47
4.1.2基础性质48
4.1.3常用扰动机制50
4.1.4应用场景53
4.2面向数据发布的隐私保护53
4.2.1直方图数据发布54
4.2.2划分发布58
4.3面向数据分析的隐私保护61
4.3.1分类分析61
4.3.2频繁模式挖掘62
4.3.3回归分析63
4.4小结65
参考文献65
第5章本地化差分隐私方法68
5.1基础知识69
5.1.1基本定义69
5.1.2基础性质70
5.1.3常用扰动机制71
5.1.4应用场景72
5.2基于简单数据集的隐私保护74
5.2.1频率统计74
5.2.2均值统计75
5.3基于复杂数据集的隐私保护77
5.3.1键值对数据的收集与发布78
5.3.2图数据的收集与发布81
5.3.3时序数据的收集与发布84
5.4小结86
参考文献87
第6章差分隐私与实用性89
6.1引言90
6.2隐私放大理论与方法91
6.2.1基于二次采样的隐私放大方法91
6.2.2基于混洗的隐私放大方法93
6.2.3其他隐私放大方法95
6.3差分隐私与密码学方法的结合95
6.3.1密码学方法改进差分隐私效用95
6.3.2差分隐私改进密码学协议效率100
6.4一种隐私实用化框架103
6.4.1ESA框架与定义103
6.4.2ESA中的隐私放大107
6.4.3混洗差分隐私方法108
6.5小结111
参考文献111
第三篇人工智能隐私保护技术
第7章机器学习中的隐私保护116
7.1引言117
7.2机器学习的隐私保护119
7.2.1同态加密119
7.2.2差分隐私119
7.3统计学习的隐私保护120
7.4深度学习的隐私保护124
7.4.1隐私算法设计124
7.4.2隐私风险分析125
7.5小结127
参考文献127
第8章联邦学习中的隐私保护129
8.1引言129
8.2隐私保护的联邦学习架构133
8.3基于差分隐私的联邦学习135
8.4基于安全聚合的联邦学习136
8.5个性化隐私保护与联邦学习138
8.5.1个性化隐私保护139
8.5.2个性化隐私保护的联邦学习141
8.6小结142
参考文献142
第四篇数据生态与数据治理
第9章数据要素市场146
9.1引言146
9.2数据交易148
9.2.1免费交易框架148
9.2.2付费交易框架149
9.2.3模型交易框架150
9.3数据流通152
9.4小结154
参考文献154
第10章数据垄断155
10.1引言155
10.2数据垄断现状157
10.2.1定义与概念157
10.2.2总体状况158
10.2.3详情分析159
10.3数据垄断的成因与危害160
10.3.1垄断成因160
10.3.2垄断危害161
10.4数据垄断治理模式162
10.4.1局部模式162
10.4.2中介模式163
10.4.3全局模式164
10.5小结165
参考文献165
第11章数据公平166
11.1引言166
11.2对公平的理解167
11.3公平计算方法168
11.3.1蛋糕分割问题168
11.3.2价格歧视问题169
11.3.3算法偏见问题170
11.3.4数据偏见问题171
11.4小结172
参考文献172
第12章数据透明174
12.1引言174
12.2数据透明的概念175
12.3数据透明框架176
12.4基于区块链的数据透明方案178
12.4.1数据获取与共享透明179
12.4.2数据云存储服务透明181
12.4.3数据决策透明183
12.5小结184