猜你喜欢
Linux开源存储全栈详解:从Ceph到容器存储

Linux开源存储全栈详解:从Ceph到容器存储

书籍作者:英特尔亚太研发有限公司 ISBN:9787121369797
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:4836
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

本书致力于帮助读者形成有关Linux开源存储世界的细致的拓扑,从存储硬件、Linux存储堆栈、存储加速、存储安全、存储管理、分布式存储、云存储等各个角度与层次展开讨论,同时对处于主导地位的、较为流行的开源存储项目进行阐述,包括SPDK、ISA-L、OpenSDS、Ceph、OpenStack Swift与Cinder、容器存储等。本书内容基本不涉及具体源码,主要围绕各个项目的起源与发展、实现原理与框架、要解决的网络问题等方面展开讨论,致力于帮助读者对Linux开源存储技术的实现与发展形成整体清晰的认识。本书语言通俗易懂,能够带领读者快速走入Linux开源存储的世界并作出自己的贡献。

作者简介

英特尔开源技术中心负责英特尔的开源技术中心的开源工作,英特尔的工程师都参与其中。您可以在一个地方找到我们维护和贡献的项目,从Linux内核到云编排,到ClearLinux和KATA容器等重点项目。每个项目都有自己的部分,在那里可以很容易地了解项目并参与到我们的全球社区中。

编辑推荐
适读人群 :本书适合希望能够参与Linux开源存储项目开发的读者,也适合互联网应用的开发者、架构师和创业者参考,尤其可作为互联网架构师们的开源技术典籍。

SPDK、ISA-L、OpenSDS、Ceph、OpenStack Swift与Cinder、容器存储等,Linux开源存储世界探险之旅从此开启!

《Linux开源存储全栈详解:从Ceph到容器存储》致力于帮助读者形成有关Linux开源存储世界的细致的拓扑,从存储硬件、Linux存储堆栈、存储加速、存储安全、存储管理、分布式存储、云存储等各个角度与层次展开讨论,同时对处于主导地位的、较为流行的开源存储项目进行阐述,包括SPDK、ISA-L、OpenSDS、Ceph、OpenStack Swift与Cinder、容器存储等。

? 存储硬件

? Linux存储堆栈

? 存储加速

? 存储安全

? 存储管理

? 分布式存储

? 云存储


前言

自1991年Linux诞生,时间已经走过了近三十年。即将而立之年的Limix早已没有初生时的稚气,它正在各个领域展示自己成熟的魅力。以Linux为基础,各种开源生态,如网络、存储都出现了。而生态离不开形形色色的 开源项目,在人人谈开源的今天,一个又一个知名的开源项目正在全球快速生长。当然, 本书的主题仅限于Linux开源存储生态,面对其中一个又一个扑面而来且快速更迭的新项目、新名词,我们会有一种紧迫感,想去了解它们背后的故事,也会有一定的动力想要踏上Linux开源存储世界的旅程。而无论是否强迫,面对这样的一段旅程,我们心底浮现的最为愉悦的开场白或许应该是:“说实话,我学习的热情从来都没有低落过。JustforFun.”

正如Linus在自己的自传Fim中所希望的那样。

面对Linux开源存储这么一个庞大而又杂乱的世界,让人最为惴惴不安的问題或许便 是:我该如何更快、更好地适应这个全新的世界?人工智能与机器学习领域里研究的一个很重要的问题是,“为什么我们小时候有人牵一匹马告诉我们那是马,于是之后我们看到其他的马就知道那是马了? ”针对这个问题的一个结论是:我们在头脑里形成了一种生物关系的拓扑结构,我们所认知的各种生物都会放进这个拓扑结构里,而生物不断成长的过程就是形成并完善各种各样的或树形、或环形等拓扑结构的过程,并以此来认知我们所面对的各种新事物。

由此可见,或许我们认知Linux开源存储世界最快也最为自然的方式就是努力在脑海 里形成它的拓扑结构,并不断细化,比如这个生态包括什么样的层次,每个层次里又有什么样的项目去实现,各个项目又实现了哪些服务及功能,这些功能又是以什么样的方式实现的,等等。对于感兴趣的项目,我们可以更为细致地去勾勒其中的脉络,就好似我们头 脑里形成的有关一个城市的地图,它有哪些区,区里又有哪些标志性建筑及街道,对于熟 悉的地方,我们甚至可以将它的周围放大并细化到一个微不足道的角落。

本书的组织形式

本书正是为帮助读者形成有关Linux开源存储世界的细致拓扑而组织的^

第1章主要对Linux开源存储的生态进行整体描述,包括开源存储领域研究的热点方 向、相关的开源基金会等。

第2章从存储硬件的角度介绍了存储技术的发展历史,包括存储介质的进化、存储协 议的更新等。

第3章作为整个Linux开源存储世界的基础,描述了 Linux存储栈(Linux Storage Stack),对I/O在Linux内核里的处理流程及所涉及的主要模块进行介绍。

第4~9章的内容分别从存储加速、存储安全、存储管理与软件定义存储、分布式存 储与Ceph、OpenSteck存储、容器存储等角度与层次对处于主导地位的、较为流行的项目 进行介绍,以帮助读者对相应项目形成比较细致的拓扑。

第4章讲解了存储领域的加速技术,包括FPGA、QAT、NVDIMM等硬件加速技术, 以及ISA-L、SPDK等开源的软件加速方案。

第5章从可用性、可靠性、数据完整性、访问控制、加密与解密等方面讨论了存储安 全问题。

第6章介绍存储管理与软件定义存储方面的主要开源项目,包括OpenSDS、 Libvirt 等。

第7章讨论分布式存储并详细介绍了目前流行的开源分布式存储项目Ceph的设计 与实现。

第8章与第9章分别对OpenStack与Kubemetes两种主要云平台中的存储支持进 行讨论。

感谢

作为英特尔的开源技术中心,参与各个Linux开源存储项目的开发与推广是再自然不 过的事情了。除了为各个开源项目的完善与稳定贡献更多的思考和代码,我们还希望通过这本书让更多的人更快地融入Linux开源存储世界的大家庭。

如果没有Sandra Rivera (英特尔髙级副总裁兼网络平台事业部总经理)、ImadSousou (英特尔公司副总栽兼系统软件产品部总经理)、Mark Skarpness (英特尔系统软件产品部 副总裁兼数据中心系统软件总经理)、Timmy Labatte (英特尔网络平台事业部副总裁兼 软件工程总经理)、练丽萍(英特尔系统软件产品部网络与存储研发总监)、冯晓焰(英 特尔系统软件产品部安卓系统工程研发总监)、周林(英特尔网络平台事业部中国区软件 开发总监)、梁冰(英特尔系统软件产品部市场总监)、王庆(英特尔系统软件产品部网 络与存储研发经理)的支持,这本书不可能完成,谨在此感谢他们在本书编写过程中给予 的关怀与帮助。

感谢本书编辑孙学瑛老师,从选题到最后的定稿,在整个过程中,都给予我们无私的 帮助和指导。

感谢参与各章内容编写的各位同事,他们是李晓燕、程盈心、马建朋、尚德浩、胡伟、 刘春梅、任桥伟、杨子夜、曹刚、刘长鹏、刘孝冬、惠春阳、万群、闰亮、周雁波、徐雯 的。为了本书的顺利完成,他们付出了很多努力。

感谢所有对Linux开源存储技术抱有兴趣或从事各个Linux开源存储项目工作的人, 没有你们提供的源码与大量技术资料,本书便会成为无源之水。


目录

第1章 Linux开源存储 1
1.1 Linux和开源存储 1
1.1.1 为什么需要开源存储 3
1.1.2 Linux开源存储技术原理和解决方案 6
1.2 Linux开源存储系统方案介绍 8
1.2.1 Linux单节点存储方案 8
1.2.2 存储服务的分类 11
1.2.3 数据压缩 13
1.2.4 重复数据删除 16
1.2.5 开源云计算数据存储平台 27
1.2.6 存储管理和软件定义存储 29
1.2.7 开源分布式存储和大数据解决方案 33
1.2.8 开源文档管理系统 37
1.2.9 网络功能虚拟化存储 39
1.2.10 虚拟机/容器存储 40
1.2.11 数据保护 43
1.3 三大顶级基金会 44
第2章 存储硬件与协议 47
2.1 存储设备的历史轨迹 47
2.2 存储介质的进化 53
2.2.1 3D NAND 53
2.2.2 3D XPoint 55
2.2.3 Intel Optane 58
2.3 存储接口协议的演变 59
2.4 网络存储技术 62
第3章 Linux存储栈 67
3.1 Linux存储系统概述 67
3.2 系统调用 69
3.3 文件系统 72
3.3.1 文件系统概述 73
3.3.2 Btrfs 75
3.4 Page Cache 80
3.5 Direct I/O 82
3.6 块层(Block Layer) 83
3.6.1 bio与request 84
3.6.2 I/O调度 86
3.6.3 I/O合并 88
3.7 LVM 90
3.8 bcache 93
3.9 DRBD 96
第4章 存储加速 99
4.1 基于CPU处理器的加速和优化方案 100
4.2 基于协处理器或其他硬件的加速方案 103
4.2.1 FPGA加速 103
4.2.2 智能网卡加速 105
4.2.3 Intel QAT 107
4.2.4 NVDIMM为存储加速 110
4.3 智能存储加速库(ISA-L) 111
4.3.1 数据保护:纠删码与磁盘阵列 112
4.3.2 数据安全:哈希 113
4.3.3 数据完整性:循环冗余校验码 115
4.3.4 数据压缩:IGZIP 116
4.3.5 数据加密 117
4.4 存储性能软件加速库(SPDK) 117
4.4.1 SPDK NVMe驱动 119
4.4.2 SPDK应用框架 133
4.4.3 SPDK用户态块设备层 136
4.4.4 SPDK vhost target 150
4.4.5 SPDK iSCSI Target 156
4.4.6 SPDK NVMe-oF Target 163
4.4.7 SPDK RPC 165
4.4.8 SPDK生态工具介绍 172
第5章 存储安全 181
5.1 可用性 181
5.1.1 SLA 181
5.1.2 MTTR、MTTF和MTBF 182
5.1.3 高可用方案 183
5.2 可靠性 185
5.2.1 磁盘阵列 186
5.2.2 纠删码 187
5.3 数据完整性 188
5.4 访问控制 189
5.5 加密与解密 191
第6章 存储管理与软件定义存储 194
6.1 OpenSDS 194
6.1.1 OpenSDS社区 195
6.1.2 OpenSDS架构 195
6.1.3 OpenSDS应用场景 198
6.1.4 与Kubernetes集成 200
6.1.5 与OpenStack集成 200
6.2 Libvirt存储管理 201
6.2.1 Libvirt介绍 201
6.2.2 Libvirt存储池和存储卷 205
第7章 分布式存储与Ceph 206
7.1 Ceph体系结构 209
7.1.1 对象存储 211
7.1.2 RADOS 212
7.1.3 OSD 212
7.1.4 数据寻址 214
7.1.5 存储池 219
7.1.6 Monitor 220
7.1.7 数据操作流程 227
7.1.8 Cache Tiering 228
7.1.9 块存储 230
7.1.10 Ceph FS 232
7.2 后端存储ObjectStore 235
7.2.1 FileStore 236
7.2.2 BlueStore 240
7.2.3 SeaStore 243
7.3 CRUSH算法 244
7.3.1 CRUSH算法的基本特性 244
7.3.2 CRUSH算法中的设备位置及状态 246
7.3.3 CRUSH中的规则与算法细节 249
7.3.4 CRUSH算法实践 254
7.3.5 CRUSH算法在Ceph中的应用 261
7.4 Ceph可靠性 262
7.4.1 OSD多副本 263
7.4.2 OSD纠删码 264
7.4.3 RBD mirror 265
7.4.4 RBD Snapshot 267
7.4.5 Ceph数据恢复 271
7.4.6 Ceph一致性 274
7.4.7 Ceph Scrub机制 278
7.5 Ceph中的缓存 279
7.5.1 RBDCache具体实现 285
7.5.2 固态硬盘用作缓存 287
7.6 Ceph加密和压缩 289
7.6.1 加密 289
7.6.2 压缩 291
7.6.3 加密和压缩的加速 294
7.7 QoS 294
7.7.1 前端QoS 294
7.7.2 后端QoS 295
7.7.3 dmClock客户端 297
7.8 Ceph性能测试与分析 298
7.8.1 集群性能测试 299
7.8.2 集群性能数据 304
7.8.3 综合测试分析工具 307
7.8.4 高级话题 311
7.9 Ceph与OpenStack 315
第8章 OpenStack存储 318
8.1 Swift 321
8.1.1 Swift体系结构 321
8.1.2 环 327
8.1.3 Swift API 330
8.1.4 认证 331
8.1.5 对象管理与操作 333
8.1.6 数据一致性 337
8.2 Cinder 338
8.2.1 Cinder体系结构 338
8.2.2 Cinder API 341
8.2.3 cinder-scheduler 342
8.2.4 cinder-volume 343
8.2.5 cinder-backup 347
第9章 容器存储 348
9.1 容器 348
9.1.1 容器技术框架 350
9.1.2 Docker 353
9.1.3 容器与镜像 355
9.2 Docker存储 356
9.2.1 临时存储 357
9.2.2 持久化存储 366
9.3 Kubernetes存储 369
9.3.1 Kubernetes核心概念 370
9.3.2 Kubernetes数据卷管理 376
9.3.3 Kubernetes CSI 380

产品特色