数据处理器
书籍作者:NVIDIA |
ISBN:9787111731153 |
书籍语言:简体中文 |
连载状态:全集 |
电子书格式:pdf,txt,epub,mobi,azw3 |
下载次数:1333 |
创建日期:2024-04-24 |
发布日期:2024-04-24 |
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板 |
内容简介
本书定位为NVIDIA BlueField DPU和NVIDA DOCA的入门学习参考,内容涵盖DPU的简介、技术优势及未来技术发展路径,包括NVIDIA BlueField DPU在结构通用化、功能多样化、应用广泛化和场景丰富化方面的前景展望,NVIDA DOCA软件框架开发环境配置,以及基于NVIDIA BlueField DPU利用NVIDA DOCA软件框架的应用程序开发实践案例。读者可以通过本书对DPU硬件架构与软件开发有一个整体了解,学习如何启用NVIDIA BlueField DPU以及搭建NVIDIA DOCA软件开发环境,并通过深入了解NVIDIA DOCA应用程序开发用例来掌握如何实现软件定义、硬件加速数据中心基础设施的应用程序或服务,并据此开启自己的开发之旅。
编辑推荐
适读人群 :对新一代数据计算单元感兴趣的读者
随着人工智能、大数据、5G等数字化技术在全球全产业中的持续发展和不断渗透,虚拟化推进了软件定义数据中心的发展,使业务应用变得更灵活,使运维管理变得更简便;微服务推进了业务应用程序的解耦,使得数据中心东西数据流量暴增;深度学习推进了GPU加速计算的应用,使得服务器面临数据吞吐量的挑战。因此,基础设施逐步成为数据中心工作负载之一,网络负载也呈现指数级增长,网络、存储、安全、虚拟化、容器等数据中心基础设施操作成为数据中心的瓶颈。
NVIDIA BlueField DPU的出现提供了一个很好的解决方案,把数据中心基础设施操作从CPU卸载到BlueField DPU上,让CPU和GPU算力集中到业务应用程序和业务负载上,产生更大的算力价值。通过卸载、加速、隔离数据中心基础设施,BlueField DPU使基础设施操作独立于CPU和GPU,实现了软件定义、硬件加速数据中心基础设施,以统一的数据中心架构作为单元进行管理,并与CPU和GPU共同形成了新一代数据中心的三大支柱,适应未来各种规模的云、数据中心或边缘计算等部署环境,为各种工作负载提供安全加速的基础设施。
前言
随着云计算的蓬勃发展,越来越多的企业和组织选择将业务迁移到云端,以获得更加稳定和安全的服务,同时大幅降低IT运维的成本。云计算带来了大量的数据流量和计算负载,这给数据中心的网络基础设施和数据处理能力带来了很大的挑战。另外,随着深度学习技术的成熟、GPU算力的提升以及大量训练数据的获取,人工智能(AI)类应用得到了蓬勃发展。AI类工作负载在数据中心中的计算占比也在显著上升,这对数据中心的数据处理能力提出了更高的要求。DPU(Data Processing Unit)的出现正好能满足这些需求。
DPU是一种相对较新的芯片类型,伴随着云计算和人工智能的快速发展应运而生。它的出现改变了数据中心的运行方式,使得数据中心的网络基础设施变得更加智能、高效和安全。NVIDIA BlueField DPU可以与CPU和GPU等处理芯片以及其他设备协同工作,紧密配合,实现数据处理任务在多个芯片之间的优化、分配和协调,进一步释放CPU的处理能力,最小化延迟,从而提高数据中心集群的整体数据处理性能。另外,NVIDIA BlueField DPU还能够让IT人员更有效地管理、监控和维护数据中心,从而简化数据中心运营流程,同时提供先进、强大的安全功能,助力保护数据安全和隐私。在数据中心中,DPU扮演着越来越重要的角色。
NVIDIA DOCA是加速NVIDIA BlueField DPU应用程序开发的软件框架。DOCA之于BlueField DPU,就好比CUDA之于NVIDIA GPU。DOCA提供了一系列的工具、服务、API和开发库,支持面向网络数据包处理的硬件卸载和加速、面向存储的开发套件及SNAP服务、面向安全加速的工具及开发库,以及面向虚拟化的设备模拟等。NVIDIA DOCA为基于NVIDIA BlueField DPU进行开发的开发者提供了广泛、深入的应用程序开发支持,极大地简化了开发流程。NVIDIA DOCA的出现使得面向数据中心网络基础设施的编程变得更加高效、简单和灵活。
本书是为使用NVIDIA BlueField DPU和NVIDIA DOCA的开发人员和数据科学家提供的实用指南。除了必要的概念和背景介绍,本书还结合很多DPU实际落地场景给出了翔实的操作教程。无论你是资深开发人员,还是刚开始接触NVIDIA BlueField DPU的应用程序开发者,都能从本书中找到所需的必要知识。通过阅读本书,你会更深刻地理解NVIDIA BlueField DPU和NVIDIA DOCA,以及如何利用与它们相关的强大的软硬件技术来构建云和AI应用所需的数据中心网络基础设施。
赖俊杰
NVIDIA中国区工程和解决方案高级总监
目录
目 录
序
在线资源
致谢
第一部分 DPU的技术发展背景
第1章 现代数据中心基础设施变革2
1.1 现代数据中心面临的全新挑战2
1.2 DPU的提出与演进6
1.2.1 DPU定义的提出6
1.2.2 DPU演进的核心驱动力7
1.3 DPU的应用场景与价值10
1.4 DPU应用优势12
本章小结13
第二部分 NVIDIA BlueField DPU概述及应用
第2章 NVIDIA BlueField DPU概述16
2.1 NVIDIA BlueField DPU产品简介16
2.1.1 软件定义网络加速17
2.1.2 软件定义存储加速18
2.1.3 安全加速19
2.2 NVIDIA BlueField-3 DPU技术特性21
2.2.1 NVIDIA BlueField-3 DPU技术规格22
2.2.2 NVIDIA BlueField-3 DPU产品线24
2.3 NVIDIA BlueField-3 DPU的用例25
2.3.1 云原生超级计算25
2.3.2 数据科学与人工智能26
2.3.3 视频流27
2.3.4 边缘的智能服务29
本章小结29
第3章 NVIDIA BlueField DPU的安装和使用30
3.1 NVIDIA BlueField DPU的工作模式30
3.1.1 DPU模式31
3.1.2 零信任DPU模式32
3.1.3 NIC模式33
3.2 NVIDIA BlueField DPU的硬件安装35
3.2.1 NVIDIA BlueField DPU的硬件单元35
3.2.2 NVIDIA BlueField DPU的使用环境要求38
3.2.3 硬件安装前准备41
3.2.4 硬件安装42
3.2.5 网络接口线缆安装44
3.3 NVIDIA BlueField DPU的BFB安装45
3.3.1 什么是BFB45
3.3.2 通过主机Rshim安装45
3.3.3 通过BMC Rshim安装47
3.3.4 通过PXE安装47
3.3.5 安装后上电检查50
3.4 使用NVIDIA SDK管理器图形界面进行安装52
3.4.1 NVIDIA SDK管理器的下载和安装52
3.4.2 NVIDIA SDK管理器的图形界面53
3.5 NVIDIA BlueField DPU的管理57
3.5.1 通过主机Rshim登录DPU57
3.5.2 在主机端查看DPU日志58
3.5.3 DPU BMC59
3.5.4 BMC管理DPU常用的命令60
3.5.5 带外登录DPU61
3.5.6 带内登录DPU61
本章小结62
第4章 NVIDIA BlueField DPU上的网络卸载63
4.1 NVIDIA BlueField DPU上的网络设备63
4.1.1 物理网络设备和虚拟网络设备64
4.1.2 VirtIO-net网络设备65
4.2 代表口模型69
4.2.1 为何引入代表口70
4.2.2 代表口对应的接口及其创建71
4.2.3 代表口与OVS72
4.3 OVS的卸载和加速72
4.3.1 实现OVS卸载的基本思路73
4.3.2 OVS卸载的概要配置75
4.3.3 流表的监控及软硬件同步77
4.3.4 硬件上的灵活性保证79
4.4 连接跟踪79
4.4.1 连接跟踪卸载的软硬件同步设计80
4.4.2 连接跟踪卸载的配置81
4.5 可扩展网络设备82
4.5.1 环境准备83
4.5.2 SF设备的使用和管理83
本章小结86
第5章 NVIDIA BlueField DPU上的SNAP技术87
5.1 什么是SNAP技术87
5.2 SNAP的工作模式89
5.2.1 SNAP的配置部署89
5.2.2 SNAP无卸载模式91
5.2.3 SNAP直通模式92
5.2.4 SNAP全卸载模式93
5.2.5 SNAP模拟VirtIO-blk设备95
5.3 SNAP技术的应用场景96
5.3.1 高效的云存储97
5.3.2 实现裸金属云的关键技术98
5.3.3 企业级业务存储扩展99
5.4 SNAP技术和用户存储系统的集成100
设备模拟SDK101
本章小结104
第三部分 NVIDIA DOCA概述及开发体验
第6章 NVIDIA DOCA概述106
6.1 NVIDIA DOCA的定义及发展历程106
6.1.1 什么是NVIDIA DOCA106
6.1.2 持续演进与迭代的NVIDIA DOCA 107
6.1.3 NVIDIA DOCA加速开放数据中心创新111
6.2 NVIDIA DOCA软件框架组成112
6.3 NVIDIA DOCA开发环境115
6.3.1 硬件配置及互连115
6.3.2 软件安装116
6.4 NVIDIA DOCA服务116
6.4.1 DOCA HBN服务117
6.4.2 DOCA Firefly精准计时服务124
6.4.3 DOCA遥测服务125
6.4.4 DOCA数据流检测器服务126
6.5 NVIDIA零信任安全框架127
6.5.1 NVIDIA零信任网络安全平台127
6.5.2 NVIDIA BlueField DPU提供网络安全基础128
6.5.3 基于NVIDIA DOCA的零信任网络安全框架129
6.5.4 结合NVIDIA Morpheus增强网络威胁检测130
本章小结130
第7章 NVIDIA DOCA开发环境体验131
7.1 DOCA使用模式131
7.2 DOCA驱动和DOCA库的关系133
7.3 DOCA驱动134
7.3.1 DPDK134
7.3.2 ASAP2135
7.3.3 SPDK135
7.3.4 RDMA136
7.3.5 UCX136
7.4 DOCA库136
7.4.1 DOCA核心库137
7.4.2 DOCA Flow138
7.4.3 DOCA DPI140
7.4.4 DOCA App Shield141
7.5 DOCA应用程序卸载示例141
本章小结143
第四部分 NVIDIA DOCA开发实践
第8章 基于NVIDIA BlueField DPU的DOCA应用146
8.1 DOCA应用概述146
8.2 应用识别149
8.2.1 AR应用架构149
8.2.2 AR应用的系统配置150
8.2.3 运行AR应用152
8.2.4 AR应用相关的其他介绍153
8.2.5 参考资料153
8.3 DNS过滤153
8.3.1 DNS过滤应用架构155
8.3.2 DNS过滤应用的系统配置156
8.3.3 运行DNS过滤应用157
8.3.4 DNS过滤应用相关的其他介绍157
8.3.5 参考资料158
8.4 入侵防御系统158
8.4.1 IPS应用架构158
8.4.2 IPS应用的配置159
8.4.3 运行IPS应用161
8.4.4 IPS应用相关的其他介绍163
8.4.5 参考资料163
8.5 安全通道164
8.5.1 安全通道应用架构164
8.5.2 运行安全通道应用166
8.5.3 参考资料166
本章小结166
第五部分 生态体系与网络平台
第9章 NVIDIA DOCA生态体系解决方案168
9.1 平台基础设施解决方案168
9.1.1 VMware vSphere分布式服务引擎169
9.1.2 Red Hat OpenShift170
9.1.3 Arista Unified Cloud Fabric172
9.2 存储解决方案175
9.2.1 极客天成高性能软件定义存储176
9.2.2 UCloud高可用、弹性扩展的云盘存储179
9.3 网络安全解决方案181
9.3.1 Palo Alto新一代防火墙181
9.3.2 Guardicore Centra安全平台182
9.3.3 Custodio CyVestiGO安全调查平台184
9.4 边缘计算解决方案185
9.4.1 DPU与5G Aerial188
9.4.2 DPU的边缘UPF加速192
本章小结194
第10章 网络平台及融合加速器产品195
10.1 NVIDIA Quantum-2 InfiniBand网络平台195
10.1.1 Quantum-2网络平台的超高性能与云原生功能196
10.1.2 Quantum-2 InfiniBand交换机197
10.1.3 ConnectX-7和BlueField-3 DPU198
10.2 NVIDIA Spectrum-4以太网网络平台199
10.2.1 Spectrum-4以太网交换机200
10.2.2 Spectrum以太网网络平台生态系统202
10.3 NVIDIA融合加速器203
10.3.1 融合加速器的架构204
10.3.2 融合加速器的特点204
10.3.3 融合加速器产品206
10.3.4 开发者生态系统206
本章小结207
术语表208