数字图像的计算几何、拓扑和物理及其应用

书籍作者：詹姆斯·彼得斯	ISBN：9787302626916
书籍语言：简体中文	连载状态：全集
电子书格式：pdf,txt,epub,mobi,azw3	下载次数：8940
创建日期：2024-04-16	发布日期：2024-04-16
运行环境：PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板

内容简介

本书对视觉场景中有关计算几何学、拓扑学和物理学的内容进行了全面和深入介绍，有助于从数学和物理的角度来认识许多图像技术。本书主要内容围绕对目标形状信息的检测、表达和描述展开，讨论了单元复合形、细丝、涡旋和骨架涡旋、形状指纹、测地轨迹、自由阿贝尔群、神经复合形、形状持久性、接近性和近似描述接近性、聚类和形状类别、平铺定理和表面形状覆盖等许多概念和方法。本书还给出了使用基于这些概念和方法的图像技术在形状跟踪、法医学形态理论、零镜头识别、物理目标形状分类及视频帧中形状的近似描述性接近度等方面的应用事例。
本书可作为信号与信息处理、通信与信息系统、电子与通信工程、模式识别与智能系统、计算机科学技术以及应用数学和视觉认知学等学科大学高年级本科生或研究生专业课教材和教学参考书，还可供涉及图像技术应用行业（如工业自动化、电视广播、机器人、电子医疗设备、生物医学、遥感测绘、勘探采矿、智能交通、安全监控、法医取证、星际探测和军事侦察等）的科技工作者科研参考。

编辑推荐

本书是一本介绍与图像和视频相关的计算几何学，拓扑学和物理学知识及其应用的书籍，也是从数学和物理的角度，对图像和视频的处理、分析、理解进行深入介绍的书籍。

本书从学习图像技术的角度对计算几何学，拓扑学和物理学的相关内容进行了深入的探讨，一方面有助于信号与信息处理和计算机科学技术等专业背景的人员加强对图像技术原理更深层的认识，另一方面也为数学和物理专业背景的人员进入图像技术和计算机视觉领域有很好的引导作用。

前言

　　本书介绍数字图像和视频帧图像序列中计算几何学、拓扑学和物理学的内容。Edelsbrunner [1]的网格生成几何和Ziegler [2]的多胞形几何为本书所研究的三角视觉场景的几何结构提供了计算几何学方法的坚实基础。平面多胞形是由覆盖多边形内部的闭合半平面相交所定义的填充多边形。此外，可以在Peters [3]的计算机视觉几何基础中找到本书中对计算几何的介绍。它是由亚历山德罗夫[4，5]（由Cooke和Finney [6]巧妙地扩展和阐述）、Borsuk [7，8，9]所引入的单元复合形拓扑结构，最近由Edelsbrunner和Harer提出的这种拓扑结构[10]以及由Munch [11]在持久性同源性方面的工作为视觉场景的计算拓扑学的介绍性研究提供了坚实的基础。这种拓扑形式探索了视觉场景中常见的构造、形状和结构。结合视觉场景的固有几何和拓扑结构，则需要考虑对视频中记录的结构和事件产生的计算物理学以及随之而来的关于光的精细结构的敏感性。Nye [12]介绍了我们所关注的光和光焦散的精细结构。对光焦散的考虑导致了突变理论和光焦散折叠和尖端的出现，从而在三角化数字图像中引入了光学涡旋神经。在这种情况下，计算物理学与在视频帧图像中光结构的编排研究是同义词。这种光结构的编排表现为一系列从表面形状反射和折射的光的快照，为研究视觉场景中出现的结构和形状提供了坚实的基础。

　　研究图像目标形状在视频帧图像序列以及记录视觉场景中表面形状变化的照片序列中的持久性非常重要。表面形状会出现、经历各种光线和表面条件的变化、并最终消失。人们通常倾向于在视觉场景中寻找不寻常的物体（自然的和人工的），这是一种对视觉场景中连续变化和观察到的成分的瞬间持久性的默认认识。换句话说，重要的是需考虑视觉场景形状的时空特性。这既指对视觉场景的理解不仅包括对视觉场景的几何和拓扑的研究，也包括对光物理学、光子在视觉场景中与曲面碰撞的特性和能量的考虑。

　　如果考虑对表面形状的描述和从照片中（特别是在视频帧图像中）记录的表面形状反射的光，物理学就会进入图像。计算机工程也通过对光子学和反射光捕获设备的研究而进入图像。就数字图像的物理学而言，能量的变形特性很重要。有关这种能量观点的更多信息，请参见Susskind [13，§7，p.126]。

　　计算几何学有助于捕获嵌入在图像目标形状中的细粒度结构。计算拓扑学能够捕捉和分析嵌入在三角化视觉场景几何结构中的单元复合形（顶点、线段、填充三角形、循环、涡旋、神经的集族）里发现的近邻（参见Peters [14，15]）。单元复合形的同源性（亚历山德罗夫拓扑学方法的后代[4]）在这里是一个重要的组成部分。同源性是一个数学框架，它关注空间是如何连通的，并利用代数结构，如群和映射，将空间中具有拓扑意义的子集相互联系起来[10，§IV.1，p.79]。

　　群G是一个非空集，它配备了一个结合的二元运算○，其中有一个恒等元素e并且G中的每个成员a都有一个逆b，即a ○ b = e。循环群H是这样一个群，其中G的每个成员都可以写成称为生成元的单个元素的正整数幂。一个循环群是阿贝尔群，只要对于G中的每对元素，都有a ○ b = b ○ a。自由阿贝尔群是一个有多个生成元的阿贝尔群，即该群中的每个元素都可以写成?igi，这里生成元gi都在G中。从同源性观点对循环群的介绍可参见Giblin [16，A.1，p.216]。

　　实际上，同源性是洞察视觉场景中的各个部分如何相互连通的来源。循环群有助于以简洁的方式表示视觉场景中的各个部分是如何相互连通并接合在一起的。具有多个生成元的循环群也是指定感兴趣表面形状的重要特征的一个来源，该特征即贝蒂数（Betti number，自由阿贝尔群中生成元数量的计数）。H. Poincaré根据文章[17]为纪念Enrico Betti命名了这个数。数字图像的计算几何学、拓扑学和物理学的重点是有限空间。

　　贝蒂观察到，有限空间具有与其维度大小和元素形状无关的属性。这些属性仅指其各部分的连通方式……[17，§3，p.143]。有限有界空间区域的特性倾向于通过覆盖空间的单元复合形中的通道所连通的顶点来揭示。（例如，参见覆盖由图1中的表面形状占据的有界区域的通道的连通涡旋）。有关这方面的更多信息，请参见Tucker和Bailey [18]、Salepci和Welshinger [19]以及Pranav、Edelsbrunner、van de Weygaert和Vegter [20]。

图1　覆盖形状的嵌套、非重叠涡旋

　　Kaczynski、Mischaikov和Mrozek [21]对同源性的计算方法进行了深入研究。这里的重点是辨别和跟踪、分析和表达以及近似移动表面形状的接近性。为了应对一个视觉场景中（从一个视频帧图像到另一个视频帧图像）的连续形状变化，描述性邻近空间上的特征矢量为我们提供了一种表示形状变化的方法，这些变化要么彼此靠近，要么有时相距很远。有关这方面的更多信息，请参阅Di Concilio、Guadagni、Peters和Ramanna [22]。

什么是平面上的表面形状？

平面上的表面形状是欧氏平面上由简单封闭曲线（形状轮廓）限定的具有非空内部（形状内容）的有限区域。

　　在欧氏平面中，几何结构包括顶点、线段和实心三角形（三边多面体）。多胞形是封闭半平面的交集[2]。单个多胞形是一个空间区域，内部充满，四周都有边界。在拓扑设置中，重点是将视觉场景区域分解为非常简单的多胞形，例如易于测量和分析的填充三角形。这种拓扑的基本成分是单纯复合形、形状理论和持久同源性。

　　这项工作背后的秘密是将封闭的数字图像区域分解成一组形状复合形，这些形状复合形为形状分析提供了基础。形状复合形用嵌套的，通常不重叠的涡旋集族（参见图?1）对形状进行覆盖。图2(b)中显示了对图2(a)1中那不勒斯花卉的部分三角剖分样本的分解。最终结果是用例如花瓣与填充三角形（单纯复形）的集族对图像场景形状的覆盖。在每个复合形中构成神经结构的三角形集族具有共同的顶点。例如，图2(b)中覆盖白花的复合形为我们提供了一种测量、比较、描述和分类花瓣所占据场景片段的方法。一般来说，形状分析的目标是分类、比较、量化异同，并测量形状之间的距离[23]。在本书中，重点是计算拓扑在视觉场景形状分析中的应用。

(a) 视觉场景

(b) 形状复杂性

图2　覆盖场景形状的单纯复形样本

　　对于三角化视觉场景中的单元复合形，场景形状被称为神经复合形（参见图3）的填充三角形簇所覆盖。设K是点集的有限集族。集族K的神经（用Nrv K表示）由K的所有非空子集族组成，这些子集族具有非空交集[10，§III.2，p.9]。每条神经都有其独特的形状。例如，图2(b)中覆盖花部分的神经的形状来自围绕单个顶点的填充三角形。在三角化表面上，亚历山德罗夫神经复合形A（用Nrv A表示）是具有公共顶点的三角形集族[4，§33，p.39]（参见图4）。

图3　样本重叠的神经复合形

图4　亚历山德罗夫神经复合形

　　本书不仅介绍了数字图像中的计算几何学、拓扑学和物理学的基础知识，而且还给出了许多实际应用。应用包括：

　　应用1：单元分裂轨迹：3.13节，应用3.13。

　　应用2：最大重心星状神经：4.3节，应用4.3。

　　应用3：跟踪视频帧图像形状的变化：4.13节。

　　应用4：法医学形态理论中的光学涡流神经：4.14节。

　　应用5：时空涡旋循环：重叠电磁涡旋：5.7节，应用5.7。

　　应用6：嵌套非同心涡旋特征矢量集族的比较：5.11节，应用5.11。

　　应用7：基于强描述性连通性的零镜头识别：5.13节，应用5.13。

　　应用8：物理目标形状分类中的描述近似性：6.5节，应用6.5。

　　应用9：视频帧图像中形状的近似描述性接近度：7.8节，应用1。

　　应用10：视频中尖端神经系统形状分类的近似描述接近度：8.13节，应用2。

　　本书中的章节源于我在过去几年中为本科生和研究生讲授的计算机视觉课程的笔记。本书中的许多主题得益于我与一些研究人员、研究生和博士后的讨论和交流，特别是Sheela Ramanna、Somashekhar Amrith Naimpally（1931—2014）[24, 25]，Anna Di Concilio [26, 27]，Clara Guadagni [28, 29]，Luigi Guadagni、Fabio Marino、Giuseppe Di Maio、Giuseppe Gerla [30]，Gerald (Jerry) Beer、Arturo Tozzi [31]，Romi Tozzi（斐波那契数8和∞）和鼓舞人心的Vittorio Tozzi、Andrew Worsley [32, 33, 34]，Alexander Yurkin [35]，Ebubekir ?nan [36, 37, 38, 39, 40, 41]，Mehmet Ali ?zturk [42, 43, 44]，Mustafa U?kun [43]，?zlem Tekin [44]，Orgest Zaka [45]，Brent Clark（阿基米德世界移动支点的回声），Zdzis?aw Pawlak [46, 47, 48]，Andrzej Skowron [49, 50]，Jaros?aw Stepaniuk、Jan G. Bazan、Marcin Wolski [51]，Piotr Wasilewski、Ewa Or?woska、W. Pedrycz、William (Bill) Hankley（时间逻辑），David A. Schmidt（集合理论），Joe Campbell、Rich McBride、Iraklii Dochviri [52, 53]，Hemen Dutta [54]，Maciej Borkowski、Surabhi Tiwari、Sankar K. Pal、Cenker Sengoz、Doungrat Chitcharoen、Chris Henry [55, 56, 57]，Dan Lockery 以及 M. Zubair Ahmad、Arjuna P.H. Don、Maxim Saltymakov、Enoch A-iyeh、Randima Hettiarachchi、Dat Pham、Braden Cross、Homa Fashandi、Diba Vafabakhsh、Amir H. Meghdadi、Enze Cui、Liting Han、Fatemeh Gorgannejad、Maryam Karimi和Susmita Saha。

　　我还要感谢M. Zubair Ahmad、Sheela Ramanna和Fatemeh Gorgannejad，他们对本书的部分内容提供了非常有帮助的见解、建议和更正。

　　本书的目标读者是工程、数学和物理科学的三年级和四年级本科生、一年级研究生，以及计算几何学、拓扑学、物理学、数字图像处理和计算机视觉领域的研究人员。对每个主要章节主题，给出了相关的算法。以下符号用于表示各章习题的难度级别：

　　：快速、易于解决；

：深入、全面。

温尼伯，加拿大詹姆斯F.彼得斯

短评

计算机专业新书，很好哦

2023-06-16 09:23:46

数字图像的计算几何、拓扑和物理及其应用/清华计算机图书译丛" 数字图像处理是计算机科学与工程领域中备受瞩目的研究方向之一，它涵盖了多个学科，包括计算几何、拓扑学和物理学等多个领域的知识。清华计算机图书译丛（Tsinghua Computer and Information Science Series）为我们带来了一系列深入探讨数字图像处理及其应用的精彩著作，本文将简要介绍其中的一些重要内容。 **计算几何与数字图像处理** 数字图像处理的核心在于对图像中的数据进行分析和处理。计算几何是数字图像处理中的关键工具之一，它研究的是图像中的几何结构和形状。通过计算几何的方法，可以识别图像中的对象、边界和轮廓，从而实现目标检测、物体识别和图像分割等任务。清华计算机图书译丛中的一些著作深入探讨了计算几何在数字图像处理中的应用。它们介绍了基本的计算几何概念，如点、线、多边形等，以及如何利用这些概念来分析和处理图像数据。这些方法不仅在计算机视觉领域有广泛应用，还在医学影像处理、遥感图像分析等领域发挥了重要作用。 **拓扑学与图像分析** 拓扑学是研究空间中形状和结构不变性的数学学科，它在数字图像处理中的应用主要涉及到图像的连通性和区域性质。清华计算机图书译丛中的一些书籍详细介绍了拓扑学在图像分析中的应用，包括骨架提取、孔洞检测、连通性分析等方面。通过拓扑学的方法，研究者可以定量地描述图像中的结构和形状特征，这对于模式识别、形状匹配和图像检索等任务非常重要。拓扑学的概念和技术为数字图像处理提供了强大的工具，使研究者能够更好地理解和分析图像数据。 **物理学与图像生成** 数字图像的生成与物理学密切相关。清华计算机图书译丛中的一些著作涵盖了物理模型与数字图像合成的内容。这些书籍探讨了光学原理、摄影学、渲染技术等与图像生成有关的物理学概念，并介绍了如何利用这些知识来合成高质量的数字图像。物理模型不仅用于生成真实感的图像，还在计算机图形学、虚拟现实和游戏开发等领域发挥了关键作用。清华计算机图书译丛为读者提供了深入了解数字图像生成的机会，帮助他们掌握这一领域的重要技术和方法。 **应用领域** 清华计算机图书译丛中的书籍不仅关注理论和方法，还强调了数字图像处理在实际应用中的重要性。这些应用领域涵盖了医学影像分析、自动驾驶、军事情报分析、文化遗产保护等多个领域。数字图像处理技术的不断进步和应用扩展将为各行各业带来更多创新和机会。总之，清华计算机图书译丛提供了一系列深入探讨数字图像处理的著作，涵盖了计算几何、拓扑学、物理学等多个领域，以及各种实际应用。这些书籍为研究者、工程师和学生提供了深入了解数字图像处理的机会，促进了这一领域的发展和应用。

2023-09-02 10:10:51

数字图像的计算几何、拓扑和物理及其应用

内容简介

编辑推荐

前言

目录

短评