1.4.3 数字图像处理系统
数字图像处理系统包括采集、处理和分析、显示、存储、通信五大模块,其构成示意图如图1-9所示。需要指出的是,并不是每一个实际的图像处理系统都包含所有这些模块;另外,对一些特殊的图像处理系统,还可能包含其他模块。
图1-9 数字图像处理系统的构成示意图
采集模块主要是把一张图像转换成适合计算机或数字设备处理的数字信号,该过程主要包括拍摄图像、光/电转换及数字化等几个步骤。
处理和分析模块主要用于图像的处理和分析。常用的图像处理和分析技术包括几何处理、算术处理、图像增强、图像复原、图像重建、图像编码、图像识别和图像理解。
(1)几何处理(Geometrical Processing)主要包括几何变换、图像的移动、旋转、放大、缩小、镜像、多个图像配准、全景畸变校正、扭曲校正、周长计算、面积计算、体积计算等。几何处理效果示例如图1-10所示。
图1-10 几何处理效果示例(图像水平镜像)
(2)算术处理(Arithmetic Processing)主要对图像进行加、减、乘、除、与、或、异或等运算。算术处理效果示例如图1-11所示。
图1-11 算术处理效果示例(图像减影处理)
(3)图像增强(Image Enhancement)主要是突出图像中感兴趣的信息,减弱或消除不需要的信息,从而使有用信息得到加强,以便于区分或解释。图像增强效果示例如图1-12所示。
图1-12 图像增强效果示例(同态滤波增强)
(4)图像复原(Image Restoration)的主要目的是消除干扰和模糊,恢复图像的原始状态。图像复原、图像增强、算术处理、几何处理都是从图像到图像的处理,即输入的原始数据是图像,输出的处理后结果也是图像。图像复原效果示例如图1-13所示。
图1-13 图像复原效果示例
(5)图像重建(Image Reconstruction)是从数据到图像的处理,即输入的是某种数据,输出是处理之后的图像。该处理的典型应用是发明于1972年的CT技术,早期为X光CT,后来发展为ECT、超声CT、核磁共振(NMR)等。
(6)图像编码(Image Encoding)技术的研究属于信息论中的信源编码范畴,主要目的是利用图像信号的统计特性、人类视觉的生理学与心理学特性对图像信号进行高效编码,研究数据压缩技术,解决图像数据量与存储空间消耗之间的矛盾。
(7)图像识别(Image Recognition)基于模式识别技术,方法大致包括统计识别法、句法结构识别法和模糊识别法三种。统计识别法侧重于特征,句法结构识别法侧重于结构和基元,模糊识别法把模糊数学的概念和理论应用于识别处理。图像识别是当前图像大数据、人工智能、深度学习等技术的重要应用领域,它面临许多挑战性的问题,人脸识别就是其中一个典型的例子,如图1-14所示。
图1-14 图像识别示例(人脸识别)
(8)图像理解(Image Understanding)是在图像识别基础上的智力表现,是实现人工智能的重要方面。图像理解方法输入为图像,输出为一种描述,这种描述并不仅是单纯地用符号做出详细的描绘,而是要利用客观世界的知识使计算机进行联想、思考及推论,从而理解图像所表达的内容。
显示模块主要用于显示图像,目的是为人或机器提供一张更便于解译和识别的图像。图像分辨率从早期的640×480、1024×768等,发展到今天的3648×2736、7296×5472等,单张图像可达4000万像素,文件大小可达40MB。常用的图像显示技术包括软拷贝和硬拷贝。软拷贝包括CRT显示、液晶显示器(LCD)、彩色等离子显示技术(Plasma Display Panel, PDP)、场致发光显示器(Field Effect Display, FED)、E-Paper(电子纸、数码纸)等。硬拷贝包括照相、激光拷贝、彩色喷墨打印等。图像打印一般用于输出较低分辨率的图像,近年来也可采用各种热敏、热升华、喷墨和激光打印机等设备输出较高分辨率的图像。常用的图像打印技术包括半调输出技术、抖动输出技术等。
存储模块主要解决数据的海量存储问题,研究数据压缩、图像格式及图像数据库、图像检索技术等,常用的图像格式包括BMP、JPEG、GIF、TIFF等,常用的存储设备包括磁带、光盘、硬盘、专用存储系统等。
通信模块包括系统内部通信和系统外部通信两类。系统内部通信多采用DMA(Direct Memory Access)技术以解决速度问题。系统外部通信主要研究图像传输和视频编码问题,主要解决占用带宽问题,例如,彩色电视制式NTSC、PAL、SECAM等,会议电视传输协议H.320、H.323、RTP/RTCP、UDP等,编码标准JPEG系列、MPEG系列、H.26X系列、JVT、AVS等。