Ch7 图像分割基础知识图像分割是指把图像分成各个具有相应特性的区域并提取出感兴趣目标的技术和过程
特性包括:灰度、颜色、纹理等,目标可以对应单个区域,也可以对应多个区域
分类:
按幅度不同分割:幅度分割
按边缘不同分割:边缘检测
按形状不同分割:区域检测
对灰度图像的分割常可以基于像素灰度值的两个性质: 不连续性和相似性。区域内部的像素一般具有灰度相似性,而在区域之间的边界上一般具有灰度不连续性。不连续性->基于边界的分割;相似性->基于区域的分割
间断检测点检测使用模板
$R = w_1z_1+w_2z_2+w_3z_3+...+w_9z_9 = \sum_{i=1}^{9}w_iz_i$
人为设置阈值,且如果模板的响应为0,则表示在灰度级为常数的区域
线检测有4个线检测模板,分别在水平,+45°,垂直以及-45°方向上有最大响应
边缘检测
边缘是一组相连的像素集合,这些像素位于两个区域的边界上。灰度边缘是灰度值不连续的结果。
一阶导数与二阶导数在识别图像的边缘中具有重要的作用
数字边缘的模型有:理想数字边缘模型 &...
Ch6 形态学图像处理基础知识形态学:是生物学中研究动物和植物结构的一个分支。
数学形态学(图像代数):以形态为基础对图像进行分析的数学工具。
形态学图像处理的应用:可以简化图像数据,保持它们基本的形状特性,并除去不相干的结构。
思想:用具有一定形态的结构元素,去度量和提取图像中的对应形状,以达到对图像分析和识别的目的
发展:初期的数学形态学方法仅可以应用于二值图像,所以需要将灰度图像先进行二值化。后来灰度形态学得到发展,使得数学形态学方法不仅可以用于二值图像,也可以应用于各种灰度与彩色图像。
二值形态学中的运算对象是集合,但实际运算中当涉及两个集合时并不把他们看作是互相对等的,一般设A为图像集合,B为结构元素,数学形态学运算是用B对A进行操作。
结构元素本身实际上也是一个图像集合。对每个结构元素,先要指定一个原点,它是结构元素参与形态学运算的参考点。注意原点可以包含在结构元素中,也可以不包含在结构元素中(即原点并不一定要属于结构元素),但两种情况下的运算结果常不相同 。
集合论中的基本概念:并,交,补,差
有公式:
集合A的平移,平移到z(...
Ch5 彩色图像处理彩色图像处理可以分为:
全彩色处理:数码相机,彩色扫描仪
伪彩色处理:对不同灰度或灰度范围赋予不同的颜色
彩色空间——也称为彩色模型或者彩色系统
——example: RGB \ CMY & CMYK \ HSI \ YIQ \ YUV \ YCbCr
RGB
CCD或者CMOS技术直接感知RGB三个分量(本身光电传感器无法识别颜色,增加滤光片之后可以分辨)
CMY & CMYK
CMY(青色,品红,黄)CMYK(青、品红、黄、黑)
大多数在纸上沉积彩色颜料的设备,比如彩色打印机和复印机、印刷设备
打印中的主要颜色是黑色,等量的CMY原色可以产生黑色,但不纯
HSI
HSI(色调,饱和度,亮度)
I分量与图像的彩色信息无关
H和S分量与人感受颜色的方式是紧密相连的
广泛用于计算机视觉、图像检索和视频检索
YIQ & YUV
Y指亮度,即灰度值
I和Q指色调,描述色彩及饱和度,U和V也指色调,与前者不同
用于彩色电视广播,YIQ被北美的电视系统所采用,YUV被欧洲的电视系统所采用
Y分量可提供黑白电视机的所有影像信息...
Ch4 图像复原与恢复图像复原的基本概念图像退化定义:图像的质量下降叫做退化
形式:模糊、失真、有噪声等
原因:无论是由光学、光电或者电子方法获得的图像,均会有不同程度的退化。比如传感器噪声,物体与摄像设备之间的相对移动等
在图像采集过程中产生的许多退化常称为模糊,在图像记录过程中产生的退化常称为噪声
如果对退化的类型、机制和过程都十分清楚,就可以利用其反过程来复原图像
图像复原对降质了的图像恢复成原来的图像。具体方法:针对引起图像退化的原因,以及降质过程的某先验知识,建立起退化模型,再针对降质过程采取相反的方向,恢复图像。本质上是一种逆过程。
一般来讲,复原的好坏有一个规定的客观标准,以便对复原的结果作出某种最佳的评估。
图像退化模型退化过程可以看作对原图像作线性运算
$ g(x,y) = H f(x,y) + n(x,y)$
其中H是退化模型,n(x,y)是噪声,退化模型被建模为一个退化函数和一个加性噪声项
在后续的讨论中,对退化模型H作出以下的假设:
H是线性的
H是空间(或位移)不变的
在这里先省略噪声项,可将一幅图像看作是由一系列冲激函...
Ch3 频域图像增强理论基础空间域图像变换到频域的具体实现——图像离散傅里叶变换与反变换
频域图像的表达特点——经过中心变换后,低频位于中心,高频在外
空间频率的定义:图像灰度值随空间坐标变化的快慢也可以用频率来度量,称为空间频率
二维卷积对于二维平面函数,二维卷积定义:
$ h(x, y)=f^{*} g=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty} f(u, v) g(x-u, y-v) d u d v $
*注:
深度学习中,CNN中的卷积其实是“互相关运算”,即kernel不翻转,与上面的二维卷积定义无法完全对应。
在数字图像中,需要离散化,离散二维卷积:
$ h(x, y)=f^{*} g=\sum_{m} \sum_{n} f(m, n) g(x-m, y-n) $
二维离散傅里叶变换\begin{array}{l}F(u, v)=\frac{1}{M N} \sum_{x=0}^{M-1} \sum_{y=0}^{N-1} f(x, y) \mathrm{e}^{[-\mathrm{j} 2...
Ch2 空间域图像增强定义:直接作用于像素的增强方法,根据具体操作是在像素点位置上还是像素点的邻域上可分为点操作和模板操作(邻域操作)
灰度映射通过映射函数:$ t= T(s)$(可根据增强的目的来设计映射函数)将原始图像中的每个像素的灰度都映射到新的灰度。
图像求反(负片)一一对应
幂次变换$t= cs^{γ}$
$γ<1$时在正比函数上方,使得图像变亮,把输入窄带暗值映射到宽带输出;
$γ>1$时在正比函数下方,使得图像变暗,把输入窄带亮值映射到宽带输出。
动态范围压缩由于某些设备的局限性,采用动态范围压缩,目标与增强图片的对比度相反(同等范围的原始灰度级数变换后范围变化减小)
阶梯量化将图像灰度分范围量化,变成数据量较少的级数,获得数据量压缩的效果(有点像素化风格)
灰度切分/阈值切分只留下两个灰度值,获得最大的对比度以及最少的细节
*分段变换:
位平面切片以256灰度级图像为例,该图像的灰度级可以用8位表示。可假设图像是由8个1位平面组成,即位平面0~7,其中...
Ch0 数字图像的概念观察系统使用的光波段:可见光、红外、射线、微波、超声波等
视觉在人类获取信息来源中占70%
图:反射光或者透射光的分布,或物体自身发出的能量—客观
像:人的视觉系统对图的接收在大脑中形成的印象或认识—主观
图像处理:是对图像信息进行加工处理,以满足人的视觉心理和实际应用的需求。包括光学和电子学两种方法
图像分类:模拟图像 & 数字图像
模拟图像:理论上不存在,即使高密度胶片成像也无法称为模拟图像,个人认为可将人眼获得的像近似为模拟图像
数字图像:
由连续的模拟图像通过采样和量化得到。数字图像的基本单位是像素,所以数字图像是像素的集合
数字图像是以像素为元素的矩阵,像素的值代表图像在该位置的亮度/色度,称为图像的灰度值/色度值
数字图像像素具有整数坐标与整数灰度值
数字图像处理的基本特点:
信息量大
占用频带宽:电视图像的带宽为5~6MHz(细节越多,画质越高带宽越大,不过现代数字编码技术可以通过压缩方法,比如MPEG-4、H.265等方式大幅减少带宽需求),语音的带宽只有4kHz,频带越宽,技术实现难度就越大
数字图像处理的基本内容 (部分内...