文章时效性提示
这是一篇发布于 1146 天前的文章,部分信息可能已发生改变,请注意甄别。
之前碰过,现在想系统学一下.设计opencv-python,Numpy,Matploylib这几个库
开始
将涉及到的库安装后,导入
1 | import cv2 #导入需要用cv2 |
安装opencv-python时已经装了numpy了.
涉及方法
1 | imread() #传入图像路径 |
我们读入一个图像并尝试打印
1 | image = imread("image.jpg") |
可以看到结果是多维数组,类型其实是Numpy的数组类型,所以搭配Numpy很好操作.
这里涉及到图像的知识,图像在计算机中的存储.
值得注意的:opencv得到的三通道像素点是BGR格式.
1 | #得到image对象后 |
拆分和合并图像信道
1 | split() #拆分信道 |
主要用于将三信道彩色图像拆分为b,g,r三个单信道,也就是三个灰度图.
访问图像属性
一张图像具有多个属性:行数、列数、通道数、图像数据类型、像素数等.
1 | image = imread("") #参数是一个图像地址 |
当意识到imread返回的其实是一个矩阵,我们就能利用numpy的一些方法.
可以看到 image.shape
返回的是一组包含图片属性的元组。第一个元素是图片的高,表示图片有多少行像素。第二个元素是图片的宽,表示图片有多少列像素。最后一个元素 3
是图片的通道数,我们使用的是 RGB 彩色图片,所以一共有三个通道.是彩色图像
1 | print(type(image)) |
image.dtype
获取像素值的数据类型,可以看到像素值的数据类型是 uint8
表示 8 位无符号整数。因为像素值的范围是 0 到 255,而 uint8
也是在这一范围.
属性 | 说明 |
---|---|
ndarray.ndim | 秩,即轴的数量或维度的数量 |
ndarray.shape | 数组的维度,对于矩阵,n 行 m 列 |
ndarray.size | 数组元素的总个数,相当于 .shape 中 n*m 的值 |
ndarray.dtype | ndarray 对象的元素类型 |
ndarray.itemsize | ndarray 对象中每个元素的大小,以字节为单位 |
ndarray.flags | ndarray 对象的内存信息 |
ndarray.real | ndarray元素的实部 |
ndarray.imag | ndarray 元素的虚部 |
ndarray.data | 包含实际数组元素的缓冲区,由于一般通过数组的索引获取元素,所以通常不需要使用这个属性。 |
画图
画直线
首先创建一个图像,利用numpy数组
1 | region = np.zeros((500,500,3),dtype=np.uint8) |
默认dtype是浮点数,最好改为np.uint8或int.
返回值是一个全为0的三维矩阵,数据类型是uint8.
然后利用cv2line()
1 | line = cv2.line(region,(50,50),(450,450),(0,0,255),5) #region是背景图像,也就是创建的图片,接着的参数是线的起始和终止点,bgr颜色和厚度 |
最后使用imwrite保存即可
1 | cv2.imwrite('line.jpg',line) #line是一个numpy类型 |
当然也可以定义线的类型,详见官方文档
其他的创建数组方式有
1 | numpy.empty() #np.empty([3,2], dtype = int) |
画矩形
与画直线类似,需要定义左上角和右上角.厚度为负数则为填充图形.
1 | region = np.zeros((500,500,3)) |
画圆和椭圆类似,就是用的方法不一样而已
1 | cv2.circle() #画圆 |
1 | #画圆 |
指定圆心与半径即可
1 | region = np.zeros((500,500,3)) |
调用 cv2.ellipse
函数绘制椭圆。第一个参数 region
是要在上面绘制椭圆的图片。第二个参数 (200, 200)
是椭圆中心的坐标。第三个参数 (150, 50)
表示椭圆的轴长,其中 150
表示长轴,50
表示短轴。第四个参数 0
表示椭圆处于一个水平的状态,第四个参数表示沿顺时针方向椭圆的旋转角度 。第五个参数 0
表示沿顺时针方向绘制椭圆的起始角度,第六个参数 180
表示沿顺时针方向绘制椭圆的结束角度 ,所以第五、第六参数表示我们将绘制半个椭圆。第七个参数 (0, 255, 0)
表示绘制椭圆的颜色为绿色。第八个参数 -1
表示用绿色将这半个椭圆填充满
还有多边形和添加文本,不过说实话,感觉用处不大
1 | pts = np.array([[[10, 60]], [[290, 250]], [[300, 350]], [[470, 390]]], np.int32) #列表是顶点数*1*2 |
True表示各个顶点连线闭合得到多边形,其余参数类似.
添加文字
1 | cv2.putText() |
1 | words = cv2.putText(region, "Vision", (100, 250), cv2.FONT_HERSHEY_SIMPLEX, 3, (0, 255, 0), 10, cv2.LINE_AA) |
第四个参数 cv2.FONT_HERSHEY_SIMPLEX
是字体类型,第五个参数 3
是字体的大小,第六个参数 (0, 255, 0)
是字体的颜色,第七个参数 10
是文字线条的粗细,第八个参数 cv2.LINE_AA
是线条的类型。
图像的处理
图像的缩放
1 | cv2.resize() |
使用 cv2.resize
函数来对图片的尺寸进行缩放,该函数的第一个参数 image
是要被缩放的图片。第二个参数 (0, 0)
是一个元组,表示输出图片的尺寸,元组内的第一个元素表示图片的宽,第二个表示图片的高。第三参数 fx = 0.5
表示沿图片的宽的缩放系数,第四参数 fy = 0.5
表示沿图片的高的缩放系数。第五个参数 interpolation = cv2.INTER_AREA)
是插值方法,表明图片是用哪种方法被缩放的,cv2.resize
默认的插值方法是 cv2.INTER_LINEAR
,大家也可以尝试使用其他方法: cv2.INTER_NEAREST
、cv2.INTER_CUBIC
、cv2.INTER_LANCZ0S4
。我们也可以尝试定义输出图片尺寸来对图片进行缩放。
1 | resized = cv2.resize(image, (0, 0), fx=0.5, fy=0.5, \ |
当将此参数设置为 (0, 0)
时,图片的输出尺寸由后面两个缩放系数 fx
和 fy
分别与函数的输入图片的宽和高相乘得出,当此参数不等于 (0, 0)
时,输出图片的尺寸等于我们自己设定的值
图像平移
图片的平移是让图片中所有的像素点沿着坐标轴移动相同的距离,视觉上看起来就是图片在进行上、下、左、右移动.
对图片进行平移时,我们要先确定图片向哪个方向移动、移动多少
使用 cv2.warpAffine
函数对图片进行平移,第一个参数 image
是要被平移的图片。第二个参数 M
是我们刚才创建的矩阵 M
。第三个参数 (width, height)
是输出的图片尺寸,这里我们输出的尺寸和输入的原始图片尺寸一样,width
表示图片的宽,height
表示图片的高
1 | height,width = image.shape[:2] |
图像的运算
算术运算和按位运算
图像的算术运算在图像增强中普遍应用,其可对图片进行增加亮度、减少亮度、增强对比度等操作以满足特定的图像处理需求,还可以通过将两幅图片进行算术运算以达到图像融合的效果。
图像的按位运算在图像分割、目标检测和识别、模式识别中得到广泛的应用
算术运算
使用 cv2.add
、cv2.subtract
、cv2.multiply
、cv2.divide
即可实现加、减、乘、除运算
1 | M = img1.shape |
对于两张图片相加减,需要将图片大小调整为相同.
1 | image2 = cv2.resize(image2, (image1.shape[1], image1.shape[0]), interpolation=cv2.INTER_CUBIC) |
1 | sums = cv2.add(image1, image2) |
1 | sub = cv2.subtract(image1, image2) |
1 | mul = cv2.multiply(image1, image2) |
1 | div = cv2.divide(image1, image2) |
运算后的结果与单纯的十进制算术运算结果不同。这是因为我们用 8
位无符号整数表示 0 到 255,OpenCV 的算术运算函数是饱和运算,当运算结果大于 255 时函数输出 255
,当运算结果小于 0 时函数输出 0
。这里需要同 NumPy 的算术运算区分开,NumPy 的运算是取模运算,即当运算结果大于 255 时则最后得到的是运算结果对 256 取模
按位运算
and
运算是当两个像素值都大于 0 时为真,or
运算是当两个像素值有一个大于 0 时为真,xor
运算是当两个像素值有一个大于 0 但不同时都大于 0 则为真。not
则是一个取反的运算.
1 | cv2.bitwise_and(a, b) |
图片的按位运算。两张图片的按位运算就是将两张尺寸通道数相同的图片中的每个像素值分别进行 and
、or
、xor
、not
运算
相与可以只取白色部分,或可以去掉白色部分
所以这就涉及到掩码(mask)
利用np.zeros创造黑图,创建一张黑色图片,因为这张图片的尺寸要和进行掩膜操作的原图片的尺寸一样.
1 | mask = np.zeros(image1.shape[:2], np.uint8) |
然后利用改变像素得到白图.使用 cv2.bitwise_and
函数进行掩膜操作,函数第一个和第二个参数相同,都是我们的原始图片 image1
,第三个参数 mask
就是我们刚才创建的掩膜图片。该函数会把原图片中对应于掩膜图片的白色区域显示出来,其他区域会被黑色遮盖
1 | imagemask = cv2.bitwise_and(image1, image1, mask = mask) |
颜色空间
除了RGB还有HSV和LAB,描述色彩模型.
颜色空间是一种描述色彩的模型,其作用是在不同的标准下对不同颜色的说明。OpenCV 中有上百种颜色空间转换方法
图像的旋转
1 | cv.getRotationMatrix2D() #参数分别为旋转中心,角度,缩放 |
1 | img = cv.imread('messi5.jpg',0) |
1 | height,width = image.shape[:2] |
图像的翻转
1 | # 翻转 |
此外还有仿射变换和透视变换
图像分割
阈值方法
通过设定一个值,通过这个值去除图像中的多于信息.这个值就叫阈值.
阈值法是一种图像分割的方法,阈值法因其简单、稳定、计算量小的特征使其在传统算法中得到广泛应用。阈值法是将灰度图像进行二值化以达到分割图像,获得特定感兴趣区域的方法。阈值法的通常做法是将灰度图转换为二值图,使得图片中的像素值只有 0 和 255 这两种值
简单阈值
为的选定一个阈值 T
,对于灰度图片中所有小于 T
的像素值设置为 0,将图片中所有大于 T
的像素值设置为 255。也可将大于阈值的像素值设置为 0,小于阈值的设置为 255
1 | # 简单阈值 |
输入上面得到的灰度图。第二个参数 200
是我们要设置的阈值,第三个参数 255
表示当图像中的像素值大于 200
那么该像素值将被替换成 255
,否则像素值将会被设置为 0
。第四个参数是设置阈值的方法,这里使用的是 cv2.THRESH_BINARY
,该方法将会把所有大于第二个参数的像素值设置为第三个参数也就是 255
。
自适应阈值
自适应阈值法可以帮助我们优化简单阈值法的弊端。自适应阈值是基于一小片区域的像素值来确定阈值的,所以处理一张图片可以获得多个阈值
1 | #自适应阈值 |
函数的第一个参数 grayimage
是要二值化的的灰度图。第二个参数 255
是像素的最大值,作用同 cv2.threshold
第三个参数一样。第三个参数 cv2.ADAPTIVE_THRESH_MEAN_C
是计算阈值的方法,该方法会计算像素邻近区域的平均值然后减去一个常数 C
,这个常数是整数且是该函数的第六个参数。第四个参数 cv2.THRESH_BINARY
是前面讲过的设置阈值的方法。第五个参数 9
是用来计算阈值的区域的大小,该参数必须是奇数,这里我们设置其值为 9
表示我们将计算 9*9
区域内的阈值。第六个参数 3
就是前面提到的常数 C
也可以将第三个参数设置为 cv2.ADAPTIVE_THRESH_GAUSSIAN_C
表示用领域值的高斯加权总和减去常数 C
Otsu阈值
Otsu 方法是另一种自动计算阈值的方法,是一种寻找一个阈值将图片分为前景和背景的方法,其优点是不受图像的亮度和对比度的影响
1 | #Otsu阈值 |
还可以在 cv2.threshold
函数的第四个参数 cv2.THRESH_OTSU
后面添加设置阈值的方法来呈现不同的处理结果。
图像平滑
图像平滑也可称为滤波,是一种用于减少图像噪声且会让图像变得模糊的方法。图像平滑常常在图像预处理时使用,其主要目的是减少图像中的噪声,使得后续的处理操作能够获得更好的效果和可靠性。
每个数字表示像素值,红色方框是一个 3*3
矩阵或者称之为卷积核。图像平滑实际上是使用一个 m*k
的矩阵在图片上移动并与像素值进行相应计算来实现的
均值滤波
均值滤波就是线性滤波,是指用一个 m*m
的模板(卷积核)在图像上滑动,其中 m
是正整数且是奇数,当模板在滑动时,处于模板中心的像素值将会被其周围的像素值的平均值所替代。
1 | # 均值滤波 |
高斯滤波
高斯滤波是为了克服平滑处理导致的图像边缘信息丢失的问题。高斯滤波比较类似均值滤波,但是高斯滤波在计算均值时使用了权重。卷积核的中心像素值是由相邻像素的加权平均得到的,越靠近中心像素的像素值的权重越大
通过 cv2.GaussianBlur
函数来实现高斯滤波。第一个参数 image
是要进行高斯平滑的图片,第二个参数 (5, 5)
是高斯卷积核的大小,第三个参数 0
是 x
轴方向的高斯卷积核的标准差,这里设置为 0
表示让 OpenCV 根据卷积核大小自动计算
1 | # 高斯滤波 |
中位滤波
中位滤波首先需要设定一个 m*m
的卷积核,当卷积核在图片上滑动时将卷积核中的每个值进行排序,取排序后的中间值作为卷积核中心的像素值。中位滤波对去除图片中的椒盐噪声有较好的效果.
椒盐噪声就是图片中存在许多白色和黑色的点,其会给图像处理带来一定的困难
1 | # 中位滤波 |
双边滤波
双边滤波是一种使用两个高斯函数,在减少噪声同时也可以保留边缘信息的平滑方法。双边滤波使用两个权重,距离卷积核的中心点越近的像素权重越大,相邻区域内像素的强度与中心像素的强度越相似,其所获得的权重就越大。
1 | # 双边滤波 |
第二个参数 9
是在进行滤波过程中每个像素其相邻区域像素的直径,第三个参数 45
是颜色标准差,这个值越大表示更多的相邻区域内颜色在进行滤波时会被考虑。第四个参数 45
是坐标空间的标准差,这个值越大表示距离中心像素较远的像素会影响计算.
边缘检测
边缘是图像中的一种重要信息,边缘将图片分成不同的区域,每个区域代表不同的物体。边缘有一个重要的特征:在边缘两侧区域的像素灰度值差异较大,而边缘上的像素灰度值差异不明显。
为了检测到边缘,我们需要找到一种方法确定哪些区域是存在灰度值的“突变”的,使用梯度可以找到灰度值变化明显的地方,梯度变化的幅度可以用来检测边缘
Sobel算子
使用 cv2.Sobel
函数来计算水平方向和垂直方向的梯度,值得注意的是梯度值可能为负数(由大到小).所以需要取绝对值.同时最后要将两个方向的图重合,利用相或操作.
1 | def sobel(): |
Laplacian算子
Laplacian 算子只产生一个结果即与水平和垂直方向无关。因为这个算子对噪声比较敏感,所以当图片中存在噪声时最好先对图片进行降噪处理。我们使用 cv2.Laplacian
函数对图片进行边缘检测.
1 | def lap(): |
Canny算子
Canny 边缘检测是一种比较流行的算法,其在进行边缘检测过程中包含多个步骤:对图片进行降噪处理、计算水平和垂直方向的梯度、剔除干扰的边缘、使用双阈值确定哪些像素在边缘上
1 | def canny(): |
二个参数 20
和第三个参数 140
是要设置的阈值。小于 20
的梯度值将被划分为非边缘,大于 140
的梯度值将被划分为边缘;介于 20
和 140
中间的值,如果该值与大于 140
的值相邻接,那么判定其为边缘。
直方图
图像的直方图是一种通过简单的统计分析手段对像素值的分布情况进行可视化的方法。通过绘制图像直方图我们可以直观的了解图像的一些特征
1 | import cv2 as cv |
这是灰度图的直方图.
也可以对三通道彩图处理
1 | image = cv.imread("1.jpg") |
二维直方图
即同时考虑多个通道的直方图.
1 | fig = cv.calcHist([image],[0,1],None,[16,16],[0,256,0,256]) |
均衡化
拍摄的照片会出现曝光过度或者曝光不足导致图片的内容缺乏辨识度,这种情况我们可以通过均衡化的方法来缓解这种问题
首先将三通道分离为三个单通道
1 | splits = cv2.split(image) |
抠图
轮廓提取和分割
利用这按位运算和边缘检测方法实现从图片中抠取特定区域,然后将其融合进一张新的图片中去。要想从一张图片中抠取特定的区域我们需要用到轮廓提取的方法,轮廓是描述物体外形的一段闭合的曲线,是物体的一个重要特征,轮廓特征在图像处理中广泛应用,在图像分割中我们利用轮廓特征将物体从背景中分割开。
首先需要边缘检测,利用之前的算子得到边缘.
使用cv.findContour根据边缘得到轮廓.
cv2.findContours
有两个返回值contours
和h
。contours
是一个列表,其中每一个元素对应检测到的轮廓,另一个h
表示检测到的轮廓所对应的属性.第一个参数
edge
是cv2.Canny
函数输出的边缘图,这个参数必须是二值图且函数会修改输入的图片。第二个参数cv2.RETR_EXTERNAL
是检索轮廓的方式,表示只检测最外层的轮廓;可以尝试使用cv2.RETR_LIST
,cv2.RETR_CCOMP
或cv2.RETR_TREE
参数。第三个参数cv2.CHAIN_APPROX_SIMPLE
表示逼近轮廓的方法,或者可以称为存储轮廓的方法,这个方法将会对轮廓上的所有坐标点进行压缩,只保留水平、垂直、对角线方向上的端点坐标;可以尝试cv2.CHAIN_APPROX_NONE
,cv2.CHAIN_APPROX_TC89_L1
和cv2.CHAIN_APPROX_TC89_KCOS
方法。drawCountours绘制轮廓.根据findContours得到的轮廓,规定颜色和粗细.
1 | image = cv.imread('1.jpg') |
分割物体
上一步得到了轮廓.现在直接根据轮廓绘制即可.
1 | mask = np.zeros(image.shape,dtype="uint8") |
这样可以根据轮廓画出白色图形.
cv2.drawContours
的第三个参数 1
表示绘制检测到的第二个物体的轮廓,第四个参数 (255, 255, 255)
表示轮廓的颜色为白色,第五个参数 -1
表示将整个轮廓内的区域填充为白色。然后保存图片
然后将这个图形与原图直接相与.
1 | divide = cv2.bitwise_and(mask, image1) |
剪裁和图片合并
要从 divide
中裁剪出辣椒。我们使用 cv2.boundingRect
函数获得这个辣椒最小的外接矩形的坐标。
1 | (x, y, w, h) = cv2.boundingRect(contours[1]) |
得到截取图形的矩形尺寸
1 | cut_pepper = divide[y:y + h, x:x + w] |
将截取的区域颜色变换,方便后续与或.
注意图像运算要求图像大小相同.
将要合并的图像截取相同大小.
1 | cut_image2 = image2[50:50 + h, 50:50 + w] |
将两个图像相与
1 | cut_image2 = cv2.bitwise_and(cut_not, cut_image2) |
再将分割的图像相或
1 | cut_image2 = cv2.bitwise_or(cut_pepper, cut_image2) |
最后直接修改原图相应位置的像素
1 | image2[50:50 + h, 50:50 + w] = cut_image2[:,:] |
官方文档
Matplotlib — Visualization with Python
国内也有很多翻译的文档,都挺不错的,基本用法是都覆盖的.
或者直接看菜鸟驿站.