2021-01-21 23:38:29
0
本文测试一下分水岭算法,使用python调用opencv和numpy处理数据。
分水岭算法主要用于图像分段,通常是把一副彩色图像灰度化,然后再求梯度图,最后在梯度图的基础上进行分水岭算法,求得分段图像的边缘线。分水岭算法的思想来源于地形学,它将图像看作是地形学上被水覆盖的自然地貌,图像中的每一像素的灰度值表示该点的海拔高度,其每一个局部极小值及其影响区域称为集水盆地,两集水盆地的边界则为分水岭。通常描述分水岭变换有两种方法:一种是“雨滴法”,另一种方法是模拟“溢流”的过程。
分水岭的计算过程是一个迭代标注过程。分水岭比较经典的计算方法是L. Vincent提出的。在该算法中,分水岭计算分两个步骤,一个是排序过程,一个是淹没过程。首先对每个像素的灰度级进行从低到高排序,然后在从低到高实现淹没过程中,对每一个局部极小值在h阶高度的影响域采用先进先出(FIFO)结构进行判断及标注。
首先我们画几个图形,如下图
这是我随手画的,使用的win10的画图工具。我们编程实现图形边界的识别。分水岭简单来说,就是识别图像轮廓的一种算法,好在python中已经实现了该算法。分水岭算法是使用很多算法叠加的总和,python的简单之处在此可见一斑。- def getStructuringElement(shape: Any, # 形状
- ksize: Any, # kernel尺寸
- anchor: Any = None) -> None
复制代码 该函数用于获取结构化元素,然后可以进行形态学的操作,比如开闭运算,膨胀腐蚀等。其中的两个参数,一个是原始图像,一个是核。核这个东西就不介绍了,原理不复杂,一说一大堆。- def morphologyEx(src: Any,
- op: Any,
- kernel: Any,
- dst: Any = None,
- anchor: Any = None,
- iterations: Any = None,
- borderType: Any = None,
- borderValue: Any = None) -> None
复制代码 该函数用于形态学滤波,其参数在代码中都列出来了的。- def dilate(src: Any,
- kernel: Any,
- dst: Any = None,
- anchor: Any = None,
- iterations: Any = None,
- borderType: Any = None,
- borderValue: Any = None) -> None
复制代码 该函数用于图像的膨胀操作,通过相邻像素范围内的局部极大运算来膨胀一张图片,从参数src输入,dst输出,其中第二个参数就是前面的核。- def distanceTransform(src: Any,
- distanceType: Any,
- maskSize: Any,
- dst: Any = None,
- dstType: Any = None) -> None
复制代码 上面函数是二值化函数,用于对图像的二值化操作,这是个常用函数。图像二值化是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。- def subtract(src1: Any,
- src2: Any,
- dst: Any = None,
- mask: Any = None,
- dtype: Any = None) -> None
复制代码 该函数为图像相减操作,是将二值化的图像使用相应位置的像素进行相减操作。- def watershed(image: Any,
- markers: Any) -> None
复制代码 该函数是分水岭的基本函数,算法使用效果主要就是该函数完成,其参数在代码的注释中已经标注出来了。其效果如下图所示,在圆形的边界位置,已经用细小的红线在绘制出识别区域。
源代码如下
- # -*- coding: utf-8 -*-
- import cv2
- import numpy as np
- camera = cv2.VideoCapture(0)
- # 判断视频是否打开
- if (camera.isOpened()):
- print('Open')
- else:
- print('摄像头未打开')
- # 测试用,查看视频size
- size = (int(camera.get(cv2.CAP_PROP_FRAME_WIDTH)),
- int(camera.get(cv2.CAP_PROP_FRAME_HEIGHT)))
- print('size:' + repr(size))
- while True:
- # 读取视频流
- grabbed, frame_lwpCV = camera.read()
- gray_lwpCV = cv2.cvtColor(frame_lwpCV, cv2.COLOR_BGR2GRAY)
- ret, binary = cv2.threshold(gray_lwpCV, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU) # 二值化
- cv2.imshow("binary_image", binary)
- kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3)) # 产生一个kernel
- '''
- def getStructuringElement(shape: Any, # 形状
- ksize: Any, # kernel尺寸
- anchor: Any = None) -> None
- '''
- mb = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel, iterations=2) # 形态学操作
- '''
- def morphologyEx(src: Any, # 原图像
- op: Any, # 操作类型
- # MORPH_ERODE = 0, //腐蚀
- # MORPH_DILATE = 1, //膨胀
- # MORPH_OPEN = 2, //开操作
- # MORPH_CLOSE = 3, //闭操作
- # MORPH_GRADIENT = 4, //梯度操作
- # MORPH_TOPHAT = 5, //顶帽操作
- # MORPH_BLACKHAT = 6, //黑帽操作
- # MORPH_HITMISS = 7
- kernel: Any, # 用于膨胀操作的结构元素,kernel
- dst: Any = None,
- anchor: Any = None, # 参考点
- iterations: Any = None,
- borderType: Any = None,
- borderValue: Any = None) -> None
- MORPH_OPEN(开),内部就是进行了先腐蚀后膨胀的操作。
- MORPH_CLOSE(闭),其实内部就是进行了先膨胀后腐蚀的操作。
- MORPH_GRADIENT(梯度),内部是膨胀减去腐蚀。
- '''
- sure_bg = cv2.dilate(mb, kernel, iterations=3) # 对输入图像用特定结构元素进行膨胀操作
- '''
- def dilate(src: Any,
- kernel: Any,
- dst: Any = None,
- anchor: Any = None,
- iterations: Any = None,
- borderType: Any = None,
- borderValue: Any = None) -> None
- '''
- cv2.imshow("mor_opt", sure_bg)
- # 距离变换
- dist = cv2.distanceTransform(mb, cv2.DIST_L2, 3) # 距离变换
- '''
- def distanceTransform(src: Any, # 二值化图像
- distanceType: Any, # 计算距离的类型,CV_DIST_L1、CV_DIST_L2 、CV_DIST_C
- maskSize: Any, # 距离变换掩码矩阵的大小
- dst: Any = None,
- dstType: Any = None) -> None
- '''
- dist_output = cv2.normalize(dist, 0, 1.0, cv2.NORM_MINMAX)
- cv2.imshow("distance_t", dist_output * 50)
- ret, surface = cv2.threshold(dist, dist.max() * 0.6, 255, cv2.THRESH_BINARY)
- cv2.imshow("surface_bin", surface)
- surface_fg = np.uint8(surface)
- unknown = cv2.subtract(sure_bg, surface_fg) # 图像的相减操作
- '''
- def subtract(src1: Any,
- src2: Any,
- dst: Any = None,
- mask: Any = None, # 可选操作掩码; 这是一个8位单通道数组,用于指定要更改的输出数组的元素。
- dtype: Any = None) -> None # 输出阵列的可选深度
- '''
- ret, markers = cv2.connectedComponents(surface_fg) # 连通域标识
- '''
- def connectedComponents(image: Any, # image是threshold得到的二值图
- labels: Any = None,
- connectivity: Any = None,
- ltype: Any = None) -> None
- '''
- print(ret)
- # 分水岭
- markers = markers + 1
- markers[unknown == 255] = 0
- markers = cv2.watershed(frame_lwpCV, markers=markers)
- '''
- def watershed(image: Any,
- markers: Any) -> None
- 第二个入参markers必须包含了种子点信息。
- 在执行分水岭函数watershed之前,必须对第二个参数markers进行处理,它应该包含不同区域的轮廓,
- 每个轮廓有一个自己唯一的编号,轮廓的定位可以通过Opencv中findContours方法实现,这个是执行
- 分水岭之前的要求。接下来执行分水岭会发生什么呢?算法会根据markers传入的轮廓作为种子(也就是
- 所谓的注水点),对图像上其他的像素点根据分水岭算法规则进行判断,并对每个像素点的区域归属进行划
- 定,直到处理完图像上所有像素点。而区域与区域之间的分界处的值被置为“-1”,以做区分。
- '''
- frame_lwpCV[markers == -1] = [0, 0, 255]
- cv2.imshow("result_image", frame_lwpCV)
- key = cv2.waitKey(1) & 0xFF
- # 按'q'健退出循环
- if key == ord('q'):
- break
- # When everything done, release the capture
- camera.release()
- cv2.destroyAllWindows()
复制代码
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容图片侵权或者其他问题,请联系本站作侵删。
侵权投诉