电商小程序制作一个需要多少钱,seo网络优化公司排名,建设主题网站的顺序一般是,最大的网站模板网机器视觉之目标检测和边界框简介
在图像分类任务里#xff0c;我们假设图像里只有一个主体目标#xff0c;并关注如何识别该目标的类别。然而#xff0c;很多时候图像里有多个我们感兴趣的目标#xff0c;我们不仅想知道它们的类别#xff0c;还想得到它们在图像中的具体…机器视觉之目标检测和边界框简介
在图像分类任务里我们假设图像里只有一个主体目标并关注如何识别该目标的类别。然而很多时候图像里有多个我们感兴趣的目标我们不仅想知道它们的类别还想得到它们在图像中的具体位置。在计算机视觉里我们将这类任务称为目标检测object detection或物体检测。
目标检测在多个领域中被广泛使用。例如在无人驾驶里我们需要通过识别拍摄到的视频图像里的车辆、行人、道路和障碍的位置来规划行进线路。机器人也常通过该任务来检测感兴趣的目标。安防领域则需要检测异常目标如歹徒或者炸弹。
在接下来的几节里我们将介绍目标检测里的多个深度学习模型。在此之前让我们来了解目标位置这个概念。先导入实验所需的包或模块。
%matplotlib inline
from PIL import Image
from matplotlib import pyplot as plt下面加载本节将使用的示例图像。可以看到图像左边是一只狗右边是一只猫。它们是这张图像里的两个主要目标。
边界框
在目标检测里我们通常使用边界框bounding box来描述目标位置。边界框是一个矩形框可以由矩形左上角的xxx和yyy轴坐标与右下角的xxx和yyy轴坐标确定。我们根据上面的图的坐标信息来定义图中狗和猫的边界框。图中的坐标原点在图像的左上角原点往右和往下分别为xxx轴和yyy轴的正方向。
# bbox是bounding box的缩写
dog_bbox, cat_bbox [60, 45, 378, 516], [400, 112, 655, 493]我们可以在图中将边界框画出来以检查其是否准确。画之前我们定义一个辅助函数bbox_to_rect。它将边界框表示成matplotlib的边界框格式。
def bbox_to_rect(bbox, color): # 将边界框(左上x, 左上y, 右下x, 右下y)格式转换成matplotlib格式# ((左上x, 左上y), 宽, 高)return plt.Rectangle(xy(bbox[0], bbox[1]), widthbbox[2]-bbox[0], heightbbox[3]-bbox[1],fillFalse, edgecolorcolor, linewidth2)我们将边界框加载在图像上可以看到目标的主要轮廓基本在框内。
fig plt.imshow(img)
fig.axes.add_patch(bbox_to_rect(dog_bbox, blue))
fig.axes.add_patch(bbox_to_rect(cat_bbox, red));在目标检测里不仅需要找出图像里面所有感兴趣的目标而且要知道它们的位置。位置一般由矩形边界框来表示。