📜  带有Python的AI –计算机视觉

📅  最后修改于: 2020-12-11 05:49:43             🧑  作者: Mango


计算机视觉涉及使用计算机软件和硬件对人类视觉进行建模和复制。在本章中,您将详细了解这一点。

计算机视觉

计算机视觉是一门研究如何根据场景中存在的结构的属性从其2d图像重建,中断和理解3d场景的学科。

计算机视觉层次结构

计算机视觉分为以下三个基本类别-

  • 低视力-它包括用于特征提取的过程图像。

  • 中级视觉-包括对象识别和3D场景解释

  • 高级视觉-它包括对场景的概念描述,例如活动,意图和行为。

计算机视觉与图像处理

图像处理研究图像到图像的转换。图像处理的输入和输出都是图像。

计算机视觉是根据物理对象的图像对它们进行清晰,有意义的描述的构造。计算机视觉的输出是对3D场景中的结构的描述或解释。

应用领域

计算机视觉在以下领域找到了应用-

机器人技术

  • 定位自动确定机器人位置

  • 导航

  • 避障

  • 组装(孔内钉,焊接,喷漆)

  • 操纵(例如PUMA机器人操纵器)

  • 人机交互(HRI):与人互动并为人服务的智能机器人

药物

  • 分类和检测(例如病变或细胞分类和肿瘤检测)

  • 2D / 3D分割

  • 3D人体器官重建(MRI或超声)

  • 视觉引导机器人手术

安全

  • 生物识别(虹膜,指纹,面部识别)
  • 监视检测某些可疑的活动或行为

运输

  • 自动驾驶汽车
  • 安全性,例如驾驶员警惕性监控

工业自动化应用

  • 工业检查(缺陷检测)
  • 部件
  • 条形码和包装标签读取
  • 对象分类
  • 文件理解(例如OCR)

安装有用的软件包

对于使用Python的计算机视觉,您可以使用一个流行的库,称为OpenCV (开源计算机视觉)。它是主要针对实时计算机视觉的编程功能库。它是用C++编写的,其主要接口是C++。您可以在以下命令的帮助下安装此软件包-

pip install opencv_python-X.X-cp36-cp36m-winX.whl

X代表您计算机上安装的Python版本以及您所拥有的Win32或64位。

如果您正在使用anaconda环境,则使用以下命令安装OpenCV-

conda install -c conda-forge opencv

读取,写入和显示图像

大多数CV应用程序需要获取图像作为输入并生成图像作为输出。在本节中,您将学习如何在OpenCV提供的功能的帮助下读写图像文件。

OpenCV函数用于读取,显示,写入图像文件

OpenCV为此提供了以下功能-

  • imread()函数-这是读取图像的函数。 OpenCV imread()支持各种图像格式,例如PNG,JPEG,JPG,TIFF等。

  • imshow()函数-这是用于在窗口中显示图像的函数。窗口自动适合图像尺寸。 OpenCV imshow()支持各种图像格式,例如PNG,JPEG,JPG,TIFF等。

  • imwrite()函数-这是用于写入图像的函数。 OpenCV imwrite()支持各种图像格式,例如PNG,JPEG,JPG,TIFF等。

此示例显示了以一种格式读取图像的Python代码-在窗口中显示图像,并以另一种格式写入同一图像。考虑下面显示的步骤-

导入OpenCV软件包,如图所示-

import cv2

现在,要读取特定图像,请使用imread()函数-

image = cv2.imread('image_flower.jpg')

要显示图像,请使用imshow()函数。您可以在其中看到图像的窗口的名称为image_flower

cv2.imshow('image_flower',image)
cv2.destroyAllwindows()

形象花

现在,我们可以使用imwrite()函数将同一图像写入其他格式,例如.png-

cv2.imwrite('image_flower.png',image)

输出True表示图像已成功也以.png文件格式写入同一文件夹中。

True

注意-函数destroyallWindows()只会破坏我们创建的所有窗口。

色彩空间转换

在OpenCV中,不使用常规RGB颜色存储图像,而是以相反的顺序(即BGR顺序)存储图像。因此,读取图像时的默认颜色代码为BGR。 cvtColor()颜色转换函数用于将图像从一种颜色代码转换为另一种颜色代码。

考虑以下示例,将图像从BGR转换为灰度。

导入OpenCV软件包,如图所示-

import cv2

现在,要读取特定图像,请使用imread()函数-

image = cv2.imread('image_flower.jpg')

现在,如果我们使用imshow()函数看到此图像,则可以看到该图像在BGR中。

cv2.imshow('BGR_Penguins',image)

企鹅

现在,使用cvtColor()函数将此图像转换为灰度。

image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)

灰企鹅

边缘检测

看到粗略的草图后,人类可以轻松识别许多物体类型及其姿势。这就是为什么边缘在人类的生活以及计算机视觉的应用中起着重要作用的原因。 OpenCV提供了非常简单和有用的函数Canny()来检测边缘。

下面的示例清楚地标识了边缘。

导入OpenCV软件包,如图所示-

import cv2
import numpy as np

现在,要读取特定图像,请使用imread()函数。

image = cv2.imread('Penguins.jpg')

现在,使用Canny()函数检测已读取图像的边缘。

cv2.imwrite(‘edges_Penguins.jpg’,cv2.Canny(image,200,300))

现在,要显示带有边缘的图像,请使用imshow()函数。

cv2.imshow(‘edges’, cv2.imread(‘‘edges_Penguins.jpg’))

该Python程序将创建带有边缘检测功能的名为edge_penguins.jpg的图像。

边企鹅

人脸检测

人脸检测是计算机视觉的引人入胜的应用之一,这使其更加逼真且具有未来感。 OpenCV具有执行面部检测的内置功能。我们将使用Haar级联分类器进行人脸检测。

Haar级联数据

我们需要数据才能使用Haar级联分类器。您可以在我们的OpenCV软件包中找到此数据。安装OpenCv后,您可以看到文件夹名称haarcascades 。将存在用于不同应用程序的.xml文件。现在,复制所有这些文件以用于不同用途,然后粘贴到当前项目下的新文件夹中。

以下是使用Haar Cascade来检测下图所示的Amitabh Bachan头像的Python代码-

腹部

导入OpenCV软件包,如图所示-

import cv2
import numpy as np

现在,使用HaarCascadeClassifier来检测人脸-

face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')

现在,要读取特定图像,请使用imread()函数-

img = cv2.imread('AB.jpg')

现在,将其转换为灰度,因为它将接受灰度图像-

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

现在,使用face_detection.detectMultiScale ,执行实际的面部检测

faces = face_detection.detectMultiScale(gray, 1.3, 5)

现在,在整个面部周围绘制一个矩形-

for (x,y,w,h) in faces:
   img = cv2.rectangle(img,(x,y),(x+w, y+h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)

该Python程序将创建一个名为Face_AB.jpg的图像,进行人脸检测

面对AB

眼睛检测

眼睛检测是计算机视觉的另一个引人入胜的应用,它使计算机视觉更加逼真和未来。 OpenCV具有执行眼睛检测的内置功能。我们将使用Haar级联分类器进行眼睛检测。

以下示例给出了使用Haar Cascade来检测下图中给出的Amitabh Bachan头像的Python代码-

Haar AB脸

导入OpenCV软件包,如图所示-

import cv2
import numpy as np

现在,使用HaarCascadeClassifier来检测人脸-

eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')

现在,要读取特定图像,请使用imread()函数

img = cv2.imread('AB_Eye.jpg')

现在,将其转换为灰度,因为它将接受灰度图像-

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

现在借助eye_cascade.detectMultiScale ,执行实际的人脸检测

eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)

现在,在整个面部周围绘制一个矩形-

for (ex,ey,ew,eh) in eyes:
   img = cv2.rectangle(img,(ex,ey),(ex+ew, ey+eh),(0,255,0),2)
cv2.imwrite('Eye_AB.jpg',img)

该Python程序将创建带有眼睛检测功能的名为Eye_AB.jpg的图像,如下所示-

眼AB