📜  计算机视觉快速概述

📅  最后修改于: 2021-04-17 02:18:57             🧑  作者: Mango

计算机视觉是指从图像,文本,视频等中提取信息。有时计算机视觉试图模仿人类的视觉。它是基于计算机的智能或人工智能的子集,可从数字图像或视频中收集信息并对其进行分析以定义属性。

整个过程涉及图像获取,筛选,分析,识别和提取信息。这种广泛的处理过程可以帮助计算机理解任何视觉内容并据此采取行动。计算机视觉项目将数字视觉内容转换为精确的描述,以收集多维数据。然后,将这些数据转换为计算机可读语言,以辅助决策过程。人工智能这一分支的主要目标是教机器从图像中收集信息。

计算机视觉的应用

  • 医学影像:计算机视觉有助于MRI重建,自动病理学,诊断和计算机辅助手术等。
  • AR / VR:对象遮挡,从里到外的跟踪和从里到外的跟踪,用于虚拟现实和增强现实。
  • 智能手机:我们使用的所有照片滤镜(包括社交媒体上的动画滤镜),QR码扫描仪,全景构造,计算摄影,人脸检测器,图像检测器(例如Google Lens,Night Sight)都是计算机视觉应用程序。
  • 互联网:图像搜索,制图,照片字幕,用于地图的Ariel成像,视频分类等。

使用OpenCV的计算机视觉

OpenCV(开源计算机视觉)是一种跨平台且免费使用的功能库,基于实时计算机视觉,该计算机视觉支持支持图像和视频处理的深度学习框架。在计算机视觉中,主要元素是从图像中提取像素以研究对象,从而了解其包含的内容。以下是Computer Vision试图在照片中识别的一些关键方面:

  • 对象检测:对象的位置。
  • 物体识别:图像中的物体及其位置。
  • 对象分类:对象所在的广泛类别。
  • 对象分割:属于该对象的像素。

需要计算机视觉

从自拍照到风景图像,今天我们到处都是各种各样的照片。 Internet Trends的一份报告说,人们每天上传超过18亿张照片,而这仅仅是上传图像的数量。考虑一下如果算上手机中存储的图像,数字将是多少。我们在以下网站上消费了4、146、600个视频 YouTube并每天发送103、447、520封垃圾邮件。同样,这只是其中的一部分-通信,媒体和娱乐,物联网都在为这一数字做出积极贡献。这种大量可用的视觉内容需要分析和理解,而计算机视觉通过教学机器来“查看”这些图像和视频来帮助实现这一目标。