📜  透视变换

📅  最后修改于: 2021-01-08 05:15:46             🧑  作者: Mango


当人眼看到附近的事物时,它们看起来比远处的事物更大。这一般称为透视图。而变换是将对象等从一种状态转移到另一种状态。

因此,总体而言,透视图转换处理将3d世界转换为2d图像的过程。人类视觉的工作原理与照相机的工作原理相同。

我们将详细了解发生这种情况的原因,即靠近您的那些对象看起来较大,而远离您的那些对象看起来较小,即使您到达它们时看起来较大。

我们将从参考框架的概念开始讨论:

参照系:

参照系基本上是一组与我们测量某些东西相关的值。

透视

5帧参考

为了分析3d世界/图像/场景,需要5种不同的参考框架。

  • 目的
  • 世界
  • 相机
  • 图片
  • 像素点

对象坐标系

对象坐标系用于建模对象。例如,检查特定对象相对于其他对象是否位于适当的位置。这是一个3D坐标系。

世界坐标系

世界坐标系用于在3维世界中关联对象。这是一个3D坐标系。

相机坐标系

摄像机坐标系用于将对象与摄像机相关联。这是一个3D坐标系。

影像座标框

它不是3D坐标系,而是2D系统。它用于描述3d点如何在2d图像平面中映射。

像素坐标系

这也是一个二维坐标系。每个像素都有一个像素坐标值。

这5帧之间的转换

转型

那就是如何将3d场景转换为带有像素图像的2d。

现在我们将在数学上解释这个概念。

数学观点

哪里

Y = 3d对象

y = 2d图片

f =相机的焦距

Z =物体与相机之间的距离

现在,在此变换中形成了两个不同的角度,由Q表示。

第一个角度是

棕褐色

负号表示图像是反转的。形成的第二个角度是:

tan1

比较这两个方程,我们得到

结果

从这个方程式中,我们可以看到,当光线从物体撞击后从相机反射回来时,就形成了反转图像。

通过此示例,我们可以更好地理解这一点。

例如

计算形成的图像尺寸

假设已经拍摄了一个身高5m的人的图像,并且该人站在距相机50m的距离处,我们必须告诉我们,使用焦距为50mm的相机,该人的图像的大小是多少。

解:

由于焦距以毫米为单位,因此我们必须将所有事物转换为毫米才能进行计算。

所以,

Y = 5000毫米。

f = 50毫米。

Z = 50000毫米。

将值放在公式中,我们得到

式

= -5毫米

同样,减号表示图像已反转。