news 2026/5/21 3:43:36

基于单视图几何摄像机内参的投影成像原理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于单视图几何摄像机内参的投影成像原理

理论基础:

焦距 f 就是胶片到小孔的距离

摄像机焦距和fov存在一一对应的关系,fov其实就是摄像机焦距的另一种更直观的表达方式

摄像机坐标系的原点就是针孔位置:

摄像机焦距就是原点到像平面的距离

通过将: ( 点的物理坐标/点的深度z )* f-[相机以像素为单位的焦距] 就可以得到点的物理坐标到像平面坐标的转换

计算方式:

根据图像长宽和fov得到图像的相机内参,从而得到3D点到图像平面的映射关系

代码实现:

从图像通过假设fov的方式得到相机内参的代码:

def generate_camera_params(image_path, fx=None, fy=None, cx=None, cy=None, fov=60): """ Generate camera parameters for 3D visualization. Args: image_path: Path to the image fx, fy: Focal lengths in pixels (if None, will be calculated from fov) cx, cy: Principal point coordinates in pixels (if None, will be set to image center) fov: Field of view in degrees (default: 60°) Returns: dict: Camera parameters with keys 'fx', 'fy', 'cx', 'cy' """ image = Image.open(image_path) w, h = image.size # Generate pseudo camera params if not provided if fx is None or fy is None: fx = round(w / (2 * np.tan(np.deg2rad(fov) / 2)), 2) fy = round(h / (2 * np.tan(np.deg2rad(fov) / 2)), 2) if cx is None or cy is None: cx = round(w / 2, 2) cy = round(h / 2, 2) cam_params = {'fx': fx, 'fy': fy, 'cx': cx, 'cy': cy} return cam_params

由摄像机坐标系下的物理3D点,根据对应摄像机内参来得到对应像平面上2D像素坐标的代码:

def convert_3dbbox(point, cam_params): """ Convert 3D bounding box to 2D image coordinates We represent 3D bounding boxes as: `[x_center, y_center, z_center, x_size, y_size, z_size, roll, pitch, yaw]` - **x_center, y_center, z_center**: Object center in camera coordinates (meters) - **x_size, y_size, z_size**: Object dimensions (meters) - **roll, pitch, yaw**: Rotation angles (radians) """ x, y, z, x_size, y_size, z_size, pitch, yaw, roll = point hx, hy, hz = x_size / 2, y_size / 2, z_size / 2 local_corners = [ [ hx, hy, hz], [ hx, hy, -hz], [ hx, -hy, hz], [ hx, -hy, -hz], [-hx, hy, hz], [-hx, hy, -hz], [-hx, -hy, hz], [-hx, -hy, -hz] ] def rotate_xyz(_point, _pitch, _yaw, _roll): # 这是一个 XYZ 顺序的欧拉角旋转 x0, y0, z0 = _point x1 = x0 y1 = y0 * math.cos(_pitch) - z0 * math.sin(_pitch) z1 = y0 * math.sin(_pitch) + z0 * math.cos(_pitch) x2 = x1 * math.cos(_yaw) + z1 * math.sin(_yaw) y2 = y1 z2 = -x1 * math.sin(_yaw) + z1 * math.cos(_yaw) x3 = x2 * math.cos(_roll) - y2 * math.sin(_roll) y3 = x2 * math.sin(_roll) + y2 * math.cos(_roll) z3 = z2 return [x3, y3, z3] img_corners = [] for corner in local_corners: # 8个顶点 rotated = rotate_xyz(corner, np.deg2rad(pitch), np.deg2rad(yaw), np.deg2rad(roll)) X, Y, Z = rotated[0] + x, rotated[1] + y, rotated[2] + z if Z > 0: x_2d = cam_params['fx'] * (X / Z) + cam_params['cx'] y_2d = cam_params['fy'] * (Y / Z) + cam_params['cy'] img_corners.append([x_2d, y_2d]) return img_corners

多视图情况:

多视图中的物体表示方法:

1,所有帧都以第一帧的相机坐标系为世界坐标系,直接预测物体在世界坐标系中的3D位置

2,每一帧都: 预测目标物体在当前帧的相机坐标系下的3d坐标,这样z_center就是对应的相对于当前帧的相机的深度

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/20 13:56:19

Linux平台设备驱动

Linux内核使用总线来处理设备,总线连接了CPU与这些设备。有些总线足够智能,并内嵌了可发现性逻辑以枚举连接到总线上的设备。在引导阶段的初期,Linux内核会请求这些总线提供它们所枚举的设备以及这些设备正常工作所需的资源(如中断…

作者头像 李华
网站建设 2026/5/20 12:15:04

初探 Mysql Docker

前言我在專案開發階段常使用 MySQL Docker,主要是好處,快速啟動、零安裝成本、版本切換,不污染本機系統(不喜歡本機裝一堆有的沒的,特別是有的只會用那麼一次)。而且如果在需要,任何時間、任何機器,都能還原…

作者头像 李华
网站建设 2026/5/20 12:27:10

大数据传输时代:如何选择高效可靠的数据传输工具?

在数据驱动决策的今天,大数据已成为企业核心资产。然而,随着数据量呈几何级数增长,海量数据的快速、安全、稳定迁移与同步,正成为众多企业数字化转型道路上的严峻挑战。传统的传输方式在TB甚至PB级的数据洪流面前,如同…

作者头像 李华
网站建设 2026/5/20 21:23:50

企业网盘私有化部署,构建安全高效的数据资产管理基石

在数字化转型浪潮中,企业数据资产的价值与日俱增,如何安全、高效地存储、管理与协作这些核心资产,成为每个组织必须面对的关键议题。近年来,越来越多的企业将目光投向网盘系统的私有化部署,这一模式正逐渐成为保障数据…

作者头像 李华
网站建设 2026/5/20 19:27:35

39、深入探究 Linux 中的睡眠与计时机制

深入探究 Linux 中的睡眠与计时机制 在 Linux 系统编程中,睡眠和计时是常见的操作,它们在很多场景下都发挥着重要作用。本文将详细介绍 Linux 中不同的睡眠和计时接口,包括它们的特点、使用方法以及适用场景。 1. 纳秒级睡眠:nanosleep() Linux 中, usleep() 函数已被…

作者头像 李华
网站建设 2026/5/20 10:58:42

31、Linux 动态内存管理全解析

Linux 动态内存管理全解析 1. 映射文件与内存管理接口概述 大多数地址空间包含少量映射文件,如程序可执行文件本身、C 语言及其他共享库和数据文件。可以查看 /proc/self/maps 或 pmap 程序的输出,了解进程中的映射文件示例。Linux 提供了一系列接口用于获取和释放内存…

作者头像 李华