news 2026/5/9 17:51:49

CANN/ops-cv图像裁剪与调整大小算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-cv图像裁剪与调整大小算子

CropAndResize

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品
Atlas 训练系列产品

功能说明

  • 算子功能:从输入图像中提取多个裁剪区域,并将它们统一调整为指定大小,支持双线性插值和最近邻插值。

参数说明

参数名输入/输出/属性描述数据类型数据格式
x输入输入为四维的Tensor,其shape为(batch, image_height, image_width, depth),其中image_height和image_width必须是正数。UINT8、UINT16、INT8、INT16、INT32、INT64、FLOAT16、FLOAT、DOUBLENHWC
boxes输入二维Tensor,其shape为(num_boxes, 4)。第i行指定了box_index[i]在图像中一个框的位置,并且使用归一化坐标[y1, x1, y2, x2]进行表示。归一化后的y坐标值通过y*(image_height - 1)映射到图像坐标系中,因此归一化图像的高度[0, 1]区间会被映射到原始图像高度的[0,image_height - 1]区间。我们允许y1 > y2, 在这种情况下,采样的裁剪区域会是原始图像的上下翻转版。宽度维度的处理方式相似,归一化坐标值超出[0, 1]范围时,使用extrapolation_value外插值进行补齐。FLOAT16、FLOATND
box_index输入boxes的索引,其shape为(num_boxes)的一维tensor,取值范围[0, batch),box_index[i]的值指定了第i个框所对应的图像。INT32ND
crop_size输入包含2个元素的1-D的Tensor,shape为(crop_height, crop_width),所有裁剪后的图像区域都会被调整为此大小。图像内容的长宽比不会被保留。crop_height和crop_width必须是正数。INT32ND
extrapolation_value可选属性• 可选外插值。
• 默认值为 0.0。
FLOAT-
method可选属性• 指定调整大小时的采样方法,为可选字符串。提供的方法有:“bilinear”,“nearest”,“bilinear_V2”。
• 默认值为“bilinear”。
STRING-
y输出返回一个四维Tensor,shape大小为(num_boxes, crop_height, crop_width, depth)。FLOAT16、FLOATNHWC

约束说明

调用说明

调用方式调用样例说明
图模式调用test_geir_crop_and_resize通过算子IR构图方式调用CropAndResize算子。

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 17:51:48

EGAgent框架:基于实体关系图的长视频语义理解技术

1. 项目概述:当长视频遇见实体图最近在整理一段两小时的会议录像时突然意识到:人类理解长视频的核心能力,其实在于大脑能自动构建场景中的人物、物体及其关系网络。这种认知启发促使我们团队开发了EGAgent框架——一个通过动态构建和更新实体…

作者头像 李华
网站建设 2026/5/9 17:48:09

技术革命:AlienFX Tools - 500KB轻量级AWCC替代方案深度解析

技术革命:AlienFX Tools - 500KB轻量级AWCC替代方案深度解析 【免费下载链接】alienfx-tools Alienware systems lights, fans, and power control tools and apps 项目地址: https://gitcode.com/gh_mirrors/al/alienfx-tools 传统AWCC架构的局限性分析 Al…

作者头像 李华
网站建设 2026/5/9 17:48:09

初次使用Taotoken从注册到发出第一个ChatCompletions请求的全流程

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 初次使用Taotoken从注册到发出第一个ChatCompletions请求的全流程 1. 注册账号与获取API Key 要开始使用Taotoken,首先…

作者头像 李华
网站建设 2026/5/9 17:45:41

基于Python aiogram构建Telegram Bot服务管理平台:集成支付、订阅与智能客服

1. 项目概述与核心价值如果你正在运营一个需要用户订阅、支付和管理的服务,比如一个VPN、在线工具或者内容社区,那么管理后台、用户面板和支付系统这些基础设施的搭建,绝对是个让人头疼的活。传统的做法是开发一个Web后台,但这意味…

作者头像 李华
网站建设 2026/5/9 17:41:16

Qwen3-4B-Thinking推理模型实战:用中文思考链解决复杂逻辑问题

Qwen3-4B-Thinking推理模型实战:用中文思考链解决复杂逻辑问题 1. 模型概述与核心价值 Qwen3-4B-Thinking-2507-Gemini-Distill是一款专注于中文逻辑推理的AI模型,它能够将复杂的思考过程可视化,特别适合需要展示推理路径的应用场景。这个4…

作者头像 李华