news 2026/5/9 20:03:29

CANN/ops-cv图像处理Col2im算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-cv图像处理Col2im算子

Col2im

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品×

功能说明

  • 算子功能:从批处理输入张量中提取滑动局部块,将滑动局部块数组合并为一个大张量。

  • 计算公式:

    考虑一个形状为$(N,C,∗)$的批处理input张量,其中$N$是批处理维度,$C$是通道维度,而$∗$表示任意空间维度。

    此操作将input空间维度内的每个滑动kernel_size大小的块展平为形状是$(N,C×\prod(kernel_size),L)$的3-D output张量的列(即最后一维)。

    其中:

    • $C×\prod(kernel_size)$是每个块内的值的数量(一个块有$\prod(kernel_size)$个空间位置,每个空间位置都包含一个$C$通道向量),而$L$是这些块的总数:

      $$ L=\prod_d⌊{\frac{spatial_size[d]+2×padding[d]−dilation[d]×(kernel_size[d]−1)−1}{stride[d]}+1}⌋ $$

    • spatial_size由input(上面的$∗$)的空间维度构成,而$d$覆盖所有空间维度。 因此,在最后一个维度(列维度)索引,output会给出某个块内的所有值。

参数说明

参数名输入/输出/属性描述数据类型数据格式
gradOutput输入反向输入,对应公式中的output。BFLOAT16、FLOAT16、FLOAT5HD
inputSize属性输入张量的形状,对应公式中的spatial_size。INT64ND
kernelSize属性卷积核的大小,对应公式中的kernel_size。INT64ND
dilation属性膨胀参数,对应公式中的dilation。INT64ND
padding属性卷积的填充大小,对应公式中的padding。INT64ND
stride属性卷积的步长,对应公式中的stride。INT64ND
out输出梯度计算结果,对应公式中的input。数据类型和数据格式需要与`gradOutput`的数据类型和数据格式一致。BFLOAT16、FLOAT16、FLOAT5HD

约束说明

调用说明

调用方式样例代码说明
aclnn接口test_aclnn_im2col_backward通过aclnnIm2colBackward接口方式调用Col2im算子。

【免费下载链接】ops-cv本项目是CANN提供的图像处理、目标检测相关的算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-cv

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 20:03:01

CANN/runtime运行时核资源控制

# 运行时核资源控制 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 为了提高Device核资源的使用率以及隔离性,Runtime支持控制Device的核资源。当前支持配置Device粒度、Strea…

作者头像 李华
网站建设 2026/5/9 20:02:29

深度解析AlienFX Tools:500KB轻量级Alienware设备全面控制实战指南

深度解析AlienFX Tools:500KB轻量级Alienware设备全面控制实战指南 【免费下载链接】alienfx-tools Alienware systems lights, fans, and power control tools and apps 项目地址: https://gitcode.com/gh_mirrors/al/alienfx-tools AlienFX Tools是一套专为…

作者头像 李华
网站建设 2026/5/9 20:00:57

项目介绍 MATLAB实现基于BMA-GRU 贝叶斯模型平均(BMA)结合门控循环单元(GRU)进行股票价格预测(含模型描述及部分示例代码)专栏近期有大量优惠 还请多多点一下关注 加油 谢谢 你的鼓励

MATLAB实现基于BMA-GRU 贝叶斯模型平均(BMA)结合门控循环单元(GRU)进行股票价格预测的详细项目实例 请注意此篇内容只是一个项目介绍 更多详细内容可直接联系博主本人 或者访问对应标题的完整博客或者文档下载页面(…

作者头像 李华
网站建设 2026/5/9 20:00:34

文献计量分析实战:基于Python与VOSviewer的AI研究趋势洞察

1. 项目概述:一次基于文献数据的AI发展“体检”最近在整理过去的项目资料,翻到了几年前做的一个关于人工智能研究趋势的文献计量分析。这个项目的时间窗口是2015到2020年,正好是AI从实验室走向产业化的关键爆发期。当时做这个分析的初衷很简单…

作者头像 李华
网站建设 2026/5/9 19:58:11

CANN/driver设备资源管理

dcmi_get_device_resource_info 【免费下载链接】driver 本项目是CANN提供的驱动模块,实现基础驱动和资源管理及调度等功能,使能昇腾芯片。 项目地址: https://gitcode.com/cann/driver 函数原型 int dcmi_get_device_resource_info (int card_i…

作者头像 李华
网站建设 2026/5/9 19:50:42

高通-大坑-高通晓龙npu推理 Qwen3-VL Step-1 ONNX 推理,模型乱回答

背景 多模态大模型正在逐步从云端推理走向端侧部署。端侧部署的核心挑战不是简单地把 PyTorch 模型转换为 ONNX,而是要让模型在移动 SoC 的 NPU / DSP 加速器上稳定运行,同时保持可接受的生成质量、延迟和功耗。 本文讨论的是一次 Qwen3-VL 类视觉语言模型的端侧部署调试过…

作者头像 李华