news 2026/6/6 5:20:38

CANN ops-nn EluV2算子API文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN ops-nn EluV2算子API文档

EluV2

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

产品支持情况

产品是否支持
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

计算指数线性单元激活函数Elu的结果。

函数原型

每个算子分为两段式接口,必须先调用“aclnnEluV2GetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnEluV2”接口执行计算。

aclnnStatus aclnnEluV2GetWorkspaceSize( const aclTensor* self, const aclScalar* alpha, const aclScalar* scale, const aclScalar* inputScale, aclTensor* out, uint64_t* workspaceSize, aclOpExecutor** executor);
aclnnStatus aclnnEluV2( void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream);

参数说明

aclnnEluV2GetWorkspaceSize

参数名输入/输出描述使用说明类型数据格式维度非连续Tensor
self输入输入数据张量数据类型支持fp16,fp32,bf16aclTensor*ND1-8
alpha输入输入参数数据类型fp32,,默认值为1.0aclScalar*
scale输入输入参数数据类型fp32,,默认值为1.0aclScalar*
inputScale输入输入参数数据类型fp32,,默认值为1.0aclScalar*
out输出输出数据张量数据类型同输入selfaclTensor*同输入self同输入self
workspaceSize输出返回需要在Device侧申请的workspace大小uint64_t*
executor输出返回op执行器,包含了算子计算流程aclOpExecutor**

aclnnEluV2

参数名输入/输出描述
workspace输入在Device侧申请的workspace内存地址
workspaceSize输入在Device侧申请的workspace大小,由第一段接口aclnnEluV2GetWorkspaceSize获取
executor输入op执行器,包含了算子计算流程,由第一段接口 aclnnEluV2GetWorkspaceSize 获取
stream输入指定执行任务的Stream流

返回值

返回值说明
ACLNN_SUCCESS (0)成功
ACLNN_ERR_PARAM_NULLPTR输入参数中存在空指针
ACLNN_ERR_PARAM_INVALID输入参数不合法(dtype 不匹配、shape 不一致、不支持的 dtype、不支持的 format、维度超限等)
ACLNN_ERR_INNER_CREATE_EXECUTOR内部创建执行器失败
ACLNN_ERR_INNER_NULLPTR内部操作返回空指针

约束说明

调用示例

示例代码参考examples/test_aclnn_elu_v2.cpp,具体编译和执行过程请参考编译与运行样例。

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/6 5:19:55

GenAI落地防护实战:隐私、安全与合规三层运行时免疫架构

1. 项目概述:这不是一本“安全手册”,而是一份GenAI落地现场的防护日志“Securing GenAI: Vol 3 — Privacy, Security, and Compliance”这个标题里藏着三个被日常讨论严重稀释的词:Privacy(隐私)、Security&#xff…

作者头像 李华
网站建设 2026/6/6 5:17:42

CANN/sip插值算子文档

asdInterpWithCoeff 【免费下载链接】sip 本项目是CANN提供的一款高效、可靠的高性能信号处理算子加速库,基于华为Ascend AI处理器,专门为信号处理领域而设计。 项目地址: https://gitcode.com/cann/sip 产品支持情况 产品是否支持Atlas 200I/50…

作者头像 李华
网站建设 2026/6/6 5:17:39

jQuery Visible插件最佳实践:企业级应用中的可见性检测方案

jQuery Visible插件最佳实践:企业级应用中的可见性检测方案 【免费下载链接】jquery-visible A jquery plugin which allows us to quickly check if an element is within the browsers visual viewport regardless of the window scroll position 项目地址: htt…

作者头像 李华
网站建设 2026/6/6 5:17:39

Holo-3.1-4B模型架构解析:从Qwen 3.5到多模态AI的演进之路

Holo-3.1-4B模型架构解析:从Qwen 3.5到多模态AI的演进之路 【免费下载链接】Holo-3.1-4B 项目地址: https://ai.gitcode.com/hf_mirrors/Hcompany/Holo-3.1-4B Holo-3.1-4B是基于Qwen 3.5架构开发的多模态AI模型,融合了文本、图像和视频理解能力…

作者头像 李华
网站建设 2026/6/6 5:16:30

Amazfit 推出 Balance 3 与 Balance Ultra,开启混合训练新时代

全新 Balance 系列搭载 Amazfit 混合训练系统,将先进智能手表硬件与 Zepp App 智能分析能力深度融合,帮助运动员在力量训练、耐力提升、恢复管理及日常生活等多个维度实现科学规划与系统化训练全球领先智能穿戴品牌 Amazfit(隶属于 Zepp Heal…

作者头像 李华