news 2026/5/9 16:55:31

CANN/pyasc指数运算API

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/pyasc指数运算API

asc.language.basic.exp

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

asc.language.basic.exp(dst: LocalTensor, src: LocalTensor, count: int) → None

asc.language.basic.exp(dst: LocalTensor, src: LocalTensor, mask: int, repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool = True) → None

asc.language.basic.exp(dst: LocalTensor, src: LocalTensor, mask: List[int], repeat_times: int, repeat_params: UnaryRepeatParams, is_set_mask: bool = True) → None

按元素取自然指数。

对应的Ascend C函数原型

template <typename T> __aicore__ inline void Exp(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, const int32_t& calCount)
template <typename T, bool isSetMask = true> __aicore__ inline void Exp(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, uint64_t mask[], const uint8_t repeatTimes, const UnaryRepeatParams& repeatParams)
template <typename T, bool isSetMask = true> __aicore__ inline void Exp(const LocalTensor<T>& dstLocal, const LocalTensor<T>& srcLocal, uint64_t mask, const uint8_t repeatTimes, const UnaryRepeatParams& repeatParams)

参数说明

  • is_set_mask:是否在接口内部设置mask。
  • dst: 目的操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • src: 源操作数。类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。
  • count: 参与计算的元素个数。
  • mask: 用于控制每次迭代内参与计算的元素。
  • repeat_times: 重复迭代次数。
  • params: 控制操作数地址步长的参数。

约束说明

  • 操作数地址对齐要求请参见 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址对齐约束”。
  • 操作数地址重叠约束请参考 《Ascend C算子开发接口》 中的“通用说明和约束-通用地址重叠约束”。

调用示例

  • tensor高维切分计算样例-mask连续模式
    mask = 256 // asc.half.sizeof() # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.UnaryRepeatParams(1, 1, 8, 8) asc.exp(dst, src, mask=mask, repeat_times=4, repeat_params=params)
  • tensor高维切分计算样例-mask逐bit模式
    mask = [uint64_max, uint64_max] # repeat_times = 4,一次迭代计算128个数,共计算512个数 # dst_blk_stride, src_blk_stride = 1,单次迭代内数据连续读取和写入 # dst_rep_stride, src_rep_stride = 8,相邻迭代间数据连续读取和写入 params = asc.UnaryRepeatParams(1, 1, 8, 8) asc.exp(dst, src, mask=mask, repeat_times=4, repeat_params=params)
  • tensor前n个数据计算样例
    asc.exp(dst, src, count=512)

【免费下载链接】pyasc本项目为Python用户提供算子编程接口,支持在昇腾AI处理器上加速计算,接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 16:55:22

AI+MRP:用LLM与贝叶斯模型革新民意调查

1. 项目概述&#xff1a;当AI遇见传统民调&#xff0c;一场静悄悄的革命如果你关注过2020年美国大选前后的各种民调&#xff0c;可能会对当时某些预测的“翻车”记忆犹新。传统基于随机数字拨号&#xff08;RDD&#xff09;的电话调查&#xff0c;成本高昂、响应率持续走低&…

作者头像 李华
网站建设 2026/5/9 16:55:18

CANN ops-nn FastGelu算子

FastGelu 【免费下载链接】ops-nn 本项目是CANN提供的神经网络类计算算子库&#xff0c;实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-nn 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品√A…

作者头像 李华
网站建设 2026/5/9 16:53:45

AI时代网络安全教学:伦理困境、框架设计与实践路径

1. 项目概述&#xff1a;当AI成为课堂的“助教”与“考题”最近几年&#xff0c;AI技术&#xff0c;特别是大语言模型&#xff0c;像潮水一样涌入了各行各业。网络安全这个领域&#xff0c;作为技术的前沿阵地&#xff0c;感受尤为深刻。以前我们教学生&#xff0c;讲的是如何分…

作者头像 李华
网站建设 2026/5/9 16:53:43

CANN/ops-math 融合转置D算子

ConfusionTransposeD 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库&#xff0c;实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√ 功能说明 算子功能&#xff1a…

作者头像 李华
网站建设 2026/5/9 16:53:17

CANN torchtitan-npu 安装指南

软件安装 【免费下载链接】torchtitan-npu Ascend Extension for torchtitan 项目地址: https://gitcode.com/cann/torchtitan-npu 版本配套表 torchtitan-npu支持Atlas 800T A3等昇腾训练硬件形态。软件版本配套表如下&#xff1a; torchtitan-npu版本torchtitan版本…

作者头像 李华
网站建设 2026/5/9 16:52:48

创业团队如何借助Taotoken以较低成本快速验证AI产品创意

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 创业团队如何借助Taotoken以较低成本快速验证AI产品创意 对于资源有限的创业团队而言&#xff0c;在产品原型开发阶段&#xff0c;…

作者头像 李华