news 2026/7/4 8:24:48

CANN/asc-devkit SIMD寄存器对齐存储API

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/asc-devkit SIMD寄存器对齐存储API

asc_storealign_postupdate

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

从矢量数据寄存器或掩码寄存器连续对齐搬出到UB的接口,实现NORM搬出模式并启用Post Update,接口调用后自动更新目的操作数地址。支持数据类型为b8、b16、b32。

函数原型

  • 从矢量数据寄存器连续对齐搬出到UB的场景
    __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ int8_t*& dst_align32b, vector_int8_t src, int32_t offset, vector_bool mask) __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ uint8_t*& dst_align32b, vector_uint8_t src, int32_t offset, vector_bool mask) __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ int16_t*& dst_align32b, vector_int16_t src, int32_t offset, vector_bool mask) __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ uint16_t*& dst_align32b, vector_uint16_t src, int32_t offset, vector_bool mask) __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ int32_t*& dst_align32b, vector_int32_t src, int32_t offset, vector_bool mask) __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ uint32_t*& dst_align32b, vector_uint32_t src, int32_t offset, vector_bool mask) __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ half*& dst_align32b, vector_half src, int32_t offset, vector_bool mask) __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ float*& dst_align32b, vector_float src, int32_t offset, vector_bool mask) __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ bfloat16_t*& dst_align32b, vector_bfloat16_t src, int32_t offset, vector_bool mask)
  • 从掩码寄存器连续对齐搬出到UB的场景
    __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ uint32_t*& dst, vector_bool src, int32_t offset) __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ uint16_t*& dst, vector_bool src, int32_t offset) __simd_callee__ inline void asc_storealign_postupdate(__ubuf__ uint8_t*& dst, vector_bool src, int32_t offset)

参数说明

  • 从矢量数据寄存器连续对齐搬出到UB的场景

    参数名输入/输出描述
    dst_align32b输入/输出目的操作数(矢量)的起始地址,搬运完成后该地址会被硬件自动Post Update。
    src输入源操作数(矢量数据寄存器)。
    offset输入地址偏移量。
    mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。
  • 从掩码寄存器连续对齐搬出到UB的场景

    参数名输入/输出描述
    dst输入/输出目的操作数(矢量)的起始地址,搬运完成后该地址会被硬件自动Post Update。
    src输入源操作数(掩码寄存器)。
    offset输入地址偏移量。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

__ubuf__ half* dst_align32b = (__ubuf__ half*)asc_get_phy_buf_addr(0); vector_half src; vector_bool mask = asc_create_mask_b16(PAT_ALL); int32_t offset = 128; asc_storealign_postupdate(dst_align32b, src, offset, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/4 8:23:29

CANN/ge DataFlow Python API参考

# DataFlow构图接口参考(Python) 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效…

作者头像 李华
网站建设 2026/7/4 8:21:27

3大深度感知挑战破解:RealSense D455点云处理实战指南

3大深度感知挑战破解:RealSense D455点云处理实战指南 【免费下载链接】librealsense RealSense SDK 项目地址: https://gitcode.com/GitHub_Trending/li/librealsense Intel RealSense D455深度相机在三维视觉应用中面临三大核心挑战:深度数据噪…

作者头像 李华
网站建设 2026/7/4 8:19:22

ftpserver安全部署指南:TLS加密、用户认证与访问控制最佳实践

ftpserver安全部署指南:TLS加密、用户认证与访问控制最佳实践 【免费下载链接】ftpserver Golang based autonomous FTP server with SFTP, S3, Dropbox, and Google Drive connectors. 项目地址: https://gitcode.com/gh_mirrors/ftp/ftpserver 为什么安全部…

作者头像 李华
网站建设 2026/7/4 8:17:55

内容审核系统:Instatic敏感内容过滤与人工审核

内容审核系统:Instatic敏感内容过滤与人工审核 【免费下载链接】Instatic Instatic is a modern self-hosted visual CMS - get it running in 1 minute 项目地址: https://gitcode.com/GitHub_Trending/in/Instatic Instatic作为一款现代自托管视觉CMS&…

作者头像 李华
网站建设 2026/7/4 8:14:51

让闲置设备变身AI超级计算机:Exo分布式AI集群入门指南

让闲置设备变身AI超级计算机:Exo分布式AI集群入门指南 【免费下载链接】exo Run frontier AI locally. 项目地址: https://gitcode.com/GitHub_Trending/exo8/exo 你是否曾经看着家里的旧MacBook、闲置的台式机,甚至树莓派,感叹它们只…

作者头像 李华