news 2026/6/19 23:43:52

CANN/Ascend C数据块最小规约函数

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/Ascend C数据块最小规约函数

asc_reduce_min_datablock

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT

功能说明

根据mask将每个DataBlock(32B)中的最小值,依次保存在dst中的最低位。

函数原型

__simd_callee__ inline void asc_reduce_min_datablock(vector_uint16_t& dst, vector_uint16_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_min_datablock(vector_int16_t& dst, vector_int16_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_min_datablock(vector_half& dst, vector_half src, vector_bool mask) __simd_callee__ inline void asc_reduce_min_datablock(vector_uint32_t& dst, vector_uint32_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_min_datablock(vector_int32_t& dst, vector_int32_t src, vector_bool mask) __simd_callee__ inline void asc_reduce_min_datablock(vector_float& dst, vector_float src, vector_bool mask)

参数说明

参数名输入/输出描述
dst输出目的操作数(矢量数据寄存器)。
src输入源操作数(矢量数据寄存器)。
mask输入源操作数掩码(掩码寄存器),用于指示在计算过程中哪些元素参与计算。对应位置为1时参与计算,为0时不参与计算。mask未筛选的元素在输出中置零。

矢量数据寄存器和掩码寄存器的详细说明请参见reg数据类型定义.md。

返回值说明

流水类型

PIPE_V

约束说明

调用示例

vector_half dst; vector_half src; vector_bool mask = asc_create_mask_b16(PAT_ALL); asc_loadalign(src, src_addr); // src_addr是外部输入的UB内存空间地址。 asc_reduce_min_datablock(dst, src, mask);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/19 23:43:19

如何高效运用图数据库:3个核心技巧实战指南

如何高效运用图数据库:3个核心技巧实战指南 【免费下载链接】indradb A graph database written in rust 项目地址: https://gitcode.com/gh_mirrors/in/indradb IndraDB是一款用Rust编写的高性能图数据库,为处理复杂关系数据提供了强大的解决方案…

作者头像 李华
网站建设 2026/6/19 23:34:57

从一根网线到一条消息:一次讲透网络分层模型与 OSI 七层模型

文章目录一、网络为什么要分层:复杂系统不能靠“全都混在一起”二、OSI 七层模型:从“业务数据”到“电信号”的完整路径三、物理层与数据链路层:数据如何跨过“第一段路”1. 物理层:比特究竟如何变成真实信号2. 数据链路层&#…

作者头像 李华
网站建设 2026/6/19 23:32:03

3步掌握Media Downloader:一站式媒体下载工具的终极解决方案

3步掌握Media Downloader:一站式媒体下载工具的终极解决方案 【免费下载链接】media-downloader Media Downloader is a Qt/C front end to yt-dlp, youtube-dl, gallery-dl, lux, you-get, svtplay-dl, aria2c, wget and safari books.. 项目地址: https://gitco…

作者头像 李华
网站建设 2026/6/19 23:24:58

Material Design Extensions文件对话框:打造专业的文件选择体验

Material Design Extensions文件对话框:打造专业的文件选择体验 【免费下载链接】MaterialDesignExtensions Material Design Extensions is based on Material Design in XAML Toolkit to provide additional controls and features for WPF apps 项目地址: http…

作者头像 李华
网站建设 2026/6/19 23:21:59

MC68F375 CTM9定时器DASM与PWMSM模块深度解析与实战指南

1. 项目概述与核心价值如果你正在使用像MC68F375这类经典的Freescale(现NXP)16位微控制器,并且项目里涉及到精确测量一个脉冲的宽度、生成一个特定时刻的触发信号,或者驱动一个电机需要PWM波,那么你大概率绕不开它的CT…

作者头像 李华