news 2026/5/21 23:32:49

CANN/asc-devkit:SIMT bfloat16x2 floor函数

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/asc-devkit:SIMT bfloat16x2 floor函数

h2floor

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品x
Atlas A2 训练系列产品/Atlas A2 推理系列产品x
Atlas 200I/500 A2 推理产品x
Atlas 推理系列产品AI Corex
Atlas 推理系列产品Vector Corex
Atlas 训练系列产品x

功能说明

获取小于或等于输入数据各元素的最大整数值。

函数原型

inline bfloat16x2_t h2floor(bfloat16x2_t x)

参数说明

表 1参数说明

参数名输入/输出描述
x输入源操作数。

返回值说明

小于或等于输入数据各元素的最大整数值。特别场景说明如下:

  • 当输入元素为nan时,返回值为nan。
  • 当输入元素为inf时,返回值为inf。
  • 当输入元素为-inf时,返回值为-inf。

约束说明

需要包含的头文件

使用bfloat16x2_t类型接口需要包含"simt_api/asc_bf16.h"头文件。

#include "simt_api/asc_bf16.h"

调用示例

  • SIMT编程场景:

    __global__ __launch_bounds__(1024) void KernelIsFinite(bfloat16x2_t* dst, bfloat16x2_t* x) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = h2floor(x[idx]); }
  • SIMD与SIMT混合编程场景:

    __simt_vf__ __launch_bounds__(1024) inline void KernelIsFinite(__gm__ bfloat16x2_t* dst, __gm__ bfloat16x2_t* x) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = h2floor(x[idx]); }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/21 23:30:09

BDE最佳实践:避免常见陷阱的20个专业建议 [特殊字符]

BDE最佳实践:避免常见陷阱的20个专业建议 🚀 【免费下载链接】bde Basic Development Environment - a set of foundational C libraries used at Bloomberg. 项目地址: https://gitcode.com/gh_mirrors/bd/bde **BDE(Basic Developme…

作者头像 李华
网站建设 2026/5/21 23:26:43

中小企业如何利用Taotoken的Token Plan实现AI成本可控

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 中小企业如何利用Taotoken的Token Plan实现AI成本可控 对于有定期AI调用需求的中小团队而言,模型API的调用成本是技术选…

作者头像 李华
网站建设 2026/5/21 23:25:51

如何利用Machine Learning Experiments训练你的第一个神经网络模型

如何利用Machine Learning Experiments训练你的第一个神经网络模型 【免费下载链接】machine-learning-experiments 🤖 Interactive Machine Learning experiments: 🏋️models training 🎨models demo 项目地址: https://gitcode.com/gh_…

作者头像 李华
网站建设 2026/5/21 23:24:46

为什么选择YLGIFImage:解析iOS平台高效GIF播放的终极解决方案

为什么选择YLGIFImage:解析iOS平台高效GIF播放的终极解决方案 【免费下载链接】YLGIFImage Async GIF image decoder and Image viewer supporting play GIF images. It just use very less memory. 项目地址: https://gitcode.com/gh_mirrors/yl/YLGIFImage …

作者头像 李华
网站建设 2026/5/21 23:23:21

零基础跨行拿 10k 月薪 学会破局胜过天生优势

人生如同奔涌的比特流,暗礁与漩涡总在不经意间出现。 当挑战如恶意攻击般袭来,切莫因一时受阻而缴械投降。 那些在代码与协议中鏖战的日夜终将铸就铠甲,正如防火墙抵御入侵守护核心,只要目标坚定持续精进,终将在攻防…

作者头像 李华
网站建设 2026/5/21 23:23:20

入行安全必备干货 九大模块构建全套 Web 渗透知识

零基础想从业安全者入门必备|9 大模块构建 Web 渗透知识体系,可直接落地 很多刚接触Web渗透、网络安全的朋友,都会陷入「不知道学什么、从哪学、怎么落地」的迷茫。 今天整理了一套从0到1的系统化学习路径,涵盖基础概念、工具使…

作者头像 李华