news 2026/5/9 14:54:38

CANN/pypto gather_in_l1 API 文档

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/pypto gather_in_l1 API 文档

pypto.experimental.gather_in_l1

【免费下载链接】pyptoPyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

该接口为定制接口,约束较多。不保证稳定性。

从GM上的Tensor离散搬运指定行的数据,同时每行搬运前size个数据至L1。

函数原型

gather_in_l1(src: Tensor, indices: Tensor, block_table: Tensor, block_size: int, size: int, is_b_matrix: bool, is_trans: bool) -> Tensor

参数说明

参数名输入/输出说明
src输入源操作数。
支持的数据类型为:DT_FP32, DT_FP16, DT_BF16, DT_INT8。
不支持空Tensor,支持两维。
indices输入源操作数的行偏移。
支持的数据类型为:DT_INT32, DT_INT64。
不支持空Tensor,支持两维。
Shape形状为[1,n]。
block_table输入源操作数。
支持的数据类型为DT_INT32。
不支持空Tensor,支持两维。
在实际使用中表示为 Page Attention 中的页表,形状为[1,block_table_size],其中block_table_size表示页表的长度。
block_size输入源操作数。
int 类型。
表示 Page Attention 中一个块可以放多少个token。
size输入每行搬运的数据数。
数据数要小于源操作数的列数。
is_b_matrix输入搬运后的结果,即输出Tensor是否作为matmul的B矩阵。
is_trans输入搬运后的结果,即输出Tensor是否转置。

返回值说明

返回输出Tensor

调用示例

src = pypto.tensor([16, 32], pypto.DT_FP32, "tensor_src") offset = pypto.tensor([1, 32], pypto.DT_INT32, "tensor_offset") out = pypto.experimental.gather_in_l1(src , offset, 20, false, false)

【免费下载链接】pyptoPyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 14:54:37

CANN/cann-competitions:伊格小队算子测试

团队信息 【免费下载链接】cann-competitions 本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。 项目地址: https://gitcode.com/cann/cann-competitions 团队名称:伊格小队所属单位:青岛恒星科技学院团…

作者头像 李华
网站建设 2026/5/9 14:50:28

CANN ops-nn Sigmoid梯度算子

SigmoidGrad 【免费下载链接】ops-nn 本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-nn 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品…

作者头像 李华
网站建设 2026/5/9 14:49:09

CANN/HCOMM拓扑层级类型查询

HcclRankGraphGetTopoTypeByLayer 【免费下载链接】hcomm HCOMM(Huawei Communication)是HCCL的通信基础库,提供通信域以及通信资源的管理能力。 项目地址: https://gitcode.com/cann/hcomm 产品支持情况 Ascend 950PR/Ascend 950DT&…

作者头像 李华
网站建设 2026/5/9 14:49:00

EFGP查提交申请记录

select serialNumber,processInstanceName, subject, (case when currentState1 then 進行中 when currentState3 then 已結案 when currentState4 then 已撤銷 when currentState0 then 未開始 else 已暫停 end) from ProcessInstance(nolock) where left(serialNumber,4)L…

作者头像 李华
网站建设 2026/5/9 14:41:30

内容创作场景下如何用Taotoken灵活调用最适合的文案生成模型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 内容创作场景下如何用Taotoken灵活调用最适合的文案生成模型 对于自媒体创作者、市场运营人员而言,每天面对不同平台、…

作者头像 李华
网站建设 2026/5/9 14:35:02

PM2 VSCode插件:在编辑器内可视化管理和监控Node.js进程

1. 项目概述:一个为PM2量身定制的VSCode插件如果你和我一样,日常开发中大量使用Node.js,并且用PM2来管理进程,那你肯定遇到过这样的场景:在终端和代码编辑器之间反复切换,只为查看某个服务的日志、重启一个…

作者头像 李华