news 2026/5/9 13:33:33

CANN PTO ConvTile编程模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN PTO ConvTile编程模型

ConvTile 编程模型

【免费下载链接】pto-isaParallel Tile Operation (PTO) is a virtual instruction set architecture designed by Ascend CANN, focusing on tile-level operations. This repository offers high-performance, cross-platform tile operations across Ascend platforms.项目地址: https://gitcode.com/cann/pto-isa

PTO Lib 程序可基于ConvTile编写卷积相关算子。ConvTile是固定容量的 2D 到 6D 缓冲对象,也是 PTO 卷积类操作中的主要计算单元和数据搬运单元。

从概念上说,ConvTile驻留在片上 Tile 存储中(类似寄存器文件或片上 SRAM),并通过TLOAD/TSTORE与全局内存(GM)之间搬运数据。

本文档说明include/pto/common/pto_tile.hpp中的 C++ConvTile类型及其布局和形状约束。

ConvTile 表示什么

一个ConvTile主要由以下几类属性定义:

  • 位置(Location):该 Tile 所属的逻辑存储类别(如矩阵/立方寄存器等)。
  • 元素类型(Element type):标量元素类型(如floathalfint8_t等)。
  • 缓冲区大小(Buffer size)ConvTile的静态缓冲容量。
  • 布局(Layout):如NCHWNHWCNC1HWC0等,用于指导 lowering 和目标相关优化路径。
  • 形状(Shape)pto::ConvTileShape<...>,支持最多 6 个维度。

pto::ConvTile类型

ConvTile通过 C++ 模板类型声明:

pto::ConvTile< pto::TileType Loc_, Element_, BufferSize_, pto::Layout_ layout, pto::ConvTileShape Shape_ >;

位置(TileType

TileType表示 Tile 的逻辑/物理存储类别,同时参与重载选择和编译期检查。

常见位置包括:

  • TileType::Vec:向量 Tile 存储(UB / 向量流水线)。
  • TileType::Mat:通用矩阵 Tile 存储(矩阵 L1)。

每条指令允许使用哪些位置,应以docs/isa/下对应指令文档为准。

容量(BufferSize_

BufferSize_定义了 Tile 对象的静态容量。多数指令要求 Tile 具备静态形状,以便在编译期进行特化和优化。

布局(pto::Layout

ConvTile包含一个布局枚举,如:

  • NCHW
  • NHWC
  • NC1HWC0
  • FRACTAL_Z
  • FRACTAL_Z_S16S8

布局信息会影响后端实现、lowering 路径以及特定目标上的快速路径选择。

形状(pto::ConvTileShape

pto::ConvTileShape<...Shapes>支持 1 到 6 个整型模板参数。每个维度既可以是编译期常量,也可以是pto::DYNAMIC(即-1)。

  • 静态维度保存在类型信息中,可通过ConvTileShape::staticShape[dim]获取。
  • 动态维度保存在运行时对象ConvTileShape::shape[dim]中,并由ConvTileShape(...)构造函数赋值。

构造函数会通过static_assert检查“运行时传入参数个数是否与动态维度数量一致”,因此若构造参数不匹配,会在编译期报错。

地址绑定(TASSIGN

在手动放置流程中,TASSIGN(tile, addr)用于把一个ConvTile对象绑定到实现定义的地址。

在自动模式中,TASSIGN(tile, addr)可能根据构建配置被处理为 no-op。

具体约束请参考docs/isa/TASSIGN.md

最小示例

#include <pto/pto-inst.hpp> using namespace pto; void example(__gm__ half* in, __gm__ half* out) { using TileT = ConvTile<TileType::Mat, half, 4096, Layout::NC1HWC0, pto::ConvTileShape<1, 1, 16, 16, 16>>; using GShape = Shape<1, 1, 16, 16, 16>; using GStride = Stride<1 * 16* 16* 16, 16* 16* 16, 16 * 16, 16, 1>; using GT = GlobalTensor<half, GShape, GStride, Layout::NC1HWC0>; GT gin(in); TileT tile5d; TASSIGN(tile5d, 0x0); TLOAD(tile5d, gin); }

【免费下载链接】pto-isaParallel Tile Operation (PTO) is a virtual instruction set architecture designed by Ascend CANN, focusing on tile-level operations. This repository offers high-performance, cross-platform tile operations across Ascend platforms.项目地址: https://gitcode.com/cann/pto-isa

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 13:31:30

2026年,如何挑选靠谱的冷镦油过滤机生产商?这几点是关键

在紧固件、轴承等金属零部件制造领域&#xff0c;冷镦工艺是核心环节&#xff0c;而冷镦油的清洁度直接关系到模具寿命、产品精度与生产成本。随着2026年工业制造向智能化、绿色化深度转型&#xff0c;选择一台高效、可靠的冷镦油过滤机&#xff0c;已成为企业降本增效与合规运…

作者头像 李华
网站建设 2026/5/9 13:29:32

生成式AI核心技术演进:从MoE架构到多模态学习与AGI探索

1. 从专家混合到通用智能&#xff1a;生成式AI的技术演进与前沿趋势如果你在过去一年里关注过AI领域的新闻&#xff0c;大概率会被“大模型”、“多模态”、“AGI”这些词汇轮番轰炸。从ChatGPT的全民狂欢&#xff0c;到Google Gemini的横空出世&#xff0c;再到OpenAI Q*&…

作者头像 李华
网站建设 2026/5/9 13:29:30

AI如何重塑创业金融:从SVM到神经网络的投资决策革命

1. 项目概述&#xff1a;当创业金融遇见AI&#xff0c;一场持续三十年的“算力革命”如果你在2010年前后接触过创业投资或早期融资&#xff0c;可能会记得那时的场景&#xff1a;投资人桌上堆满了厚厚的商业计划书&#xff0c;决策很大程度上依赖于创始人的口才、团队的背景和一…

作者头像 李华
网站建设 2026/5/9 13:28:48

CANN算子Add测试报告

【免费下载链接】cann-competitions 本仓库用于 CANN 开源社区各类竞赛、开源课题、社区任务等课题发布、开发者作品提交和展示。 项目地址: https://gitcode.com/cann/cann-competitions 元信息&#xff08;请如实填写&#xff0c;此区块将由组委会脚本自动解析&#xf…

作者头像 李华
网站建设 2026/5/9 13:25:42

DeepEn2023:首个边缘AI能耗数据集,量化模型能效,驱动可持续AI发展

1. 项目概述与核心价值 最近几年&#xff0c;AI模型越做越大&#xff0c;从云端服务器一路“卷”到了我们手边的手机、摄像头和传感器上。这就是所谓的“边缘AI”。好处显而易见&#xff1a;响应快、隐私好、不依赖网络。但一个现实问题也随之而来——能耗。一个模型在云端数据…

作者头像 李华
网站建设 2026/5/9 13:24:18

3步搞定网易云音乐自动打卡:每天300首轻松升LV10的完整指南

3步搞定网易云音乐自动打卡&#xff1a;每天300首轻松升LV10的完整指南 【免费下载链接】neteasy_music_sign 网易云自动听歌打卡签到300首升级&#xff0c;直冲LV10 项目地址: https://gitcode.com/gh_mirrors/ne/neteasy_music_sign 还在为网易云音乐等级提升而烦恼吗…

作者头像 李华