news 2026/5/9 14:05:55

CANN/catlass基础矩阵乘

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/catlass基础矩阵乘

Basic Matmul

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

代码位置

功能说明

基础矩阵乘,cube算子,无AIV计算,非TLA实现。

类模板概述

  • 模板入参
    • class BlockMmad_:blockMmad类,矩阵乘组件
    • class BlockEpilogue_:blockEpilogue类,后处理组件,实际未使用
    • class BlockScheduler_:blockScheduler类,仅支持Gemm::Block::GemmIdentityBlockSwizzle
  • Params:
struct Params { GemmCoord problemShape; //用例shape GM_ADDR ptrA; //输入matA的GM起始地址 LayoutA layoutA; //输入matA的layout GM_ADDR ptrB; //输入matB的GM起始地址 LayoutB layoutB; //输入matB的layout GM_ADDR ptrC; //输出matC的GM起始地址 LayoutC layoutC; //输出matC的layout ... }
  • Arguments:
struct Arguments { GemmCoord problemShape; //用例shape GM_ADDR ptrA; //输入matA的GM起始地址 GM_ADDR ptrB; //输入matB的GM起始地址 GM_ADDR ptrC; //输出matC的GM起始地址 };

调用示例

kernel组装

using BlockMmad = Gemm::Block::BlockMmad<DispatchPolicy, L1TileShape, L0TileShape, AType, BType, CType>; using BlockEpilogue = void; using BlockScheduler = typename Gemm::Block::GemmIdentityBlockSwizzle<3, 0>; // kernel level using MatmulKernel = Gemm::Kernel::BasicMatmul<BlockMmad, BlockEpilogue, BlockScheduler>;

约束说明

该kernel在void operator()<AscendC::AIC>核函数中,调用blockMmad的方式不涉及异步和Preload,故仅支持block_mmad_pingpong等简单blockMmad组件

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 14:05:53

面向元宇宙边缘计算的任务中心化AI架构:设计、实现与挑战

1. 项目概述与核心价值最近几年&#xff0c;元宇宙和边缘计算这两个概念都火得不行&#xff0c;但真正能把它们揉在一起&#xff0c;并且解决实际用户痛点的方案&#xff0c;说实话&#xff0c;并不多见。我们团队折腾了大半年&#xff0c;搞出来一个叫“面向元宇宙边缘计算的统…

作者头像 李华
网站建设 2026/5/9 14:05:16

向量数据库基准测试实战:从原理到选型,科学评估性能

1. 向量数据库基准测试&#xff1a;为什么我们需要它&#xff0c;以及如何用好它如果你正在为你的AI应用&#xff08;比如RAG、推荐系统或者图像搜索&#xff09;挑选一个向量数据库&#xff0c;你大概率会面临一个幸福的烦恼&#xff1a;选择太多了。Qdrant、Weaviate、Milvus…

作者头像 李华
网站建设 2026/5/9 14:04:45

医疗AI可解释性:从技术原理到临床落地的实践指南

1. 项目概述&#xff1a;为什么医疗AI必须“看得懂”&#xff1f;在医疗这个关乎生命的领域&#xff0c;任何决策都容不得半点“黑箱”。想象一下&#xff0c;一位医生拿到一份AI系统出具的“高度疑似恶性肿瘤”的诊断报告&#xff0c;却无法获知AI是基于病灶的哪个特征、哪条影…

作者头像 李华
网站建设 2026/5/9 14:03:58

AEC行业AI与机器人应用的九大伦理挑战与应对策略

1. 项目概述&#xff1a;当AI与机器人走进建筑工地最近几年&#xff0c;我身边做建筑设计、施工和工程管理的朋友&#xff0c;聊天的画风变了。以前是“图纸改到第几版了”、“混凝土标号定了没”&#xff0c;现在张口闭口都是“我们项目准备上无人机做测绘了”、“那个AI审图平…

作者头像 李华
网站建设 2026/5/9 14:02:49

CANN/ops-cv最近邻上采样2D梯度算子

UpsampleNearest2dGrad 【免费下载链接】ops-cv 本项目是CANN提供的图像处理、目标检测相关的算子库&#xff0c;实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-cv 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DTAtlas A3 训练系列产品/Atl…

作者头像 李华
网站建设 2026/5/9 14:01:40

CANN/cannbot-skills开发规范

CANNBot Skills 开发规范 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体&#xff0c;本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills 通用命名规范 Skills、Agents 统一采用 dom…

作者头像 李华