news 2026/5/9 16:53:17

CANN torchtitan-npu 安装指南

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN torchtitan-npu 安装指南

软件安装

【免费下载链接】torchtitan-npuAscend Extension for torchtitan项目地址: https://gitcode.com/cann/torchtitan-npu

版本配套表

torchtitan-npu支持Atlas 800T A3等昇腾训练硬件形态。软件版本配套表如下:

torchtitan-npu版本torchtitan版本PyTorch版本torch_npu版本CANN版本Python版本Triton Ascend
master(主线)0.2.22.10.02.10.0rc29.0.0-beta.1Python3.11.x3.2.0

源码安装

1.安装依赖的软件

在安装torchtitan-npu之前,请参考版本配套表,安装配套的昇腾软件栈,软件列表如下:

依赖软件软件安装指南
昇腾NPU驱动《驱动固件安装指南》
昇腾NPU固件
Toolkit(开发套件)《CANN 软件安装指南》
Kernel(算子包)
NNAL(Ascend Transformer Boost加速库)
PyTorch《Ascend Extension for PyTorch 配置与安装》
torch_npu插件

2. 下载torchtitan-npu源码master分支(请注意下列命令的大小写)

git clone https://gitcode.com/cann/torchtitan-npu.git

3. 安装torchtitan-npu

cd torchtitan-npu pip install -r requirements.txt pip install -e .

注:如有旧版本Torchtitan-npu,请先卸载,再进行安装

4. 安装inductor-npu-ext(可选,使能torch.compile时需要)

为了在 NPU 平台上充分利用torch.compile原生的编译能力,torchtitan_npu在保留 Dynamo 与 Inductor 既有编译流程的基础上,接入了 Codegen 后端inductor-npu-ext。该后端借助 AutoFuse 的自动融合能力,从 Inductor IR 生成 AscendC 融合 Kernel。

inductor_npu_ext 需要从源码安装。在运行环境内执行以下命令:

git clone https://gitcode.com/Ascend/torchair.git cd torchair/experimental/_inductor_npu_ext/ pip3 install -e ./python/ cd -

注:具体torch.compile特性文档请参考 说明文档

PyPI安装

pip install torchtitan_npu==0.2.2.post1

卸载

pip uninstall torchtitan_npu

【免费下载链接】torchtitan-npuAscend Extension for torchtitan项目地址: https://gitcode.com/cann/torchtitan-npu

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 16:52:48

创业团队如何借助Taotoken以较低成本快速验证AI产品创意

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 创业团队如何借助Taotoken以较低成本快速验证AI产品创意 对于资源有限的创业团队而言,在产品原型开发阶段,…

作者头像 李华
网站建设 2026/5/9 16:51:14

轨迹识别与空间记忆分析技术原理与应用

1. 轨迹形状识别与空间记忆分析技术概述轨迹形状识别与空间记忆分析是近年来在行为分析、智能监控、运动科学等领域广泛应用的前沿技术。这项技术通过捕捉和分析物体或个体的移动轨迹,识别其运动模式、行为特征和空间记忆能力。我在多个智慧园区和运动分析项目中实际…

作者头像 李华
网站建设 2026/5/9 16:50:36

YOLO11实战优化:小目标检测专场 | 结合SAHI(切片辅助超推理)框架,不改模型直接让大分辨率小目标无处遁形

一、开篇:当小目标成为“看不见的敌人” 在无人机航拍、卫星遥感、工业质检、安防监控等场景中,你是否常遇到这种情况:模型整体mAP看着挺漂亮,可一到实际业务中,那些芝麻大的目标——远处的行人、散落的零件缺陷、遥感影像中的车辆——要么漏检、要么置信度低到无法触发告…

作者头像 李华
网站建设 2026/5/9 16:50:34

AI伦理实践:从算法公平到可信人工智能的技术实现

1. 人工智能伦理:从理论原则到美国实践的深度解析在过去的十年里,我亲眼见证了人工智能从实验室的奇思妙想,迅速渗透到我们社会运行的每一个毛细血管。从最初算法推荐你下一首想听的歌,到如今辅助医生诊断癌症、决定谁能获得贷款、…

作者头像 李华
网站建设 2026/5/9 16:49:24

CANN/asc-devkit:AddDeqRelu API文档

AddDeqRelu 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。 项目地址: https://gitcode.com…

作者头像 李华
网站建设 2026/5/9 16:49:08

对比直接使用原生API与通过Taotoken聚合调用的账单清晰度差异

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比直接使用原生API与通过Taotoken聚合调用的账单清晰度差异 在AI应用开发与运营过程中,成本的可观测性与可管理性是团…

作者头像 李华