news 2026/4/17 4:47:53

华为昇腾CANN深度学习环境搭建-以搭建VLLM为例

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
华为昇腾CANN深度学习环境搭建-以搭建VLLM为例

1 )首先确定vllm-ascend依赖。

Installation — vllm-ascend

确定cann的版本8.3.rc2

确定vllm和vllm-ascend的对照关系

2) 查询物理机的驱动版本

假设不是cann8.3rc2,那就安装

网址在这里,需要自己注册登录一下:

https://www.hiascend.com/developer/download/community/result?from=firmware&product=1&model=30&cann=8.3.RC2

下载toolkit和 kernels, 我是910b,如果是310请选择对照的版本。

下载完了以后就安装这俩驱动

安装完了以后,再安装一下这几个包,推荐使用conda安装。

pip3 install attrs cython 'numpy>=1.19.2,<=1.24.0' decorator sympy cffi pyyaml pathlib2 psutil protobuf==3.20.0 scipy requests absl-py --user

到这个阶段,驱动安装完了。

3)开始安装torch和torch-npu

这是下载地址:

https://www.hiascend.com/document/detail/zh/Pytorch/720/configandinstg/instg/insg_0004.html

其中8.3rc1和rc2可以通用。

然后安装npu-插件

安装完了以后,测试安装效果

python3 -c "import torch;import torch_npu; a = torch.randn(3, 4).npu(); print(a + a);"

然后安装vllm

安装完了vllm以后呢,torch会被重新装一下,版本可能和你的驱动不搭配。所以

这一步,需要按照第2步重新装一下torch和torch-npu

然后vllm-ascend版本和vllm版本要对照。

然后就结束了。大功告成。

(根据本人的经验,vllm0.11比0.12要快一些。)

4)vllm起量化模型。

vllm serve ./model_path --served-model-name qwen_quant --quantization ascend --max-model-len 90000 --port 8999

访问vllm接口:

为什么要截取90000,因为如果请求超过vllm的max_len 会报错,所以最好限制一下,不要超过vllm起服务时候的最大长度。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 17:49:23

全面解析5D影院设备多少钱一套与飞行影院设备厂家推荐

在探讨5D影院设备多少钱一套的内容时&#xff0c;我们需要考虑多个层面。首先&#xff0c;设备的类型和功能差异直接影响到价格。简单配置可能只需数万元&#xff0c;而高端设备则可能上百万元。其次&#xff0c;购买渠道的重要性不容忽视&#xff0c;选择知名供应商能够确保品…

作者头像 李华
网站建设 2026/4/17 3:25:46

EmotiVoice语音合成语音加密存储方案:保护隐私音色数据

EmotiVoice语音合成中的音色隐私保护实践 在虚拟偶像、智能客服和个性化有声内容日益普及的今天&#xff0c;用户越来越愿意尝试“用自己的声音”与数字世界互动。只需上传几秒钟的语音样本&#xff0c;AI就能克隆出高度相似的音色&#xff0c;生成带有情感表达的自然语音——这…

作者头像 李华
网站建设 2026/4/16 19:21:31

零基础入门:10分钟用EasyPlayer做第一个视频网站

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 创建一个极简的HTML5视频播放页面&#xff0c;集成EasyPlayer基础功能。只需要最基本的HTML和CSS代码&#xff0c;包含清晰的注释说明每个部分的作用。提供一键复制粘贴即可运行的完…

作者头像 李华
网站建设 2026/4/17 3:17:57

日本成功开发1.4nm纳米“光刻机”

来源&#xff1a;EETOP日本印刷株式会社&#xff08;DNP&#xff09;近日宣布&#xff0c;成功开发出电路线宽为10纳米的NIL纳米压印技术&#xff0c;可用于相当于1.4纳米等级的逻辑半导体电路图形化。 公司表示&#xff0c;该产品针对智能手机、数据中心、NAND Flash等应用场景…

作者头像 李华
网站建设 2026/4/15 13:09:04

AI如何简化Supervisord配置与管理?

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 创建一个AI辅助工具&#xff0c;能够根据用户输入的进程需求&#xff08;如Python脚本、Node.js服务等&#xff09;&#xff0c;自动生成最优的Supervisord配置文件。要求包含进程名…

作者头像 李华
网站建设 2026/4/16 15:08:01

密码锁小白必看:忘记密码怎么办?

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容&#xff1a; 制作一个面向新手的密码锁知识科普应用&#xff0c;包含&#xff1a;1. 密码锁类型介绍&#xff1b;2. 密码设置和记忆技巧&#xff1b;3. 忘记密码的基础解决方案&#xff1b;4. 预…

作者头像 李华