AutoGLM-Phone-9B快速部署：跟着步骤走，轻松跑通第一个Demo-平芜编程栈

AutoGLM-Phone-9B快速部署：跟着步骤走，轻松跑通第一个Demo

1. 准备工作：了解AutoGLM-Phone-9B

AutoGLM-Phone-9B是一款专为移动端优化的多模态大语言模型，它能够同时处理视觉、语音和文本信息。这个模型特别适合在资源有限的设备上运行，因为它经过了轻量化设计，参数规模控制在90亿左右。

1.1 你需要准备什么

在开始之前，请确保你有以下条件：

至少2块NVIDIA RTX 4090显卡（这是最低要求）
基本的Linux命令行操作经验
一个可以访问的终端环境

2. 启动模型服务

2.1 进入脚本目录

首先，我们需要找到模型服务的启动脚本。打开你的终端，输入以下命令：

cd /usr/local/bin

这个目录下应该有一个名为run_autoglm_server.sh的脚本文件。

2.2 运行启动脚本

确认你在正确的目录后，运行以下命令启动服务：

sh run_autoglm_server.sh

如果一切顺利，你会看到类似这样的输出：

INFO: Starting model loading... INFO: Model loaded successfully INFO: Server is running on port 8000

这表示模型服务已经成功启动，正在监听8000端口。

3. 验证模型服务

3.1 访问Jupyter Lab

为了测试模型是否正常工作，我们可以使用Jupyter Lab来运行一个简单的测试脚本。

打开你的Jupyter Lab界面
创建一个新的Python笔记本

3.2 运行测试代码

在新的笔记本中，输入以下代码并运行：

from langchain_openai import ChatOpenAI # 设置模型参数 chat_model = ChatOpenAI( model="autoglm-phone-9b", temperature=0.5, # 控制回答的创造性 base_url="http://localhost:8000/v1", # 确保这是你的服务地址 api_key="EMPTY", # 当前不需要API密钥 extra_body={ "enable_thinking": True, # 显示推理过程 "return_reasoning": True, # 返回推理细节 }, streaming=True, # 启用流式输出 ) # 发送第一个测试问题 response = chat_model.invoke("你是谁？") print(response.content)

3.3 检查结果

如果一切正常，你应该会看到类似这样的回答：

我是AutoGLM-Phone-9B，一个专为移动设备优化的多模态人工智能助手。我可以处理文本、图像和语音信息，帮助你解决各种问题。

4. 常见问题解决

4.1 服务启动失败

如果运行run_autoglm_server.sh时遇到问题：

检查显卡驱动是否正确安装
确认你有至少2块RTX 4090显卡
查看日志文件中的错误信息

4.2 连接问题

如果Python脚本无法连接到服务：

确认服务确实在运行（检查端口8000是否被监听）
检查base_url是否正确
确保没有防火墙阻止连接

4.3 性能问题

如果响应速度慢：

检查GPU使用情况（使用nvidia-smi命令）
考虑降低temperature参数值
关闭enable_thinking和return_reasoning选项

5. 总结

5.1 我们完成了什么

通过本教程，你已经成功：

启动了AutoGLM-Phone-9B模型服务
通过Python脚本验证了服务可用性
了解了基本的故障排除方法

5.2 下一步建议

现在你可以尝试：

发送更复杂的问题测试模型能力
探索多模态功能（如图像识别）
开发自己的应用程序集成这个模型

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

终极指南：如何彻底重置Cursor设备限制实现无限免费试用

终极指南：如何彻底重置Cursor设备限制实现无限免费试用【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reached your tr…

李华

Halcon Deep OCR实战：手把手教你用模板匹配实现动态文本追踪（附GigE相机配置）

Halcon动态OCR实战：从模板匹配到GigE相机联调的完整解决方案在工业视觉检测领域，文本识别从来不是静态的游戏。当药盒在传送带上翻滚、当零件在机械臂间旋转，传统OCR技术往往束手无策——不是识别率骤降，就是直接丢失目标。本文…

李华

二手茶桌一般都有哪些材质类型？

很多朋友装修自家茶室，或是给办公室添休闲茶区，都想淘一张性价比高的二手茶桌。但真去挑的时候才发现，材质种类好多，搞不清楚各有什么优缺点，也不知道哪款适合自己。今天就跟大家掰扯清楚，二手茶桌常见的材…

李华

wiliwili：跨平台B站客户端的终极指南 - 让游戏主机变身全能娱乐终端

wiliwili：跨平台B站客户端的终极指南 - 让游戏主机变身全能娱乐终端【免费下载链接】wiliwili 第三方B站客户端，目前可以运行在PC全平台、PSVita、PS4 、Xbox 和 Nintendo Switch上项目地址: https://gitcode.com/GitHub_Trending/wi/wiliwili …

李华

如何让DBeaver数据库连接不再烦恼：一站式JDBC驱动解决方案

如何让DBeaver数据库连接不再烦恼：一站式JDBC驱动解决方案【免费下载链接】dbeaver-driver-all dbeaver所有jdbc驱动都在这，dbeaver all jdbc drivers ,come and download with me , one package come with all jdbc drivers. 项目地址: https://gitc…

李华

STC15单片机PCA模块实战：用CCP0引脚实现按键外部中断（附蓝桥杯CT107D平台完整代码）

STC15单片机PCA模块深度实战：CCP0引脚实现高精度按键中断与LED控制在嵌入式开发中，外部中断是实现实时响应的关键功能。传统方法通常使用固定的外部中断引脚，但当这些引脚被占用或需要更多中断源时，STC15单片机的PCA（…

李华