Qwen2.5-Coder-1.5B部署教程：Docker镜像快速启动与端口映射-平芜编程栈

Qwen2.5-Coder-1.5B部署教程：Docker镜像快速启动与端口映射

本文面向需要快速部署代码生成AI模型的开发者，手把手教你用Docker在10分钟内启动Qwen2.5-Coder-1.5B模型并配置端口映射，无需复杂的环境配置。

1. 环境准备与Docker安装

在开始部署之前，确保你的系统已经安装了Docker。如果你还没有安装，可以按照以下步骤操作：

Windows/Mac用户：

访问Docker官网下载Docker Desktop
双击安装包完成安装
启动Docker Desktop应用

Linux用户（Ubuntu示例）：

# 更新软件包列表 sudo apt-get update # 安装必要的依赖 sudo apt-get install apt-transport-https ca-certificates curl software-properties-common # 添加Docker官方GPG密钥 curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - # 添加Docker仓库 sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" # 安装Docker sudo apt-get update sudo apt-get install docker-ce # 验证安装 docker --version

安装完成后，运行docker ps命令检查Docker是否正常运行。如果看到空的容器列表，说明Docker已经准备就绪。

2. 拉取Qwen2.5-Coder-1.5B镜像

现在我们来获取Qwen2.5-Coder-1.5B的Docker镜像。打开终端或命令提示符，执行以下命令：

# 拉取官方镜像 docker pull qwen2.5-coder:1.5b # 查看已下载的镜像 docker images

这个镜像包含了预配置的Ollama环境和Qwen2.5-Coder-1.5B模型，大小约为3GB左右，下载时间取决于你的网络速度。

常见问题解决：

如果遇到权限问题，在命令前加上sudo（Linux/Mac）
如果下载速度慢，可以配置国内镜像加速器
如果提示镜像不存在，检查镜像名称是否正确

3. 启动容器与端口映射

镜像下载完成后，我们需要启动容器并配置端口映射，让外部能够访问模型服务。

3.1 基本启动命令

# 最简单的启动方式 docker run -d --name qwen-coder -p 11434:11434 qwen2.5-coder:1.5b

这个命令做了以下几件事：

-d：后台运行容器
--name qwen-coder：给容器起个名字方便管理
-p 11434:11434：将容器的11434端口映射到主机的11434端口
qwen2.5-coder:1.5b：使用的镜像名称

3.2 高级启动选项

如果你需要更多控制，可以使用以下增强命令：

# 带资源限制的启动命令 docker run -d \ --name qwen-coder \ -p 11434:11434 \ --memory="4g" \ --cpus="2" \ -v /path/to/your/data:/app/data \ qwen2.5-coder:1.5b

参数说明：

--memory="4g"：限制容器使用4GB内存
--cpus="2"：限制使用2个CPU核心
-v /path/to/your/data:/app/data：挂载数据卷，持久化存储

4. 验证部署是否成功

容器启动后，我们需要检查服务是否正常运行。

4.1 检查容器状态

# 查看容器运行状态 docker ps # 查看容器日志 docker logs qwen-coder

如果看到容器状态为"Up"，并且日志中没有错误信息，说明容器已经成功启动。

4.2 测试模型服务

打开浏览器，访问http://localhost:11434，你应该能看到Ollama的Web界面。或者使用curl命令测试：

# 测试API接口 curl http://localhost:11434/api/tags # 发送测试请求 curl -X POST http://localhost:11434/api/generate \ -d '{ "model": "qwen2.5-coder:1.5b", "prompt": "写一个Python函数计算斐波那契数列", "stream": false }'

如果收到正常的响应，说明模型服务已经成功运行。

5. 使用模型生成代码

现在让我们实际使用Qwen2.5-Coder-1.5B来生成一些代码。你可以通过Web界面或者API来与模型交互。

5.1 Web界面使用

打开浏览器访问http://localhost:11434
在模型选择下拉菜单中选取"qwen2.5-coder:1.5b"
在输入框中输入你的代码需求
点击发送，查看模型生成的代码

5.2 API调用示例

如果你更喜欢编程方式调用，这里是一些API使用示例：

Python示例：

import requests import json def generate_code(prompt): url = "http://localhost:11434/api/generate" payload = { "model": "qwen2.5-coder:1.5b", "prompt": prompt, "stream": False } response = requests.post(url, json=payload) if response.status_code == 200: return response.json()['response'] else: return f"Error: {response.status_code}" # 生成一个排序函数 code = generate_code("写一个Python函数对列表进行快速排序") print(code)

JavaScript示例：

async function generateCode(prompt) { const response = await fetch('http://localhost:11434/api/generate', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ model: 'qwen2.5-coder:1.5b', prompt: prompt, stream: false }) }); const data = await response.json(); return data.response; } // 使用示例 generateCode("写一个JavaScript函数验证邮箱格式") .then(code => console.log(code));

6. 常见问题与解决方法

在部署和使用过程中，你可能会遇到一些常见问题，这里提供解决方案：

6.1 端口冲突问题

如果11434端口已经被占用，你可以映射到其他端口：

# 映射到其他端口，比如11435 docker run -d --name qwen-coder -p 11435:11434 qwen2.5-coder:1.5b

6.2 内存不足问题

如果模型运行缓慢或崩溃，可能是内存不足：

# 增加内存限制 docker run -d --name qwen-coder -p 11434:11434 --memory="8g" qwen2.5-coder:1.5b

6.3 模型加载失败

如果模型无法加载，尝试重新拉取镜像：

# 删除旧容器 docker stop qwen-coder docker rm qwen-coder # 重新拉取和启动 docker pull qwen2.5-coder:1.5b docker run -d --name qwen-coder -p 11434:11434 qwen2.5-coder:1.5b