news 2026/5/21 21:02:12

Qwen3-Coder: 在世界中自主编程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Qwen3-Coder: 在世界中自主编程

Qwen3-Coder: 在世界中自主编程

2025/07/22 · 17 分钟 · 3363 词 · QwenTeam丨翻译: English

今天我们正式发布Qwen3-Coder,这是我们迄今为止最具代理能力的代码模型。Qwen3-Coder 拥有多个尺寸,但我们迫不及待地给大家提供当前最强大的版本,Qwen3-Coder-480B-A35B-Instruct。这是一个总参数量 480B,激活 35B 的 MoE 模型,原生支持 256K token的上下文并可通过 YaRN 扩展到 1M token,拥有卓越的代码和 Agent 能力。Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与Cluade Sonnet4 媲美。

与此同时,我们还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。Qwen Code 基于Gemini Code 进行二次开发,但我们进行了 prompt 和工具调用协议适配,使得 Qwen Code 可以最大程度激发 Qwen3-Coder 在 Agentic Coding任务上的表现。另外,Qwen3-Coder 可以和社区优秀的编程工具结合,如Claude Code、Cline 等,作为一款基础模型,我们期待在数字世界的任何角落都可以使用它,Agentic Coding in the World!

Qwen3-Coder

Pre-Training

我们在预训练阶段上仍然在努力,这次Qwen3-Coder 我们从不同角度进行 Scaling,以提升模型的代码能力:

  • 数据扩展:总计 7.5T(代码占比 70%),在保持通用与数学能力的同时,具备卓越的编程能力;

  • 上下文扩展:原生支持256K 上下文,借助 YaRN 可拓展至 1M,专为仓库级和动态数据(如 Pull Request)优化,助力 Agentic Coding;

  • 合成数据扩展:利用 Qwen2.5-Coder 对低质数据进行清洗与重写,显著提升整体数据质量;

Post-Training

Scaling Code RL: Hard to Solve, Easy to Verify

与当前社区普遍聚焦于竞赛类代码生成不同,我们认为所有的代码任务天然适合执行驱动的大规模强化学习。因此我们选择在更丰富的真实代码任务上扩展 Code RL 训练。通过自动扩展测试样例,我们构造了大量高质量的训练实例,成功释放了强化学习的潜力:不仅显著提升了代码执行成功率,还对其他任务带来增益。这将鼓励我们继续寻找 Hard to Solve, Easy to Verify 的任务,作为强化学习的土壤。

Scaling Long-Horizon RL

在真实世界的 Software Engneering Task,比如 SWE-Bench,模型需要在环境中不断交互,自主规划、选择工具调用、接受反馈不断做出新决策,这是一个典型的 Long-Horizon RL 任务。我们在 Qwen3-Coder 的后训练阶段执行了 Agent RL,鼓励模型通过多轮交互的方式利用工具解决问题。Agent RL 的主要挑战在于 Environment Scaling,我们实现了可验证环境的扩展系统,借助阿里云的基础设施,实现同时运行 20k 独立环境。这一套基础设施可以提供大规模的强化学习反馈和评测,最终我们在 SWE-bench Verified 上实现了开源模型 SOTA 的效果。

Code with Qwen3-Coder

Qwen Code

Qwen Code 是一个 CLI 工具,修改自 Gemini CLI,针对 Qwen3‑Coder系列的模型增强了解析器和工具支持。

确保已安装 Node.js 20 及以上版本,可以通过以下命令安装:

bash

1

curl -qL https://www.npmjs.com/install.sh | sh


然后通过 npm 管理器安装 Qwen Code:

另一种方式是从源码安装:

Qwen Code 支持 OpenAI SDK 调用 LLM,你可以导出以下环境变量,或者简单地将其放在.envfile中。

bash

1

2

3

export OPENAI_API_KEY="your_api_key_here"

export OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"

export OPENAI_MODEL="qwen3-coder-plus"


现在,你可以通过简单地输入qwen来享受 Qwen-Code 和 Qwen 带来的编程体验。

Claude Code

除了 Qwen Code 之外,现在还可以将 Qwen3‑Coder 与 Claude Code 搭配使用。只需在阿里云百炼平台申请 API Key,并安装 Claude Code,即可开始畅享编码体验。

bash

1

npm install -g @anthropic-ai/claude-code

我们提供了两种接入方式,帮助你无缝地用 Qwen3‑Coder 进行编码。

使用dashscope提供的代理 API

只需要将Anthropic的base url替换成dashscope上提供的endpoint即可。

可选方案 2:使用 claude-code-config 自定义路由

Optional 2: 使用 claude-code-config 自定义路由

claude-code-router 是一个第三方的路由工具,用于为 Claude Code 灵活地切换不同的后端 API。dashScope平台提供了一个简单的扩展包 claude-code-config,可为 claude-code-router 生成包含 dashScope 支持的默认配置。

生成配置文件和插件目录:

该命令会自动生成 ccr 所需的配置文件和插件目录。你也可以手动调整 ~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/ 中的配置。

最后,通过 ccr 开始使用 Claude Code:

至此,你即可通过 ccr 使用 Claude Code 畅享 Qwen3‑Coder 的强大编码能力。祝开发顺利!

Cline

配置 Qwen3-Coder-480B-A35B-instruct 以使用 cline
‒ 进入 cline 的配置设置
‒ 选择“OpenAI Compatible”模式
‒ 在 OpenAI Compatible API tokens处,输入从 Dashscope 获取的密钥
‒ 勾选“使用自定义基础 URL”,并输入:https://dashscope.aliyuncs.com/compatible-mode/v1
‒ 输入模型名称:qwen3-coder-plus

Use Cases

演示案例

演示1Example: Physics-Based Chimney Demolition Simulation with Controlled Explosion

1 / 7

00:08

API

如您希望通过百炼 API 平台 Alibaba Cloud Model Studio 调用 Qwen3-Coder,欢迎使用以下示例代码进行测试:

python

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

import os

from openai import OpenAI

client = OpenAI(

api_key=os.getenv("DASHSCOPE_API_KEY"),

base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",

)

prompt = "Help me create a web page for an online bookstore."

# Send request to qwen3-coder-plus model

completion = client.chat.completions.create(

model="qwen3-coder-plus",

messages=[

{"role": "system", "content": "You are a helpful assistant."},

{"role": "user", "content": prompt}

],

)

# Print the response

print(completion.choices[0].message.content.strip())

Further Work

我们仍在继续努力提升 Coding Agent 的效果,我们希望它能承担更多复杂软件工程中的繁琐任务,解放人类的生产力。Qwen3-Coder 仍有更多尺寸在路上,在保证良好效果的同时降低部署的开销。另外我们也在积极探索 Coding Agent 是否能够实现 self-improving,这是一个令人激动的话题。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/21 0:16:14

ERNIE-4.5-0.3B-PT入门必看:从部署到调用的完整流程

ERNIE-4.5-0.3B-PT入门必看:从部署到调用的完整流程 1. 为什么选这个镜像?轻量高效,开箱即用 你是不是也遇到过这些问题:想试试国产大模型,但动辄几十GB显存要求让人望而却步;想快速验证一个文本生成想法&a…

作者头像 李华
网站建设 2026/5/20 19:03:04

Chord视觉定位模型部署教程:Supervisor进程守护+自动重启+日志轮转配置

Chord视觉定位模型部署教程:Supervisor进程守护自动重启日志轮转配置 1. 项目概述 Chord是一款基于Qwen2.5-VL多模态大模型的视觉定位服务,能够通过自然语言指令精确定位图像中的目标对象。本教程将详细介绍如何部署该服务,并配置Superviso…

作者头像 李华
网站建设 2026/5/20 19:11:49

从安装到使用:CLAP音频分类镜像完整操作手册

从安装到使用:CLAP音频分类镜像完整操作手册 你是否遇到过这样的场景:一段现场录制的环境音,想快速判断是施工噪音、鸟鸣还是警报声,却要先找专业工具、装依赖、写代码?又或者,正在开发一款智能听障辅助Ap…

作者头像 李华
网站建设 2026/5/21 10:52:08

AI绘画新体验:Z-Image Turbo一键生成惊艳作品

AI绘画新体验:Z-Image Turbo一键生成惊艳作品 1. 开箱即用的极速画板:为什么这次真的不一样? 你有没有过这样的经历: 花半小时调参数、等显存不爆、防黑图、修提示词,最后生成一张图——结果边缘发灰、手长了六根、天…

作者头像 李华
网站建设 2026/5/21 0:56:44

EagleEye部署教程:Kubernetes集群中弹性扩缩容EagleEye推理服务

EagleEye部署教程:Kubernetes集群中弹性扩缩容EagleEye推理服务 1. 为什么需要在K8s里跑EagleEye? 你有没有遇到过这样的情况:白天监控摄像头突然涌入大量视频流,检测请求暴增三倍,GPU显存直接飙到98%,服…

作者头像 李华