通义千问推出开源编程开发模型Qwen3-Coder和命令行开发工具Qwen Code
阿里巴巴旗下人工智能团队通义千问 (Qwen) 刚刚推出可能是目前开源领域最强的编程开发模型 Qwen3-Coder,该模型专注于编程开发并提供能够媲美 Anthropic Claude Sonnet 4 模型的能力。
Qwen3-Coder 有多种不同的变体可供选择,其中最强大的变体为 Qwen3-Coder-480B-A35B-Instruct,该模型为 480B 参数的混合专家架构,具有 35B 个活跃参数并原生支持 256K 标记和 1M 标记的上下文长度。
与社区中普遍关注竞争级代码生成不同,通义千问团队相信所有代码任务都自然而然地非常适合执行驱动大规模强化学习,所以通义千问在更广泛的实际编码任务中扩展 Code RL 训练。
通过自动扩展多样性编码任务的测试用例来创建高质量的训练用例,这样可以释放强化学习的全部潜力,同时显著提高代码执行成功率并为其他任务带来收益。
在 SWE-Bench 等实际软件工程任务中,Qwen3-Coder 必须与环境进行多轮交互,包括规划、实用工具、接收反馈和做出决策。在后训练阶段则是采用 Agent RL 以鼓励模型通过使用工具的多轮交互来解决现实世界中的任务。
Agent RL 的主要挑战在于环境扩展,为解决该问题,通义千问团队来利用阿里云的基础设施构建可扩展系统,能够并行运行 20000 个独立环境,该基础设施能够为大规模强化学习提供必要的反馈并支持大规模评估。
通义千问团队还发布并开源用于代理编码的命令行工具 Qwen Code,该工具从 Google Gemini Code 项目分叉而来,经过定制提示和函数调用协议的调整,可以充分释放 Qwen3-Coder 在代理编码任务上的能力。
开发者还可以将 Qwen3-Coder 与 Claude Code 配合使用,具体可以访问通义千问团队博客查看具体的安装和使用方法:https://qwenlm.github.io/blog/qwen3-coder/










