阿里发布新一代千问旗舰模型Qwen3.7-Max

本文核心干货是阿里巴巴发布了国产性能第一的新一代千问旗舰模型Qwen3.7-Max,普通用户很快就能用到该模型的能力,核心信息如下 1. 性能表现:该模型在全球大模型盲测中位列国产第一,性能接近GPT、Claude等海外顶级模型,在编程、推理、多语言、智能体等多个领域的权威评测中,都领先其他国产模型,部分指标还超过了海外头部模型Claude-Opus4.6 2. 核心能力:该模型专为智能体设计,可全自主完成最长35小时的复杂长程任务,能从零开始在全新芯片上优化推理内核,最终实现推理速度10倍提升,还能实现办公自动化,原来专业团队1到2周的复杂项目,数小时就能完成交付 3. 获取渠道:该模型的API很快就会上线阿里云百炼,后续还会推出多版本覆盖多模态需求,普通用户和开发者都可以调用使用
5月20日,阿里云峰会正式发布全新一代千问旗舰模型Qwen3.7-Max,标志着国产大模型在智能体(Agent)时代的全面进阶。在Arena全球大模型盲测总榜中,该模型超越Kimi-K2.6、DeepSeek-v4-pro及GLM-5.1,性能逼近GPT、Claude、Gemini等国际顶尖模型,稳居国产第一。Qwen3.7-Max专为当下智能体架构全新设计,在编程与推理等核心能力上实现突破,能够胜任长达35小时的超长程复杂任务,为电商及企业级应用提供了更强大的AI底座。

模型迭代速度与性能上限持续被刷新,近3个月内千问旗舰已连续推出3.5、3.6、3.7三个版本。在多项权威评测中,Qwen3.7-Max表现抢眼:编程智能体方面,在SWE-Pro、SWE-Multilingual及Terminal Bench 2.0-Terminus(得分69.7)测评中领先DeepSeek-v4-pro-Max与Claude-Opus4.6;通用智能体方面,在MCP-Atlas、Skillbench等测试中超越GLM5.1与Kimi-K2.6,并在Kernel Bench L3上展示GPU内核优化能力;推理能力上,于GPQA Diamond、HLE等核心测评中超越Claude-Opus4.6及所有国产模型;通用与多语言方面,IFBench得分79.1分,WMT24++评测领先。

编程能力已成为衡量LLM大模型落地实战的关键指标,Qwen3.7-Max较前代有质的飞跃,能驾驭从前端原型到复杂多文件工程的开发任务。在SWE-bench系列及SciCode实战测评中,该模型大幅超越Claude Opus 4.6-Max、Kimi-K2.6及DeepSeek-v4-Pro-Max。作为卓越的编程智能体,Qwen3.7-Max可自主编写代码创造工具,精准执行任务并进行自我纠错迭代,如同资深工程师般跑通“需求分析-测试迭代”全流程,自主产出可用的工业级代码成果。

极强的编程与推理能力,为智能体处理复杂、长周期业务奠定了基础。Qwen3.7-Max展现出跨多种智能体框架的泛化能力,在Claude Code、OpenClaw、Qwen Code等框架下均能稳定运行,成为各类智能体系统的可靠底座。通过MCP集成与多智能体协作,该模型在企业级办公场景实现了工作流自动化,在SpreadSheetBench-v1基准测试中斩获87分,处于行业顶尖水平。以往需专业团队耗时一至两周的复杂项目,现由Qwen3.7-Max驱动的智能体可在数小时内完成端到端交付闭环。

在实战极限测试中,Qwen3.7-Max在全新硬件平台——平头哥真武M890芯片上,挑战了高难度的推理内核优化任务。面对没有任何性能分析数据、硬件文档或新架构示例内核的“空白”环境,模型仅凭任务描述、SGLang Triton参考实现和评测脚本,从零开始持续自主编程35小时。在此期间,模型独立进行了432次内核评估与1158次工具调用,完全自主地完成了编写、编译、性能分析与迭代改进的全流程,展现了惊人的鲁棒性。

测试结果显示,经千问优化后的推理内核比SGLang Triton官方参考实现取得了10倍的加速比。更值得关注的是,模型在独立运行超过30小时后仍能发现有效优化点,并主动发起了一次关键的架构重设计。这不仅验证了千问在复杂任务中长周期自主迭代的能力,更为未来模型与智能体的自我演进打开了全新的想象空间,证明了AI在处理高技术门槛任务时的巨大潜力。

随着Agentic时代的到来,阿里云宣布全面升级“芯-云-模型-推理”技术体系。Qwen3.7-Max模型API即将上线阿里云百炼,同时千问3.7系列将推出Qwen3.7-Plus等不同版本,具备极强的多模态推理与视觉理解能力。这一系列举措将实现从编程智能体到视觉智能体的全覆盖,为下一代AI应用提供全能智能体新基座,助力电商等行业构建更高效的自动化运营体系。

【价美丽平台】致力于为淘宝、京东、拼多多等商家提供推广服务,助力店铺实现快速起店、精准测品,高效解决店铺运营难题,加速店铺成长,轻松打开市场!