阿里AI四连发，横扫全球开源榜单第一名

访客 2025-07-26 18:52:30 2107

默认

阿里巴巴在人工智能领域连续四次发布创新成果，凭借强大的技术实力和创新力，横扫全球开源榜单，荣登第一名，阿里AI的连续突破展示了中国科技的崛起，引领全球AI技术的发展潮流。

阿里巴巴通义团队用四连发的重磅出击，横扫Github开源榜单。

本周从7月22日到25日，阿里接连推出Qwen3-235B非思考版本、Qwen3-Coder编程模型、Qwen3-235B-A22B-Thinking-2507推理模型，以及WebSailor AI Agent框架，四款产品横扫基础模型、编程模型、推理模型和智能体领域的开源榜单。

权威机构Artificial Analysis更是直接评价：

通义千问3是全球最智能的非思考基础模型。
非思考模型也能性能“爆表”

据硬AI，周二凌晨阿里巴巴通义千问团队推出非思考模式（Non-thinking）最新模型，命名为Qwen3-235B-A22B-Instruct-2507-FP8。

这款非思考模型在多项关键基准测试中表现出色。不仅全面超越了Kimi-K2等顶级开源模型，甚至领先Claude-Opus4-Non-thinking等顶级闭源模型。

值得一提的是，本次更新的Qwen3模型在Agent能力尤其亮眼：在BFCL（Agent能力）测评中表现卓越。这意味着模型在理解复杂指令、自主规划、调用工具以完成任务的能力上，达到了一个新的高度。“主打Agent”，将是未来AI应用的核心竞争力。

编程模型引发社区沸腾

7月23日发布的Qwen3-Coder更是在全球开发者社区引发轰动。

华尔街见闻此前提及，这款基于MoE架构的编程模型拥有480B总参数，35B激活参数，原生支持256K上下文，可扩展至1M。

在开发者最关注的SWE-bench Verified基准测试中，Qwen3-Coder取得了开源模型最佳表现。

模型在7.5万亿token规模上训练，其中包含70%代码数据，并通过长时程强化学习和2万个虚拟环境的大规模实战训练，在真实世界的多轮交互任务中展现出色能力。

阿里还推出了配套的命令行工具Qwen Code，为开发者提供了完整的编程解决方案。

科技界领袖纷纷为Qwen3-Coder点赞，例如Perplexity CEO Aravind Srinivas盛赞Qwen3-coder的实力：

成果令人惊叹，开源正在获胜。

推特创始人Jack Dorsey更是强调Qwen3和Goose——其Block公司开发的AI Agent框架，搭配使用的话非常棒：

goose配合Qwen3-Coder等于哇哦

AI Agent框架挑战闭源垄断

阿里通义实验室同期开源的WebSailor AI Agent框架，直接对标OpenAI的Deep Research产品。

这款框架在BrowseComp-en/zh测试中性能显著优于所有开源智能体，可媲美专属闭源模型。

WebSailor采用复杂任务生成和强化学习模块的双重技术架构。通过构建复杂知识图谱和动态采样策略，系统能够在海量信息中进行高效检索和推理。

除了在复杂任务上的卓越表现，WebSailor在简单任务上也表现出色。例如，在SimpleQA基准测试中，WebSailor的性能超过了所有其他模型产品。

该项目在GitHub已获得超过5000颗星，并曾拿下每日增长趋势第一名。

WebSailor的核心技术主要围绕复杂任务生成和强化学习模块展开，这两个模块相互配合，共同推动了开源智能体在复杂信息检索任务中的性能提升。

该框架的开源意义重大，打破了闭源系统在信息检索领域的垄断地位，为全球开发者提供了媲美Deep Research的开源解决方案。

推理模型登顶全球开源冠军

7月25日发布的Qwen3-235B-A22B-Thinking-2507成为本周最重磅的产品。

AIME25（数学）达到92.3分。
LiveCodeBench v6（编程）获得74.1分。
WritingBench（写作）达到88.3分。
PolyMATH（多语言数学）获得60.1分。

更详细的榜单表现来看，Qwen3推理模型相较于其他模型来看也毫不逊色（除了 R1，其他都是顶尖闭源模型）。

该模型采用MoE架构，总参数235B，激活参数22B，拥有94层结构和128个专家系统，原生支持262,144 tokens上下文长度。模型专为思考模式构建，默认聊天模板自动包含思考标签，为深度推理提供了强大支撑。

OpenRouter数据显示，阿里千问的API调用量在过去几天暴涨，已超过1000亿tokens，包揽最热门调用模型前三名。这一数据直接反映了市场对阿里开源模型的认可度。

全球网友也是被通义的最强推理模型给惊呆了。有网友直接表示：

中国的开源o4-mini。

AI Thinkers更是评论道：

中国刚刚发布了一款怪物级的AI模型。

海报

阅读

相关推荐

特朗普：鲍威尔人很好，相信他准备开始降息，喜欢强势美元，但弱美元让美企赚翻

媒体爆料：特斯拉机器人产量远不及目标，承诺年底前生产5000台，但目前只产了几百台

阿里AI四连发，横扫全球开源榜单第一名

Anthropic寻求1500亿美元估值，FTX旧股价值或飙升近十倍

8月1日“关税大限”前夕，对冲基金押注黄金，多仓创4月以来最高

世界变化快！半年前，15%关税会吓崩市场，如今却是利好

DORK--美股“最闪耀”的名词

日美对“5500亿美元投资”说法不一：特朗普称“签约奖金”，日本“美国也得出钱”