首页 十大品牌文章正文

阿里巴巴发布开源 AI 智能体,与 OpenAI 的旗舰产品 Deep Research 竞争

十大品牌 2025年09月20日 05:11 0 aa
阿里巴巴发布开源 AI 智能体,与 OpenAI 的旗舰产品 Deep Research 竞争

阿里巴巴集团旗下通义实验室于9月17日发布并全面开源了通义DeepResearch深度研究智能体,这一举措直接挑战了OpenAI在深度研究工具领域的主导地位。该开源智能体声称以仅300亿参数的规模就实现了与OpenAI旗舰Deep Research工具相当的性能表现,并展现出"令人难以置信的效率优势"。这一突破不仅标志着中国AI企业在高端智能体技术方面的重大进展,更为全球开源AI生态系统注入了强劲动力。

技术突破重新定义效率标准

通义DeepResearch的核心创新在于其极致的参数效率和全栈开源策略。与传统的深度研究工具不同,该智能体采用了创新的双模型架构:AgentFounder-30B专门负责智能体行为的预训练,而WebSailor-V2-30B-A3B则通过双重模拟-真实环境中的可扩展强化学习来增强后期训练效果。这种设计使得模型在保持轻量级的同时,具备了处理复杂长期任务的能力。

在多项权威基准测试中,通义DeepResearch展现出了卓越的性能表现。在人类最终考试(HLE)测试中,该智能体得分32.9,超越了OpenAI的o3模型;在BrowseComp测试中获得43.4分,接近OpenAI o3的49.7分表现;而在FRAMES基准测试中更是以90.6分夺得所有测试模型中的最高分。这些成绩充分证明了中国AI企业在核心技术方面已经具备了与美国顶级实验室竞争的实力。

阿里巴巴的技术团队采用了完全自动化的训练流程,摒弃了对人工标记数据的依赖。他们构建了一个基于维基百科知识库的高度稳定模拟环境,允许AI智能体在接近真实网络环境的条件下反复学习和优化。同时,动态数据管理引擎能够根据模型表现实时调整训练数据集的难度和复杂程度,实现了训练效率的最大化。

更重要的是,阿里巴巴选择将整套技术方案完全开源,包括模型权重、训练代码、数据合成方法以及详细的技术报告。这种开放策略不仅展现了中国企业的技术自信,也为全球AI研究社区提供了宝贵的学习和改进资源。

实际应用验证商业价值

通义DeepResearch并非仅停留在学术研究层面,而是已经在多个实际业务场景中得到验证和部署。在阿里巴巴旗下的高德地图应用中,该智能体被集成到名为"小高"的AI助手中,能够利用网络检索能力为用户规划多日旅行行程。用户只需用自然语言描述旅行需求,智能体就能自动搜索相关景点信息、筛选合适的住宿选择,并制定个性化的行程安排。

在法律研究领域,通义法瑞系统利用该智能体技术执行复杂的判例法检索、法规交叉引用等专业任务。系统能够自动检索相关案例,提供准确的法条引用,并将研究结果整合成结构化的法律文档,其准确性和效率已达到初级法律专业人士的工作水平。在专项评估中,通义DeepResearch在案例引用质量方面的得分为64.26,显著超越了OpenAI的57.56分和Anthropic Claude的40.43分。

该智能体支持两种不同的推理模式以适应不同场景需求。ReAct模式采用"思考-行动-观察"的循环机制,适合标准化的研究任务;而重度模式则基于IterResearch范式,能够将复杂研究任务分解为多个独立回合,每个回合都会重建专注的工作空间,有效避免了长上下文处理中的性能衰减问题。

这种多场景应用的成功验证表明,通义DeepResearch不仅在技术指标上表现优异,更具备了实际的商业应用价值。从旅行规划到法律研究,从简单的信息检索到复杂的多步推理,该智能体展现出了强大的通用性和适应性。

开源策略推动产业变革

阿里巴巴选择全面开源通义DeepResearch的决定在AI行业引发了广泛关注。通过HuggingFace、GitHub和ModelScope等平台,开发者和企业可以免费获取、定制和部署该智能体,甚至用于商业应用。这种开放策略与OpenAI等美国企业的封闭模式形成了鲜明对比,为全球AI生态系统的发展注入了新的活力。

从技术架构来看,通义DeepResearch的训练流程涵盖了智能体持续预训练(CPT)、监督式微调(SFT)和强化学习(RL)三个阶段。这种全栈式架构支持从原始交互数据到精细化、多步骤推理工作流的智能体能力开发。特别值得注意的是,该团队引入了AgentFounder数据引擎,使用知识图谱、文档和工具使用轨迹来生成大规模合成问答对,大大提高了训练数据的质量和多样性。

在强化学习阶段,研发团队采用了定制的组相对策略优化(GRPO)算法,运用基于标记级梯度优化、留一法优势估计以及对低质量负样本的仔细过滤等先进技术。这些创新使得模型在训练过程中能够持续改进,并在多个评测基准上取得了超越竞争对手的优异成绩。

当前,通义DeepResearch仍存在一些技术限制。其128,000个token的上下文窗口相比于某些最新模型的更大容量仍有差距,在处理极其复杂的长期任务时可能构成瓶颈。此外,该训练方法尚未在超过300亿参数的更大规模上得到验证,这为未来的技术发展留下了探索空间。

不过,通义DeepResearch的发布无疑标志着开源AI智能体发展进入了新阶段。它不仅展示了中国AI企业在技术创新方面的突出实力,更重要的是为全球AI研究社区提供了一个高质量的开源参考实现。随着更多开发者和研究机构基于这一开源框架进行创新和改进,深度研究智能体技术有望迎来更加快速的发展。

在全球AI竞争日趋激烈的背景下,阿里巴巴的开源策略体现了中国企业在技术路线选择上的独特思考。通过开放核心技术,不仅可以加速整个行业的技术进步,也有助于建立以中国企业为核心的AI生态系统。这种策略的成功与否,将在很大程度上影响未来AI技术发展的格局和方向。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap