在科技浪潮翻涌的时代,AI领域宛如一片神秘而充满无限可能的新大陆,吸引着无数探索者投身其中。而Anthropic和OpenAI,无疑是这片新大陆上最为...
2025-10-20 0
在科技浪潮翻涌的时代,AI领域宛如一片神秘而充满无限可能的新大陆,吸引着无数探索者投身其中。而Anthropic和OpenAI,无疑是这片新大陆上最为耀眼的两位开拓者,他们正悄然布局一场足以颠覆传统工作模式的惊天变革——打造“虚拟员工”。
9月17日,一条震撼性的消息如旋风般席卷科技圈。Anthropic和OpenAI这两大巨头,竟同时将目光聚焦于开发能替代人类执行复杂工作的“AI同事”。这个看似科幻电影中的情节,正一步步走向现实。
为了让这些“AI同事”能像真正的职场精英一样游刃有余地处理工作,他们采用了一种独特的训练方式——使用模拟企业软件来训练AI模型。想象一下,这就好比为AI搭建了一个高度逼真的“虚拟办公室”,在这里,它们将学习如何像人类员工那样理解和操作真实的工作流程。
Anthropic更是豪情万丈,计划在明年投入10亿美元,打造一个大规模的AI训练“健身房”。这个“健身房”,实则是被称为“强化学习环境”的模拟办公平台,它将成为AI们锤炼技能的主战场。
而OpenAI的眼光则更为长远,他们大胆预言,整个经济未来都可能变成巨大的“强化学习机器”。在他们的构想中,AI将通过与人类的紧密协作和不断反馈,如同拥有生命一般持续进化,从根本上重塑生产力与工作模式。
时薪最高可达250美元的“AI家教”,正穿梭于代码与数据之间,倾囊相授,教大模型如何在职场中崭露头角。Anthropic与OpenAI所做的事,前无古人。他们要让大语言模型真正走进“办公室”,成为一名合格的“数字员工”。
这些AI模型正在经历一场高强度的职业培训,Salesforce的客户管理系统、Zendesk的客服平台、医疗领域的Cerner电子病历系统……各类专业办公软件都是它们的必修课。它们的最终目标,是能够独立处理白领日常面临的复杂工作任务。
与传统AI训练截然不同,这次采用的是“模拟办公”沉浸式教学。研究人员不仅精心搭建了高度仿真的企业应用环境,还不惜重金聘请各行业专家担任“职业导师”。这些专家们如同武林高手传授秘籍一般,手把手教授模型软件操作技巧。
这样的训练成本自然不菲。据知情人士透露,Anthropic计划在未来一年内投入10亿美元,专门用于建设这个模拟办公平台。OpenAI同样毫不吝啬,预计今年在数据相关领域的支出就将达到10亿美元,到2030年更将增至80亿美元。这些资金,一部分用于搭建虚拟办公环境,一部分则化作了专家们丰厚的薪酬。
随着对专家需求的激增,聘请人类专家的成本也在节节攀升。为OpenAI等公司提供专家服务的Labelbox公司透露,目前教授AI操作软件的生物、软件编程、医学等不同领域专家中,20%时薪超过90美元,近10%时薪突破120美元。预计未来18个月,顶级专家的时薪将涨至150 - 250美元。
尽管投入巨大,但回报可能超乎想象。一旦成功,这种新训练方式不仅能帮助OpenAI和Anthropic突破传统训练技术的瓶颈,还可能为他们开辟全新的商业模式。未来,企业或许可以销售能接管用户电脑并代为操作应用的“AI智能体”,或者利用AI开发出更强大的企业级应用。
Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)将这些AI产品亲切地称为“虚拟协作者”。它们被设计成能与人类并肩工作,熟练操作我们日常使用的各种应用程序。
然而,通往成功的道路从来都布满荆棘。专门帮助企业优化AI模型的图灵公司(Turing)给出了具体案例。该公司前沿数据项目负责人安舒尔·巴吉(Anshul Bhagi)解释道,要教会AI完成一个销售任务,需要跨越多个系统:不仅要掌握Salesforce的客户筛选功能,还要会使用LinkedIn寻找潜在客户、用Calendly安排会议,并通过Gmail发送跟进邮件。
为确保AI真正掌握这些技能,图灵公司设计了一套精细的验证流程:将每个任务拆解为多个关键步骤,并设立明确的检查标准。以销售任务为例,考核标准包括:AI是否按“最后联系时间”筛选了客户数据库?是否成功发送包含Calendly会议链接的邮件?是否将潜在客户状态更新为“重新接洽”?
虽然这项技术尚处于早期阶段,但各大AI实验室已经准备好投入重金。一位投资者透露,Anthropic目前仅将不到10%的后训练(即模型初步训练完成后进入优化阶段)预算用于“强化学习环境”,但由于初期效果显著,该公司预计明年将大幅提高这方面的投入。
AI“训练场”正逐渐成为科技巨头新的战场。图灵公司CEO乔纳森·西达尔特(Jonathan Siddharth)近日透露,他们已建成超过1000个强化学习模拟环境,覆盖从Airbnb到Excel等各类应用场景。这些被称作“AI健身房”的虚拟空间,正成为训练AI模型的重要资产。每个模拟环境都配备100到500个定制任务示例,并包含完整的评估体系,让企业能够系统性地训练AI掌握各类办公技能。
这个新兴领域正吸引大量玩家入场。Scale、Surge、Mercor和Invisible Technologies等竞争对手纷纷推出类似服务,他们不仅提供模拟环境,还配备行业专家设计各种应用场景下的训练任务。一批专注服务顶级AI实验室的初创公司也悄然涌现,强化学习环境正在成为一个新兴细分赛道。
Surge公司创始人兼CEO埃德温·陈(Edwin Chen)说:“OpenAI和Anthropic改进模型的方法,其实是在模仿人类的学习过程,而强化学习环境就像是让AI生活在真实世界里。”
除了搭建模拟环境,AI开发商们也在持续用精心筛选的问答来训练模型,这些问答往往难度极高,比如顶级的编程竞赛题或博士水平的生物学问题。这些问答随后会被用于强化学习,从而教会模型在特定领域的新技能或新知识。
随着AI模型变得越来越聪明,数据标注公司也开始“招兵买马”,从最初聘请硕博在读生,升级到聘请在特定领域拥有多年经验的职场精英。例如,图灵公司就曾聘请过美国宇航局(NASA)的数据科学家、参与能源部项目的化学家、放射科的住院医师,甚至还有私募股权公司的副总裁,来完成特定的真实世界任务,让AI在一旁“观摩”学习。
巴吉举了一个例子:假设一个AI开发者想教会模型理解税率变动对财务模型的影响,图灵公司会先请一位金融专家(合同工)解决这个问题,得出一个明确的答案,比如最终股价,作为检验标准。
然后,AI开发者会让模型也去尝试完成这个任务几十次。他们会筛选出那些模型计算结果与人类专家一致的案例,再用这些正确的案例来集中训练模型。通过这种方式,模型开发者能快速、低成本地生成大量正确的训练样本。
像OpenAI这样的头部AI开发商,正试图从各行各业收集类似的案例,从医疗到法律,无所不包。一位OpenAI的高管在今年早些时候曾私下表示,他们期望“整个经济体”最终能变成一台巨大的“强化学习机器”。这意味着,AI未来可能会通过记录各领域专业人士在设备上的日常工作来进行学习和训练。
相关文章
在科技浪潮翻涌的时代,AI领域宛如一片神秘而充满无限可能的新大陆,吸引着无数探索者投身其中。而Anthropic和OpenAI,无疑是这片新大陆上最为...
2025-10-20 0
作者 | 王战新突破芯片“卡脖子”,深圳传来好消息。芯片行业的年度盛会——第二届湾区半导体产业生态博览会(简称“湾芯展”),于近期(10月15-17日...
2025-10-20 0
日前江苏省数据局公示了“2025年江苏省数字消费创新场景”遴选结果常熟3个场景入选跟小编一起来了解下这3个“数字消费创新场景"到底“硬核”在哪里?↓↓...
2025-10-20 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-10-20 7
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-10-20 9
7月17日上午,陕航局党委副书记、纪委书记、工会主席张卫军一行赴中国飞机强度研究所开展“送清凉”活动,看望慰问高温天气下坚守一线的职工,传递组织的关怀...
2025-10-20 4
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-10-20 7
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-10-20 6
发表评论