你会想到有一天和你同处办公室的同事有可能是“虚拟员工”吗？

排行榜 2025年10月20日 17:05 0 admin

在科技浪潮翻涌的时代，AI领域宛如一片神秘而充满无限可能的新大陆，吸引着无数探索者投身其中。而Anthropic和OpenAI，无疑是这片新大陆上最为耀眼的两位开拓者，他们正悄然布局一场足以颠覆传统工作模式的惊天变革——打造“虚拟员工”。

9月17日，一条震撼性的消息如旋风般席卷科技圈。Anthropic和OpenAI这两大巨头，竟同时将目光聚焦于开发能替代人类执行复杂工作的“AI同事”。这个看似科幻电影中的情节，正一步步走向现实。

为了让这些“AI同事”能像真正的职场精英一样游刃有余地处理工作，他们采用了一种独特的训练方式——使用模拟企业软件来训练AI模型。想象一下，这就好比为AI搭建了一个高度逼真的“虚拟办公室”，在这里，它们将学习如何像人类员工那样理解和操作真实的工作流程。

Anthropic更是豪情万丈，计划在明年投入10亿美元，打造一个大规模的AI训练“健身房”。这个“健身房”，实则是被称为“强化学习环境”的模拟办公平台，它将成为AI们锤炼技能的主战场。

而OpenAI的眼光则更为长远，他们大胆预言，整个经济未来都可能变成巨大的“强化学习机器”。在他们的构想中，AI将通过与人类的紧密协作和不断反馈，如同拥有生命一般持续进化，从根本上重塑生产力与工作模式。

时薪最高可达250美元的“AI家教”，正穿梭于代码与数据之间，倾囊相授，教大模型如何在职场中崭露头角。Anthropic与OpenAI所做的事，前无古人。他们要让大语言模型真正走进“办公室”，成为一名合格的“数字员工”。

这些AI模型正在经历一场高强度的职业培训，Salesforce的客户管理系统、Zendesk的客服平台、医疗领域的Cerner电子病历系统……各类专业办公软件都是它们的必修课。它们的最终目标，是能够独立处理白领日常面临的复杂工作任务。

与传统AI训练截然不同，这次采用的是“模拟办公”沉浸式教学。研究人员不仅精心搭建了高度仿真的企业应用环境，还不惜重金聘请各行业专家担任“职业导师”。这些专家们如同武林高手传授秘籍一般，手把手教授模型软件操作技巧。

这样的训练成本自然不菲。据知情人士透露，Anthropic计划在未来一年内投入10亿美元，专门用于建设这个模拟办公平台。OpenAI同样毫不吝啬，预计今年在数据相关领域的支出就将达到10亿美元，到2030年更将增至80亿美元。这些资金，一部分用于搭建虚拟办公环境，一部分则化作了专家们丰厚的薪酬。

随着对专家需求的激增，聘请人类专家的成本也在节节攀升。为OpenAI等公司提供专家服务的Labelbox公司透露，目前教授AI操作软件的生物、软件编程、医学等不同领域专家中，20%时薪超过90美元，近10%时薪突破120美元。预计未来18个月，顶级专家的时薪将涨至150 - 250美元。

尽管投入巨大，但回报可能超乎想象。一旦成功，这种新训练方式不仅能帮助OpenAI和Anthropic突破传统训练技术的瓶颈，还可能为他们开辟全新的商业模式。未来，企业或许可以销售能接管用户电脑并代为操作应用的“AI智能体”，或者利用AI开发出更强大的企业级应用。

Anthropic首席执行官达里奥·阿莫代伊（Dario Amodei）将这些AI产品亲切地称为“虚拟协作者”。它们被设计成能与人类并肩工作，熟练操作我们日常使用的各种应用程序。

然而，通往成功的道路从来都布满荆棘。专门帮助企业优化AI模型的图灵公司（Turing）给出了具体案例。该公司前沿数据项目负责人安舒尔·巴吉（Anshul Bhagi）解释道，要教会AI完成一个销售任务，需要跨越多个系统：不仅要掌握Salesforce的客户筛选功能，还要会使用LinkedIn寻找潜在客户、用Calendly安排会议，并通过Gmail发送跟进邮件。

为确保AI真正掌握这些技能，图灵公司设计了一套精细的验证流程：将每个任务拆解为多个关键步骤，并设立明确的检查标准。以销售任务为例，考核标准包括：AI是否按“最后联系时间”筛选了客户数据库？是否成功发送包含Calendly会议链接的邮件？是否将潜在客户状态更新为“重新接洽”？

虽然这项技术尚处于早期阶段，但各大AI实验室已经准备好投入重金。一位投资者透露，Anthropic目前仅将不到10%的后训练（即模型初步训练完成后进入优化阶段）预算用于“强化学习环境”，但由于初期效果显著，该公司预计明年将大幅提高这方面的投入。

AI“训练场”正逐渐成为科技巨头新的战场。图灵公司CEO乔纳森·西达尔特（Jonathan Siddharth）近日透露，他们已建成超过1000个强化学习模拟环境，覆盖从Airbnb到Excel等各类应用场景。这些被称作“AI健身房”的虚拟空间，正成为训练AI模型的重要资产。每个模拟环境都配备100到500个定制任务示例，并包含完整的评估体系，让企业能够系统性地训练AI掌握各类办公技能。

这个新兴领域正吸引大量玩家入场。Scale、Surge、Mercor和Invisible Technologies等竞争对手纷纷推出类似服务，他们不仅提供模拟环境，还配备行业专家设计各种应用场景下的训练任务。一批专注服务顶级AI实验室的初创公司也悄然涌现，强化学习环境正在成为一个新兴细分赛道。

Surge公司创始人兼CEO埃德温·陈（Edwin Chen）说：“OpenAI和Anthropic改进模型的方法，其实是在模仿人类的学习过程，而强化学习环境就像是让AI生活在真实世界里。”

除了搭建模拟环境，AI开发商们也在持续用精心筛选的问答来训练模型，这些问答往往难度极高，比如顶级的编程竞赛题或博士水平的生物学问题。这些问答随后会被用于强化学习，从而教会模型在特定领域的新技能或新知识。

随着AI模型变得越来越聪明，数据标注公司也开始“招兵买马”，从最初聘请硕博在读生，升级到聘请在特定领域拥有多年经验的职场精英。例如，图灵公司就曾聘请过美国宇航局（NASA）的数据科学家、参与能源部项目的化学家、放射科的住院医师，甚至还有私募股权公司的副总裁，来完成特定的真实世界任务，让AI在一旁“观摩”学习。