首页 今日新闻文章正文

腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

今日新闻 2025年09月24日 07:17 1 aa

9月17日,在2025年腾讯全球数字生态大会Agent+Infra专场,腾讯云CBS产品总经理马文霜正式对外发布腾讯云Cloud Mate 专家服务智能体。Cloud Mate是由一系列子Agent构成的垂直领域大模型,它不仅是一项技术,更是腾讯云服务海量用户的实践经验和知识总结,希望帮助用户解决管云、用云的难题。

腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

马文霜指出,用户在云上构建业务系统,核心诉求聚焦于“高效用云管云”和“业务持续稳定运行”两大方向。业务持续稳定运行面临着诸多关键挑战,一是业务架构存在缺陷。例如,有些用户在设计业务之时,多个服务之间共用了网关实例,服务A流量突发,而在服务B时就会遭受影响;二是业务代码也会存在缺陷或性能问题,一旦数据库量级到达一定程度以后,慢SQL可能拖垮数据库,致使业务崩溃;三是用户误操作造成云资源退还,使业务陷入瘫痪。当下云业务越来越复杂,如果系统出现问题并持续,就会造成业务持续受损,这就需要在云上进行快速排障,以解决业务受损难题。

腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

Cloud Mate专家服务智能体,可以一键生成业务架构图和定制混沌演练方案,测试业务链路容错能力、可视化治理云上架构。业务上线前,可将高可用演练时间从一周缩短到一天;风险拦截服务,可在用户操作云资源前,提前预测和呈现可能发生的结果,帮助用户识别和规避风险。Cloud Mate的风险拦截服务还能帮助用户检测出代码生成低效的SQL语句。当前,Cloud Mate累计检测代码量超过了770万行,检测拦截成功率达到95%,帮助用户在源头上治理风险。针对比较复杂的故障,Cloud Mate故障排障服务,拥有强大的自动化和并行排障编排能力,可以帮助用户实现从小时级缩短到分钟级排障。

马文霜认为,企业数据库应用里隐藏着大量风险SQL,比如,失控的大数据量更新、失效索引等等,这些风险SQL像一个定时炸弹,随时可能会拖垮数据库,引发系统崩溃。然而,业界传统的做法却陷入“对业务SQL进行打标-事后审计-线上再发现”的死循环,并没有从源头上解决问题。Cloud Mate聚焦在源头,希望在编码阶段就发现风险SQL。

腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

腾讯云自研的垂直模型,通过代码建模能力增强和ORM框架理解微调,让复杂代码端到端解析率超过90%,与通用大模型相比,实现8%的提升,有效解决多维度调用者和调用链漏报的问题。值得一提的是,该模型支持Pothy等主流语言和ORM框架,消除技术栈导致的治理盲区。结合数据库运行时态数据,模型还可以对风险的SQL进行多维度量化、评估,相较于通用大模型,腾讯云自研模型在诊断结果的通过性上,性能提升显著。马文霜说,腾讯云内部很多业务以及头部的金融客户都在尝试使用Cloud Mate专家服务智能体。

腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

马文霜表示,云资源误操作或误配置导致业务受损,也是典型风险的一种。他举例说,今年4月,某企业的运维团队错配了安全组,拦截了6379端口的流量,导致业务瘫痪近一个小时且损失惨重。腾讯云Cloud Mate可以帮助用户在操作云资源前,预测操作影响,将误操作导致流量直接掉底的风险提前告知用户,协助终止操作,避免故障风险。即使用户在明知流量掉底风险,依旧进行相应操作,也能够通过操作撤销功能恢复老安全组,快速挽回业务。目前,Cloud Mate 已接入 IaaS、容器服务、数据库等主要云产品的风险评估和管控,为用户操作云资源筑牢“保险层”。

另外一个例子,出现在电商行业。某电商平台接到客诉,买家反馈支付成功却未发货,仓库称未收到订单团队的支付消息,订单团队表示已将消息写入中间件,中间件团队则强调服务正常。这是企业运维场景中典型的排障怪圈,耗时耗力。在这个case中,运维总监组织 6 个团队联合排查,耗时 2 天才发现根因:测试模块维护时误接现网中间件。如果使用Cloud Mate,排障效率截然不同。通过对多个业务模块全链路日志进行追踪,以及对消息上下游进行综合分析,3 分钟内就将问题定位在“订单支付消息丢失”,再结合中间件消费日志找到异常消费者,通过 CMDB 确认该消费者部署在测试环境,快速锁定问题。

腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

传统人工排障依赖于个人经验和能力,受主观判断影响非常大,排障的成功率与个人能力、经验密切相关,易陷入跨团队互相推诿的怪圈,既浪费精力,又浪费成本,协同沟通效率低下。Cloud Mate通过注入排障思维,确保推理过程清晰可控,支持长上下文排障,为决策提供全景信息。目前,Cloud Mate在腾讯云内部排障的准确率高达90%以上。此外,Cloud Mate还提供非常高效易用的集成体验,帮助客户快速构建专属排障的Agent,让复杂排障不再是难题。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap