
微软、谷歌下场围剿Cursor ,AI编程格局生变 | 企服国际观察

图片来源@pixabay
AI编程领域开始进入混战模式,大厂也在开启“降维打击”。
近期,先是OpenAI宣布Codex Agent编程模式,微软正式开源GitHub Copilot Extension for VS Code项目,而后谷歌就公布其AI编程Agent工具Jules私有预览版,紧接着大模型创企Anthropic也正式发布新一代模型:Claude Opus 4和Claude Sonnet 4,作为面向AI编程能力的最强模型加持。
这些动作背后其实都在共同指向一类对手:当前最热门的AI编程助手Cursor、Windsurf等,这些风头正劲的创业企业在别人的规则下,如何继续玩下去?对于微软和谷歌等大厂而言,AI编程有利于补强云服务生态黏性。对于同时提供B端和C端服务的大模型公司,提供擅长编码任务的模型+下探到Agent,可能是在大模型商业化路径上的一次重大机会点。
异步+混合
微软对于AI编程的布局更为体系化,围绕生态布局,而谷歌从近期的打法上看,则更围绕产品服务。
对于微软而言,GitHub Copilot是自2021年起作为主流集成开发环境IDE如VS Code的插件而提供给用户。因此开源GitHub Copilot Extension for VS Code的核心第一步其实就先将插件开源。据微软团队所述,接下来几个月内,还要将GitHub Copilot扩展的AI功能引入到VS Code开源存储库。也就是说,后续开发者基于VS Code无需插件就可以体验到GitHub Copilot功能。
对于这一点,微软的解释是:通过开源GitHub Copilot插件,能够与更大的社区合作,并更快推向市场,与AI编程软件开发生命周期保持一致。
微软此举可能意在与Cursor竞争,毕竟Cursor是对VS Code进行魔改了,虽然耗费了大量技术和工程能力,但从结果上看,Cursor获得了大量用户的欢迎,这显然对微软VS Code的开源生态带来了不小触动。
此前Wing VC合伙人Zachary DeWitt在其专栏中提醒道:“微软也可能简单地切断Cursor和竞争对手与VS Code核心API的连接或更改条款,使其更难在更新的基础上构建。Cursor对VS Code的依赖显示了建立在他人平台上的不稳定性。”
如今来看,大企业支持开源的核心目的是构建自己的生态圈,吸引高质量开发者和高质量代码贡献,但这并不意味着开源不会存在商业冲突。从最近修改VS Code插件许可协议就能明显看出微软的不满,着手生态战是必然。
再看谷歌。如果不是I/O大会,外界对谷歌的印象还停留在:遭遇美国司法部的反垄断诉讼案,以及对AI搜索市场的格局影响性上。
最近半年,谷歌对AI编程也在暗戳戳布局,先是对其AI编程助手Gemini Code Assist进行免费,又或者推出新的人工智能集成开发环境Firebase Studio。不过直到现在,谷歌还没有推出一款能够引领此次AI编程潮流的重量级产品。
去年12月,伴随Gemini 2.0大模型发布亮相,谷歌就发布了AI编程Agent代理 Jules。此次升级后,Jules则基于Gemini 2.5 Pro大模型,针对编码能力进行优化。
据谷歌官方介绍,Jules可以将复杂的任务分解成更小的步骤,根据用户指令进行调整,并运行单元测试来验证其工作。Jules并非一款简单的代码自动补全工具,其功能覆盖了从开发到测试的多个环节,能够在云端启用虚拟机、复制GitHub仓库、规划多步骤开发任务,并自动执行包括Bug修复、版本升级、测试编写以及代码优化等操作。最终,Jules会生成Pull Request(PR)供开发者审查,确保代码质量与项目进度。
不过,此次Jules升级后最大的不同的是聚焦“异步任务”编码,这与此前所熟知的“实时协作”不同。例如,Cursor和Windsurf这些工具通常与开发人员需要实时协作,在输入代码时提供代码建议或重构代码,本质上充当了IDE角色。而“异步任务”则意味着开发者无需逐行交互地工作,而是为 Agent分配一个特定的、可能很复杂的编码任务,然后Agent将接管该任务,在后台进行独立处理,并在完成工作后呈现。
值得注意的是,微软本周宣布GitHub Copilot升级为全功能编程Agent,同样具备“异步任务”的自主代理模式。Copilot Agent最初于今年2月推出预览版。
调用Copilot Agent后,开发者可分析整个代码库、跨文件编辑、生成和运行测试、修复错误,甚至建议终端命令,并在代码投入生产之前帮助解决这些问题,所有这些都只需一个提示即可完成。
目前Agent功能是直接嵌入到GitHub Copilot中,一旦用户分配任务,该Agent就会开始工作。
不过这在谷歌看来,二者产品还是有所不同:Copilot Agent类似于单个开发人员独自执行计划,而Gemini则采用“混合Agent”方法,需要多个专业Agent(如开发人员、测试人员和安全分析师)协同工作。这些Agent本质上是“彼此对抗的合作者,以便检查彼此的工作”,类似于聊天室里的虚拟团队。
同样在本周,OpenAI发布Codex Agent版本,由新模型codex-1加持(codex-1是 OpenAI o3的一个版本,针对软件工程进行了优化),不仅能在云端沙盒环境中安全地并行处理多项任务,而且通过与GitHub无缝集成。
OpenAI认为,异步多Agent将成为生产高质量软件的默认方式,实时和异步这两种模式将融合成一个统一的工作流程,让开发者能够在 IDE 和日常工具中与 AI 无缝协作。为此针对Agent模式,OpenAI也在计划构建一套工具,能同时支持实时协作和异步任务。
从当前几家的行动路径上看,异步+混合这种模式,由于更接近于自主编码的早期愿景,也正成为接下来AI编程产品的探索方向之一。
当大模型厂商下场做编程应用
当然,眼下眼热的可不只是微软、谷歌等大厂,大模型厂商也在暗自发力。
AI编程作为OpenAI ChatGPT的一大优势,也是超过1500万人订阅的核心原因之一。尤其是OpenAI的Codex,最初它只是一个编程模型,但现在来看它能提供的已经是一个能够在独立沙箱中编写代码、修复错误并回答代码库问题的编程助手。
Anthropic的Claude模型也在遵循这一节奏。此前,基于Claude进行软件开发已经占其所有交互的十分之一以上,Claude 3.5 Sonnet就因为擅长编码任务,并且对软件工程原理的出色掌握和应对复杂编程挑战的能力而被开发人员广泛使用,包括Cursor等AI编程产品就主要基于Claude 3.5 Sonne提供服务。而微软为了不依赖Codex,也在今年宣布为开发者引入多模型选择,其中就包括Claude 3.5 Sonnet。
据Anthropic 首席科学官贾里德·卡普兰 (Jared Kaplan) 表示,Anthropic去年年底就停止了对聊天机器人的投资,转而专注于提高Claude执行复杂任务的能力,甚至编写整个代码库。
而此次Anthropic将Claude Opus 4和Claude Sonnet 4升级,均针对编程能力进行了优化。与此同时,Anthropic还发布AI编程助手Claude Code,通过与VS Code和JetBrains等主流IDE集成,并基于自家的Claude Opus 4模型,可直接嵌入到用户业务流中。
结合当前水平来看,AI编程产品发展具有以下四个阶段:
一是预测文本,用于简单的代码补全。 二是聊天,用于编码任务的人工智能辅助对话。 三是协作“氛围编码”,使用人工智能进行广泛、协调的代码更改。 四是Agent代理模式,人工智能在后台自主运行,可能在没有直接监督的情况下做出改变。
显然,具备了编程模型能力的大模型厂商很快也都会走完这一轮产品迭代。当微软有了GitHub Copilot Agent,谷歌上线Jules,Anthropic这类大模型厂商的动作可能不远了。
可能现在最慌的还是Cursor、Devin等上层应用厂商了。Cursor其实也在留有后手,值得一提的是,去年Cursor的开发商Anysphere推出了自研Cursor-Fast,其代码生成能力据称介于GPT-3.5与GPT-4之间。
当AI编程竞赛进入混战模式,模型能力正成为一切不确定性中的确定因素。从第一性原理出发,模型性能的强弱决定了竞争力,尽管开发者可根据场景选择最适合的基础模型,但最终只会选择一两个好的大模型。(本文首发于钛媒体APP,作者 | 杨丽,编辑 | 盖虹达)
相关阅读《海外AI编程赛道并购潮起,火热背后的冷思考》