Grok最新模型吃上Cursor「加餐」,马斯克:Coding实现巨大改进
        梦瑶 发自 凹非寺量子位 | 公众号 QbitAI我让你们各家Code产品这么卷,非要逼我老马再出手!

        马斯克在X上发帖透露,xAI自家的Grok基础模型V9-Medium(1.5T)已经完成训练。

        预计再过2到3周,差不多就能正式对外发布啦:没错,这次新模型明显是冲着编程能力下狠手了。

        马斯克特意提到,V9-Medium的补充训练中加入了大量Cursor数据,后续还会继续添加。

        何意味——(估计想说编码这事儿上别看隔壁两家,也多看看我家吧~)新模型那边预热一波,自家编程新品也没闲着。

        xAI新发布的AI编程代理工具Grok Build目前也已经进入早期Beta测试阶段,部分用户可以用了~emm…

        这收购Curosr才过了一个多月,Grok这边就已经开始吃上「加餐」了。

        一边用Cursor数据喂新模型,一边推自家AI编程Agent。

        不管咋说,老马Code,虽迟但到!Grok新模型训练完成了!

        说到底,coding这玩意儿还是卷的太厉害了...从时间线上看,基于v8-small基础模型的Grok 4系列发布至今,已经快过去一年了。

        其实在上一代模型编程能力也有了一些提升,但是架不住隔壁几家迭代的飞快啊!

        所以,这一次xAI没有选择小步快跑,而是攒了一个大招~Grok这次的新基础模型V9-Medium(1.5T),直接对准了编程能力和开发者市场。

        连马斯克自己都迫不及待地说:编程能力强多了。(doge)在参数上,V9-Medium参数规模直接达到了1.5T。

        要知道,毕目前承载Grok所有生产流量都由0.5T的v8-small模型,也只有0.5T的大小。

        所以这么算下来,也只直接next level到三倍的参数了???

        参数规模的显著提升,当然也意味着模型在深度推理能力和知识储备上预计会有不小的进步。

        更大的模型容量,往往能让它更好地理解复杂上下文、进行更长的链式思考,以及处理更具挑战性的真实开发任务~然鹅!

        这新模型最有看头的,还不在参数里,而在编程本事上——人老马特意说了:xAI在V9-Medium(1.5T)的训练中特意加入了大量「Cursor数据」。

        大家要知道,Cursor的数据不是普通代码库,是几百万开发者的真实工作流。

        Cursor数据其实更可能告诉模型,开发者在真实项目里,是怎么描述需求、定位问题、让AI读上下文、修改文件、修复报错、再继续追问的。

        也算是给Grok狠狠补一波「真实工程手感」......至于啥时候模型发布呢?

        官方说法是,目前V9-Medium的基础训练已经全部完成。

        微调工作正在紧锣密鼓地进行,强化学习阶段也将在几天后启动。

        按照xAI的计划,再过2到3周这个新模型就能正式向公众发布了。

        此外,颇值得一提的是——在给自己新模型打招牌的同时,人马斯克还不忘在评论区留个彩蛋:今年年底0.5T模型会开源哈,也是非常实用的!

        (大家可以小小期待一波~)AI编程工具Grok Build也开始测试了新模型之外,xAI自己的AI编程工具新品也有了新进展。

        目前,Grok Build这款AI编程代理工具已进入了早期Beta测试阶段。

        给大家小小介绍一下,Grok Build是xAI自家的编程Agent和CLI工具。

        形态上其实更接近Claude Code、Codex CLI这一类终端编程产品。

        开发者能在本地项目目录里唤起它,让AI直接读项目、理解上下文、规划改动、修改代码文件等等。

        从官方演示视频来看,Grok Build这次主打的能力AI Coding味儿十足:计划模式:用户输入需求后,Grok Build不会直接动手,而是先制定详细执行计划,让用户确认后再执行。

        多子代理并行工作:对于大型、复杂的任务,Grok Build会将工作分派给并行运行的Subagents。

        Skills、Marketplace、MCPs集成:我们可以方便地扩展Grok Build的能力,调用各种现成工具和插件。

        其他提及能力:支持创建图像和视频、构建自动化工作流等等。

        在具体使用方式上,xAI官方文档也给出了三种入口——一种是交互式TUI。

        也就是在终端里打开一个全屏交互界面,开发者可以直接和Grok Build来回对话、查看计划、执行任务。

        一种是headless模式。更适合塞进脚本、机器人或者自动化流程里,让它在后台按指令跑任务。

        还有一种是通过Agent Client Protocol接入其他应用。

        把Grok Build变成可以被外部工具调用的编程Agent。

        (方式多多,不愁挑选~)一边,xAI在用Cursor数据补强新一代基础模型的代码能力。

        另一边,又把Grok Build这种编程Agent推出来,直接切进AI Code工具战场。

        看得出,马斯克这波不打算只在聊天框里卷Grok了。

        (doge)收购Cursor后,马斯克狂赶Coding顺风车老马这波又是用Cursor数据喂新模型,又是Grok Build开始测试。

        其实也算不上太突然。毕竟早在几个月前,xAI在内部裁员调整的同时就开始大量接触和引入Cursor的人才与经验了——

        Cursor的两位核心工程负责人、曾帮助Cursor从0做到数十亿美元估值Andrew Milich和Jason Ginsberg。

        先后加入xAI,直接向马斯克汇报,核心任务就是从底层重构Grok的编码能力。

        然后就是上个月。马斯克不玩人才撬墙角那套了,直接把目标对准了Cursor这家公司本身。

        以600亿美元的价格收购Cursor,要知道这个数字比Cursor去年11月的估值整整翻了一倍多…

        所以再回过头看,短短一个月时间,老马这波Cursor「进货」,已经开始在Grok身上见效了:半个月前还只是刚露头的Grok Build,现在已经开始往开发者手里开始广泛测试了。

        而V9-Medium这边,也被马斯克亲口点名,补充训练里加入了大量Cursor数据,后续还会继续添加。

        不仅如此,在这之间,马斯克还透露过,新的Grok模型正在Colossus 2集群上正常训练中。

        这么多动作,这么多code的意味。所以我们回过头再看V9-Medium里那句「more to come」,现在看起来也挺耐人寻味。

        翻译过来我猜就是——Cursor每多一天接客,Grok就多一天加餐。

        接下来,就看老马怎么带着Grok正式下场打Code了,期待一下子~参考链接:[1]https://openrouter.ai/x-ai/grok-build-0.1?utm[2]https://x.com/elonmusk/status/2058787384364265734[3]https://x.com/JasonBud/status/2058974659648123084[4]https://x.com/xai/status/2058973760708091907— 欢迎AI产品从业者共建 —

        📚「AI产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为AI行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。一键关注 👇 点亮星标科技前沿进展每日见
🔗 原文链接:http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247893041&idx=2&sn=96ae8fae810e8bcbe005f97d49906772&chksm=e9742df63932a6fecceccc28b635c5ac780e3f904dd8f5dd63cb65cc1a1de304b06418ca3e39
← 返回列表