狂砸10万GPU!25岁CEO捅破天:Cursor新模型比GPT-5.5还大,这波收购血赚
- 时间:
- 浏览:164
- 来源:越西县融媒体中心
才刚被SpaceX宣布经由600亿美元予以收购的Cursor, 发布了大模型。
这个周二, Cursor宣称了一项全新的、参数数量是1.5万亿 加 的模型, 此模型在数量超过10万块的GPU上开展了预训练。
消息是于在旧金山举办的 Cursor Compile 这一活动上宣布的, 而该活动乃是 Cursor 所举办的首届旗舰大会。
按照 Cursor 年仅 25 岁的 CEO Michael Truell 的讲法, 新模型的规模跟 Opus、GPT 的规模是一样的。Opus 在 4.5 到 4.8 的范围, 还有 GPT, 从 5 到 5.5 的范围, 实际上都没那么大!它们全都低于 2 万亿参数(啊!似乎察觉到了什么重大秘密)。
这有着某种意味, 就GPT - 5.5现下的性能而言, 那是能够达成的, 对于开源模型来讲, Opus 4.8当前的性能情况也是如此, 也是可以达成的。
Michael觉得, 在当下这个时期, 唯一的那种护城河便是规模化地去扩展。
依现在的情况来看, Anthropic, 是那唯一成功提升到大约10万亿参数规模境界的AI实验室, Michael觉得OpenAI想要在年底之前再度赶追Anthropic并非易事, Anthropic只要在接下来的一到两年之中持续朝着Mythos投入RL计算资源, 它便会接续得以稳步变强。
Michael谈到了他的看法, 针对的是其他几家头部AI实验室。他觉得, Google的模型规模没推到同等程度, 并且在稀疏化路线上步子迈得太猛, 而后训练以及强化学习能力也没能充分转变成稳定、好用的产品体验。OpenAI还在承受GPT - 4.5之后路线调整带来的压力, xAI和Meta正在为下一阶段大模型竞争做准备。
然而, 没过多久, 便有人迅速地提出了疑问, 那便是: Michael所讲的那个称为「Opus和是GPT - 5.5万亿参数模型」其中究竟从什么样的源头而来呢? 这实在是让人产生非常强烈的怀疑之情。
别管那些外部给出的判断, Cursor此次切实值得予以关注的要点在于, 它并非仅仅满足于去调用已然现成的模型, 而是着手开始进行系统性的训练自身的底座模型。
这也是, Michael Truell, 在演讲里, 首次, 较为完整地, 披露的, 新模型计划。
视频链接:https://mp.weixin.qq.com/s/12M8FmYM5Sv8jVpBQCGyPw
这个新模型, 有着三个称得上明显的, 可与Cursor过去所使用的模型相比较而言的变化。
首先, 其规模更为庞大, 这可是他们截至目前所训练过的最大的模型, 规模已然快要接近于前沿大模型公司的水平了。
第二, 它是从一开始就进行训练的, 并非是在开源模型的基础之上持续进行微调, 这家公司在上段日期期间还曾经被卷入到「Cursor 套壳 Kimi」的争议之中。Michael 还专门补充说明, 他们依旧喜爱开源, 并且也期望在未来能够寻觅到更多向开源社区予以回馈的方式。然而从一开始就进行训练所具备的益处在于, 团队能够更为整体地把控模型行为,并且能够使得模型更加契合他们以及开发者切实关注的工作负载。
其三, 此次训练所运用的算力规模较以往而言要远远超出, 相较于他们往昔能够动用的算力情形, 此番大约提升了十到二十倍之多。往昔从 Composer 1 至 Composer 2.5 阶段, 相关模型更多是在相对受限的算力条件之下被训练出来的, 同前沿实验室相比较差距是极为显著的。这同样对模型能力持续提升的空间形成了限制。缘由在于诸多改进最终都会受到一个问题的制约: 究竟可不可以运用更多的 GPU 并且进行更为漫长时间的训练呢。现在, 算力规模得以提升之后, 他们持有这样的看法, 即模型会存在带来真正具有差异化特质能力的可能性。
尤为关键的是, 这个全新的模型并非仅仅针对代码能力, 团队期望它拥有更为普遍的智能, 鉴于Cursor的目的并非单纯使AI编写代码, 而是让任何一个人都能够打造出自身所期望的事物, 当下实际存在的瓶颈, 已并非单纯是“代码编写得是否出色”, 而是AI能否如同一位工程师同事那样开展工作。
这表明模型得会去运用工程师常常会用到的工具, 要能够进行规划, 要可以测试软件, 要切实点进界面之中去检查按钮以及交互, 也要清晰地给用户呈现 Agent 究竟更改了什么。也就是说, Cursor 打算将模型具备的能力从单纯的代码生成, 推进至更为完整的软件工程协作能力。
在演讲期间, Michael有如此表述, 即该模型的训练已然开启, 预估会于后续的几周时间里予以发布 , 另外, 相关能力的背后会有外部算力或者基础设施合作提供支撑 , 而这背后所提及的支撑毫无疑问指的便是SpaceX。
当然,真正的答案还要等模型发布后才能揭晓。
https://x.com/scaling01/status/2067017700384125238
https://x.com/Yuchenj_UW/status/2066891492187320405
https://x.com/nickadobos/status/2066929277757800833?s=46
猜你喜欢