大模型风向大变!从拼肌肉到套缰绳,Harness才是落地王道?

  • 时间:
  • 浏览:111
  • 来源:越西县融媒体中心

短短几个月,大模型行业的风向已然发生了巨变。

按照传统的认知情形而言, 大模型的进化所遵循的逻辑呈现的是「更大、更强、更通用」这样的状态。在几个月之前的时候, 那个时候大模型的进化发展方向演变成了「具备更猛的编码能力」这种情况。到了2026年, 甚至在2026年仅仅才过去了一半这般阶段之下, 此时大模型行业好像是彼此心里明白但不公开说出来地转向了一个全新的关键词: Harness。

Harness是什么呢, 简而言之, 它是这样一套工程体系, 即把一个强大的AI模型, 给它“套上缰绳”, 使得它能够在真实的企业环境里, 稳定且高效地去完成工作。模型自身是引擎, 而Harness是让引擎得以跑在路上的整车。其一切是朝着实用以及能落地服务这个方向走的。

不得不感叹, 大模型的发展速度实在是太快了, 简直日新月异。行业的关注点几乎每天都在变化, 至于接下来创新与落地的方向究竟该如何确定? 可谓是让人绞尽脑汁, 不知所措, 实在难以抉择!

正是处于这个特定的节点之时, AIEC 2026人工智能与之生态大会于北京举行召开了。

AIEC人工智能加生态大会, 也就是AI加Eco Conference, 它由清华大学全球产业研究院主办, 受到中关村科学城管委会支持, 围绕着人工智能加如何从战略部署迈向产业实践展开系统的讨论, 聚焦重点行业的真实场景以及转型需求, 去探索AI技术进入千行百业的落地路径。

在本届大会当中, 有来自国家信息中心的专家代表汇聚于此, 有来自 IDC 的, 有来自阿里云的, 有来自腾讯的人士前来, 有来自月之暗面的相关人员, 有浪潮信息的代表, 有美的的相关人员参与进来, 来自上海人工智能实验室的专家代表也来了, 有阶跃星辰的相关人员, 百川智能的专家代表也齐聚, 同时还有 Dify 生态社区的开发者, 有中关村 AI 北纬社区的开发者, 有 DataWhale 生态社区的开发者参与到了本届大会。

一个大会, 它集合了全行业多领域方向, 为我们揭开了行业新趋势, 这个新趋势清晰且系统。

参数赛落幕,落地竞赛全面开启

在2023 年直至 2025 年期间, 所有人工智能公司的核心逻辑呈现出高度的一致性, 究竟是谁在评测排行榜上占据领先位置, 那么谁便会成为市场备受青睐的对象。当进入到 2026 年之时, 这样一套曾经的逻辑开始出现松动的状况。

6月初, 摩根大通的首席数据与分析官, 在纽约科技周上表示, 公司当中, 存在一些员工, 他们使用AI所产生的Token费用, 已然超过了自身的工资。

在这个时候, 所有人都清楚了, 大模型已然处于迈向落地的阶段, 正步入企业组织架构的重要时刻。

在AIEC大会的主论坛之上, 涉及Kimi大模型的相关负责人所作出的演讲明确指出:

今天, 编程场景占据了整个模型 Token 消耗量的 90% 以上, 全球程序员仅有 3000 万, 知识工作者却超过 10 亿, 鉴于编程能力延伸到更广泛工作场景, 整个范式会在接下来两三年迎来重大突破。

关于一切的关键之处在于效率的情况。“大模型从本质上来说是将能源以更加高效的方式转化为智能的某种特定情形。规模化的关键所在是要从数据利用、任务处理、协同模式等多个不同维度进行系统性地提升效率的特定行为。”。

更深远的变化存在着这样的情况, AI 正越来越多地投身于下一代 AI 模型的开发进程当中, 这里面涵盖了任务环境生成这一项, 也包含架构设计这一方面, 还包括参数优化这一要点, 如此状况意味着整个行业的智能提升加速度自身处于加速的态势。

未来,让 AI 成为正式员工

很快, 大模型就会不可避免地走进企业, 成为企业员工的一部分, 这使得大多数企业面临着挑战。

在这一点上, 浪潮信息董事长彭震的判断十分犀利, 他指出, AI 所带来的产业变革, 与前三次产业革命有着本质区别, 前三次革命改变的是工具, 然而 AI 改变的是人, 也就是劳动者本身, 工具的改变重塑了生产关系, AI 同样也会重新构建一种全新的生产关系。

彭震提出, 基于他引用陶哲轩观点「AI 擅长广度, 人类擅长深度, 两者高度互补」后作出的判断, 人机协作可能会在未来很长时间里一直存在, 智能体时代的 AI 原生企业面临组织从管理 Human 进化到管理 Humagent(Human+Agent)的情况。

我们察觉到, AI宛如企业里那样精力充沛的年轻人一般, 其执行力相当出色。然而, 一个组织能够实现健康运行, 所依靠的乃是使每个人的能力在规则以及方向上各自回归到相应的位置。就如同今日的AI也是如此这般, 我们需要凭借组织管理这种充满不确定性的状况, 促使它切实成为生产力。

这场变革, 并非一家企业能够独自去完成的, 它需要产业生态进行协同, 上游硬件厂商要提供多元算力, 模型公司要提供多种模型, 并且还需要AI服务公司去做转型咨询, 智能体开发商要做外包开发, 自动化工作室要开展新业务模式。浪潮信息鉴于此推出了元脑生态合作计划, 该计划涵盖能力共建、经验共享以及联合市场基金。

这或许是在AIEC大会期间, 无比值得反复玩味思索从中获取的最需深入体会的深刻见解: 要是组织能力没办法跟得上节奏, 那么便会演变成最为突出的矛盾冲突。

集体下场做工具,智能体就是生产力

好多大模型公司, 差不多都在自行去开发Coding工具, 还有Agent框架喔, 没有任何人愿意把这个环节交付给第三方去做。

今年年初的时候, 马斯克xAI里头的工程师被发现, 居然借助第三方工具Cursor这个玩意儿, 居然大量地使用竞争对手Anthropic的Claude这个东西来写代码。消息被披露出来之后, Anthropic这家公司疾速切断了竞争对手的访问权限。

模型公司为什么要亲自做工具?

其一, 仅仅依靠纯模型, 根本就很难树立起企业价值, 待模型方面的能力逐渐趋向于相近的时候, 实际上能够达成价值创造的, 乃是那种可以直接去完成任务的Agent产品, 要是仅仅只是从事底层模型的构建, 最难的技术自己亲力亲为去做了, 然而最大的商业价值却极有可能被工具层给夺走。

第二, Agent所产生的效果, 对模型以及工具之间深度适配的依赖程度极高。智能体并非单纯地进行问题回答, 它还需要对上下文予以管理, 对工具展开调用, 去执行任务操作, 在出现错误时进行恢复处理, 对结果加以校验, 甚至要促使多个智能体之间开展协作。

这恰恰是腾讯资深产品技术专家汪晟杰所提及的方向, 企业智能体规模化落地的关键之处在于, 要以 Agent OS 当作统一技术底座以及运用合理调度策略, 进而将智能体转变为能够进行管理、执行、校验、记忆与协作的「超级团队」。

在AIEC大会主论坛上, 阿里云Qoder解决方案总监韩红娜进行了分享, 而这一分享恰恰呈现出了那种“模型 + 工具一体化”的完整图景。

她将AI编程工具的进化描绘成三个阶段, 先是代码补全阶段, 接着是自主开发工作台阶段, 最后是智能体专家团承接端到端任务阶段。

她更进一步地提出, 行业正处于一种从Vibe Coding迈向Vibe Working的进程之中, 并且针对AI Native组织给出了四个方面的要素, 这四个要素分别是, 决策链路的缩短, 人才的建设, 协作成本的集中管控, 以及自动化闭环验证。

当模型被整合到同一个技术体系里, 当工具被整合到同一个技术体系里, 当记忆被整合到同一个技术体系里, 当调度被整合到同一个技术体系里, 当验证被整合到同一个技术体系里, 当协作被整合到同一个技术体系里, Agent 才不再只是一个聊天入口, 而会变成真正嵌入组织流程的生产力单元。

把Coding转变为Working, 将单点助手发展成智能体团队, 大模型公司接下来要做的是, 提供一套下一代工作系统, 它能够不间断地执行任务, 积累沉淀经验, 优化完善流程。

Agent 落地的两块拼图

除去主论坛之外, 此次的 AIEC 大会另外安排了 5 场分论坛, 这些分论坛之中有着将近 60 场专题报告。五个分论坛之中, 有的聚焦于 AI Coding, 有的围绕企业级 Agent 落地, 有的针对大模型产业化。还有的聚焦 OPC 超级个体, 另外有的关注智算中心 Token 服务。它们几乎覆盖了 AI 行业发展以及生态落地的各个方面。

受文章篇幅所限, 此地以智能体时代促使 Agent 落地作为主线, 深入探究两个关键细节, 其一为 Agent 在生产环境里怎样奔跑得高效, 其二为如何令 Agent 由「一次性工具」成长为「老员工」。

承担阶跃星辰模型GTM负责人一职的龚关, 于分论坛的演讲期间, 将问题的关注点, 集中在了生产环境里最为现实的三个瓶颈之处。

首要的是延迟, 其会直接对用户留存造成影响, 因为 Agent 属于长程任务, 所以用户能够察觉到每一秒的等待;其次是成本, 一个 Agent 通常来讲需要长程推理以及进行多轮会话, 故而 Token 消耗远远超过普通对话场景;再者是可靠性, 长链路任务容易出现跑偏、卡住以及中断的情况。

不是我们所需的有, 一个具备聪慧特质然而价格高昂的模型, 或者一个价格低廉却可靠性欠缺的模型, 又或者一个于单轮任务中呈现良好表现但一旦进入长程任务便出现问题的模型。我们真正所需的是高效智能。

曾经作为模型竞争前沿的极致智能, 已然成为过去式, 今朝其前沿阵地已转向可规模化的高效智能。

要是将企业级 Agent 当作一名新入职的员工, 那么, 「记忆」便是它从初入职场者转变为经验丰富者的关键所在。

将记忆张量 MemTensor 解决方案架构师陈玉涛, 置于分论坛之中, 所探讨的恰恰是这个容易被忽视的问题, 即业务发生变化之后, Agent 是否每次都得重新进行编排, 它可不可以自行学习, 且自我进化?

他将 Agent Memory 拆解为五种能力, 分别是记忆抽取, 记忆组织, 记忆检索, 记忆更新以及记忆共享。

他还提出了「Memory Skill」这个概念, 其做法是, 去自动提取优秀员工或者优秀 Agent 的经验, 使之成为能够再次使用的 Skill, 之后, 再把这个 Skill 迁移给到别的 Agent 那儿去, 或者是用在员工的培训方面。这实际上是在处理企业长期以来存在的知识管理难题这事儿, 也就是把属于个人自己的经验转化为组织所拥有的能力。

首先, 要使得 Agent 能够跑起来, 达成跑得快的既定状态, 并且还要确保其跑得稳。然后, 要致使 Agent 处于记得住一定内容的程度上, 使得它有学得会相关知识及实践的能力, 还要具备能够实现成长的潜力。只有把这两件事情紧密地结合在一起, Agent 才具备从一个每次都得从零开始的临时性质的工具, 转变成为拥有具体岗位, 收获相关经验, 与此同时还能够持续不断进行进化的数字员工的可能性。

展望:人与 AI

这次大会存在条主线, 这条主线是, 企业AI进行转型时, 其核心战场处于组织, 将这些观点拼凑到一块, 一条清晰的行业脉络便浮现出来了。

从2023年起, 直至2025年, 竞争所处层面为模型层, 在这期间, 谁所拥有的参数数量众多, 且得分处于高位情形, 那么谁即为赢家。

在二零二六年的上半年期间, 竞争的方向发生转移, 转移到了工具层面。那些模型公司集体进入市场, 着手去做Agent框架以及编程工具, 从原本的「卖模型」转变为「卖Agent能力」。

从 2026 年下半年起, 竞争会踏入组织层面。能够助力企业达成 AI 原生的组织重新构建, 使得 Agent 切实作为数字工作者跑进生产环境的一方, 便占据了下一个时期的关键位置。

但处于当下这里, 理当以更为向前推进、拓展的姿态, 去展望那距离当前更远、未曾充分考量的各种可能性。于此次 AIEC 大会的那些议程安排里面, 存在着如下这样一个有着相当特别之处的角色, 他就是清华大学全球产业研究院的院长彭凯平这位身为心理学家的人物。

他讲道, “AI将效率予以提升, 然而效率自身从来都不是人类所追求的目标。”。

彭凯平教授提了个问题, 这个问题是在座所有人都得面对的, 那就是当机器变得越来越像能干的人时, 人究竟还有啥不被替代的比较优势呢?

人具有竞争优势, 其在于心理能力, 他的回答指出, 同理心、道德判断是一类, 对未来的创造性想象是一类, 在模糊情境中的直觉决策亦是一类, 它们都是机器运用线性逻辑无法一一推导计算得出的。

「人类的智能优势是想象未来。」

他指出, 源自马丁・塞利格曼的研究, 人类真正具备的特质是「前瞻性」, 大脑里的默认神经网络, 持续在下意识地处理未来。他还进一步提出了「心主权」这一概念, 即在AI时代, 人类不能够让价值观被机器给取代掉, 不能够让深度思考能力被数据去控制住, 不能够让情感被AI进行操作, 更不能够让人格以及隐私完全被人工智能所支配。

本质上是在为 AI 原生组织中「人的位置」提供一个锚点。

大模型领域的竞争, 已然更换了一个牌桌。可是最终, 全都要回归到「人」的实质了。

猜你喜欢

6.58万起!零跑A10狂卖2.2万台,年轻人抢疯了,凭啥?

零跑A10最早在今年3月26日上市,是面向年轻人打造的入门级小型纯电SUV,指导价6.58-8.68万元。新车上市后市场反响热烈,据销量数据显示

2026-06-19

宁夏房车充电桩:沙漠里的电,比绿洲还难找

宁夏房车营地充电桩房车电能补充设施在特定地理区域内的设置需考虑地理特征、气候条件与用户需求的多重影响。该类设施的配置不仅涉及电力输入输出端口

2026-06-19

年代剧王炸!张嘉译主角一出手,央视收视直接飙上天

年代剧能否出圈,开局是关键。年代剧作为国产剧中的热门剧,一直以来深受观众追捧,尤其是央视开播的年代剧让观众爱不释手,譬如《人世间》、《繁花》,以及《我的山与海》部部让观众赞不绝口。

2026-06-19

零跑C10和元PLUS价格撞车?别纠结了,一看灯组就知道谁更狠

6月16日,零跑C10刚一上市,我就盯上了发布价——4款车型,12.58万到14.28万。说实话

2026-06-19

央视年代剧主角炸了!张艺谋监制+秦腔入魂,这火五个月都灭不了

开年到现在,已经五个月了,央视年代剧这把火不仅没有熄灭,反而越烧越旺了。从开年年代大剧《好好的时光》到《我的山与海》再到《主角》部部好评 如潮,备受观众喜爱,成为年度最佳爆款剧。

2026-06-19