ICLR 2026竣事之后,,,,,Hugging Face工程师Aritra Roy Gosthipaty发了一条帖子,,,,,精准戳中了这个问题:“在Agent语境下,,,,,harness和scaffold究竟是什么意思?????我在ICLR听到过许多种诠释,,,,,但始终不明确为什么没有收敛到一个统一的界说。。。。。。”
这个问题很快引起共识,,,,,Hugging Face的两位工程师Sergio Paniego和Aritra,,,,,联手宣布了一篇博客,,,,,这是一份专门解读最容易被混用的那些看法的手册,,,,,我通读并编译了全文,,,,,把其中最焦点的框架拎了出来。。。。。。
Model,,,,,就是谁人裸的大语言模子。。。。。。Claude、GPT、Qwen、DeepSeek、Kimi,,,,,文本进去,,,,,文本出来。。。。。。没有影象,,,,,没有循环,,,,,不会自动做任何事。。。。。。它可以“表达”挪用工具的意图,,,,,但真正去执行,,,,,需要别人帮它。。。。。。
Scaffolding,,,,,是模子所“看到”的一切。。。。。。系统提醒词怎么写、工具怎么形貌、输出按什么名堂剖析、跨办法记着什么,,,,,这些组成模子眼里的天下,,,,,它塑造了模子的行为界线,,,,,但自己不认真运行。。。。。。
关于Scaffolding和Harness的区别,,,,,文章给了一句极其精练的区分:Scaffolding是模子可感知的部分(提醒词、工具界说、输特殊式),,,,,Harness是驱动模子运行的部分(挪用循环、工具执行、阻止判断)。。。。。。
两位作者也坦率体现,,,,,一样平常谈天这么讲无伤细腻。。。。。。但一旦进入训练,,,,,把Scaffolding和Harness拆开审阅就变得至关主要,,,,,训练时,,,,,Scaffolding决议了模子学到什么;;;;;推理时,,,,,Harness决议了模子怎么跑。。。。。。
Agent这个词自己源自强化学习,,,,,在RL里,,,,,Agent就是一个函数:吸收视察,,,,,返回行动。。。。。;;;;G樾挝招卸ブ葱,,,,,返还视察效果,,,,,循环继续。。。。。。这个循环,,,,,就是今天所有LLM Agent的底层逻辑。。。。。。
用编程Agent当例子最直观:系统提醒词和工具形貌是Scaffolding,,,,,真正完成挪用模子、执行git diff、运行测试、判断何时阻止谁人循环的,,,,,是Harness。。。。。。训练的时间,,,,,Harness还要并行跑成百上千个这样的循环,,,,,把效果喂回去更新模子权重。。。。。。
两个产品就算底层用的是统一个模子,,,,,体感可以完全差别,,,,,由于它们的Harness做了差别选择。。。。。。反过来,,,,,统一个Harness换一个更强的模子,,,,,体验也会变。。。。。。
Context Engineering(上下文工程)的焦点问题是,,,,,Agent每一步看到什么。。。。。。除了写系统提醒词,,,,,还要动态治理整个上下文窗口:系统提醒词、工具形貌、对话历史、检索到的知识,,,,,每一步都可能纷歧样。。。。。。
它和Prompt Engineering的要害区别在于:不是一次性写好就完了。。。。。。随着Agent运行,,,,,前几轮的输出会影响在后续挪用中放入什么,,,,,Harness需要在整个运行历程中自动治理上下文,,,,,包括删什么、留什么、从那里检索增补,,,,,不是写个prompt罢了。。。。。。
关于上下文工程,,,,,训练和推理的蜕化价钱天差地别,,,,,训练时搞错上下文,,,,,模子学到过失的工具,,,,,价钱是重新训练,,,,,推理时搞错,,,,,可以修改提醒词然后重新最先即可。。。。。。
影象系统也被纳入了上下文工程的框架。。。。。。短期影象是单次运行中留在上下文窗口里的内容:对话历史、工具返回效果、之前的推理链。。。。。。恒久影象跨会话长期化,,,,,保存外部,,,,,需要时检索回来注入上下文。。。。。。两者由Harness在统一套上下文治理逻辑中统一调理。。。。。。
Policy部分受模子权重影响,,,,,但最终行为也取决于Scaffolding和Harness,,,,,统一个模子,,,,,换一套提醒词、工具或执行循环,,,,,行为可以截然差别,,,,,Policy不是Agent,,,,,Policy界说行为。。。。。。
Tool Use是最底层。。。。。。诸如API、代码诠释器、数据库、网络搜索、文件系统等等,,,,,Agent通过这些接口触及外部天下。。。。。。模子只会以结构化的名堂表达挪用工具的意图,,,,,API将其作为一等工具泛起,,,,,Harness吸收挪用并路由到准确的位置,,,,,返回效果进上下文,,,,,然后继续循环。。。。。。
Sub-agent是最高层。。。。。。许多人把它当高级工具来用,,,,,但文章给了明确区分:Sub-agent有自己单独的模子和Scaffold,,,,,能自力推理、自己调工具,,,,,甚至能再挪用新的Sub-agent,,,,,这是它和Tool以及Skill的实质差别。。。。。。
RL Environment,,,,,指Agent在训练时可以与之交互的任何系统。。。。。。它的事情方法是:Agent向它发出一个行动(好比执行一条下令),,,,,它执行这个行动、更新自身状态,,,,,然后把新的状态信息返回给Agent。。。。。。
Trainer,,,,,认真让Agent的能力逐步提升。。。。。。它做的事情分三步:第一,,,,,让Agent重复执行完整使命,,,,,跑许多轮;;;;;第二,,,,,对每一轮的效果打分;;;;;第三,,,,,用这些分数来更新Agent内部模子的权重参数,,,,,让下一次执行更靠近准确谜底。。。。。。整个历程是自动循环的。。。。。。
Rollout,,,,,指Agent完成一次完整使命的全程纪录。。。。。。内里包括三个部分:Agent在每一步看到了什么信息、它据此做出了什么行动、每一步获得了几多分。。。。。。这份纪录也被称为trajectory或trace,,,,,实质上就是算法通太过析大宗这样的纪录,,,,,找到让分数变高的行为模式。。。。。。
Sergio和Aritra在文章中写道:“这篇文章的目的不是推行唯一准确的词汇,,,,,而是提供一个适用的头脑模式。。。。。。”当一个领域快速生长时,,,,,其术语的演变速率往往凌驾其共识的形成速率。。。。。。
叶子医院私密整形说到吴莎,更有意思。她不是"刘翔背后的附属品",她本身就是高水平运动员出身,懂这一行的天花板,也懂代价。两人选择丁克,外界最爱用"自私""传宗接代"那套尺子量,但知情口径里反复出现的点就一句:身体吃不消,且不想把下一代拉进同样的损耗循环。你同不同意那是他们的自由,但至少别装糊涂:这选择不是因为"钱太多闲得慌",恰恰相反,是曾被伤病按在地上摩擦的人才有的清醒——知道有些东西比"必须有个孩子"更贵。前足球运动员克莱夫-克拉克说:“我的情况和埃里克森一样。医生找不到明确的心脏缺陷。”2007年,克拉克效力莱斯特城期间在更衣室突发心脏骤停,27岁时植入ICD。叶子医院私密整形《《妻子的救赎》》此前,罗梅罗一直与西甲球队联系在一起,巴塞罗那和马德里竞技都对他非常感兴趣。不过,据阿根廷媒体最新消息透露,这位阿根廷国脚有可能会继续留在英超效力。据悉,曼联希望买下这位后卫,以此在重返欧冠赛场前补强球队防线。保莱塔表示:“我对2026年世界杯当然充满信心,因为我们在每个位置上都有很强的实力,还有一些球员是世界顶级俱乐部的重要成员。所以,我非常相信我们的国家队。我们拥有一支非常团结、强大,而且很有实力的球队。备战方式应该和他们一直以来所做的一样。之后,如果球进了,大家就会说准备得好;如果球没进,大家就会说准备得不好。我相信球队会做好最充分的准备,因为我了解国家队负责这些工作的人。当然,如果之后真的需要在两个国家之间奔波比赛,就像葡萄牙晋级淘汰赛后可能遇到的情况一样,这并不容易。即便如此,这样的困难对所有球队来说都是一样的。”
20260609 ? 叶子医院私密整形“很好的是我没有太多时间去思考这件事,说实话我也不是特别紧张。我只是想上场比赛,向所有人展示我能做什么。然后,是的,我踢得很开心。”《我的野蛮女先生2》A:SVG是通用矢量图格式,可以用Illustrator、Inkscape、Figma等主流设计软件打开,也可以直接用代码编辑器修改其中的文字、颜色和位置属性。CRAFTEDITOR的目标是把位图里每个视觉元素都转化为SVG中独立可操作的节点,让研究者可以直接修改单个标签或调整局部布局,而不需要重新生成整张图。
20260609 ? 叶子医院私密整形布雷默的妻子黛博拉-克劳迪诺谈到丈夫时说:“我非常钦佩他的投入和努力,尤其是在他受过那次伤之后。(2024年10月,布雷默左膝前十字韧带断裂)我看到了他所有的付出,所以能看到他再次参加世界杯,对我们来说是一件很开心的事。作为他的妻子,我非常骄傲。”糖心破解版综合由克而瑞好房点评提供的深度研判,招商·臻园并非追求极致通勤便利(如地铁上盖)的首选,但它是注重居住品质、生态环境与资金安全的改善家庭的理想之选。