Alibaba发布：可编辑CoT，超越ReAct20%

charles

本期介绍的是一个Cot思维连框架Verify-and-Edit (VE)。该框架通过根据外部知识对推理链进行后期编辑来提高预测的事实性。

Cot思维连的作用

思维链 (CoT) 能够改善需要复杂推理的任务的性能，例如数学文字题、常识推理和符号操作。同时，它能够生成可解释的推理链。

为什么要编辑CoT思维连

提高 CoT 的质量可以有利于提高可解释性和最终任务的性能。
人类认为好的解释通常意味着更准确的预测。因此，更好的 CoT 提示集可以提供更好的基础和逻辑一致的思维过程，从而导致更准确的预测。
为了缓解LLM的幻觉问题，提高生成质量，一个重要的方面是保证事实正确性
Verify-and-Edit (VE) 框架通过对后期编辑推理链以获得更符合事实的预测

Verify-and-Edit (VE)是如何编辑Cot思维连

一共五个步骤：

chain-of-thought:将一致性低于平均水平的预测传递到下一阶段，同时保持高度一致的预测不变；
verify:生成验证问题；
External knowledge Retrieval:检索外部知识；
Edit Rationales:使用有根据的答案编辑理由；
new prediction: 生成新的预测。

Alibaba发布：可编辑CoT，超越ReAct20%

用例子解释一下：

句子John Nyskohus 为挪威足球队 Odd Greenland 效力。
在编辑时，首先生成一个问题来验证此细节，例如John Nyskohus 为哪个球队效力？
然后，为了回答这个问题，通过开放域检索系统引入外部知识。例如，事实John Nyskohus … 为阿德莱德城效力……在此实例中被检索到。
然后，通过在提示中提供检索到的事实作为记忆，对基本原理进行编辑。
因此，可以根据检索到的事实更新编辑。
给定编辑后的基本原理，会生成新的预测，该预测考虑了更多与事实一致的推理轨迹。

Verify-and-Edit (VE)推理的伪代码如下：

Alibaba发布：可编辑CoT，超越ReAct20%

Verify-and-Edit VS ReAct

Verify-and-Edit 比 ReAct精准度提高了20%

Alibaba发布：可编辑CoT，超越ReAct20%

前沿技术大模型技术新闻资讯

中国AI应用们，正在苦等一个国产Claude

2025-4-30 3:22:33

前沿技术大模型技术新闻资讯

工作流（Workflow）VS 智能体（Agent）

2025-4-30 4:26:01

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

❯

购物车

优惠劵

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部