论文链接:Tree of Thoughts: Deliberate Problem Solving with Large Language Models
发表会议:NeurlPS 2023
大量实验已证明,人更喜欢使用直觉进行判断和决策,而这正是人类决策偏误产生的根源。理论上来看,System 2会监控系统System 1的活动,并对由其导致的偏误进行纠正
本文创新:
引入了一种新的语言模型推理框架“思想树”(ToT),它概括了流行的“思想链”方法来提示语言模型,并能够探索连贯的文本单元(想法)作为解决问题的中间步骤。
相关工作:
Methods
思维树的优势:
(1) 通用性: IO、CoT、CoT-SC 等可以被视为 ToT的特例(即深度和广度有限的树)。
(2) 模块化:基础 LM 以及思想分解、生成、评估和搜索过程都可以独立变化。
(3) 适应性:可以适应不同的问题属性、LM 功能和资源限制。
(4) 方便:不需要额外的训练。
思维树推理的方法 :
1. 将中间过程分解为思维步骤(利用问题属性来设计和分解中间思想步骤。)
2. 从每个状态中产生潜在的想法
3. 启发式评估状态(利用语言模型评估状态哪一个状态最接近当前问题的解决)
4. 搜索算法的选择(树的遍历方法:BFS和DFS*)
1. 24点游戏
选择100场游戏分别对IO、CoT、CoT-SC方法测试
对于ToT方法,24点游戏会被分为三个步骤,使用广度优先遍历树、采用b=1-5参数。
IO、CoT 和 CoT-SC 提示方法在任务上表现较差
相比之下,使用
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!