论文分享-Tree of Thoughts: Deliberate Problem Solving with Large Language Models

Tree of Thoughts: Deliberate Problem Solving with Large Language Models 论文链接：Tree of Thoughts: Deliberate Problem Solving with Large Language Models 发表会议：NeurlPS 2023...

Tree of Thoughts: Deliberate Problem Solving with Large Language Models

论文链接：Tree of Thoughts: Deliberate Problem Solving with Large Language Models

发表会议：NeurlPS 2023

Introduction

大语言模型越来越多地被部署用于解决各种任务中的一般问题

最初设计用于生成文本，现已证明能够越来越多地执行需要运算的任务、常识和知识推理任务

面对复杂问题存在重大挑战：

在推理过程中仍然受限于token级别的预测、从左到右的决策过程

大模型没有纳入任何类型的规划、展望或回溯来帮助评估不同的选项

难以完成需要探索、战略前瞻性或初始决策发挥关键作用的任务

ü卡尼曼双系统思维模型

l关于思维与决策的许多看法，人的大脑存在两个系统，他称为System 1和System 2，分别代表快与慢两种作决定的方式——直觉和理性，这是两种具有不同认知功能的思维模式。

l直觉（System1）的操作是快速的、平行的、自动化的、不耗费资源的、联结的、内隐的（无需反省）以及通常是情绪驱动的，经常为习惯、经验、刻板印象所支配，因此很难控制或修正

l理性（System 2）的操作是缓慢的、系列的、控制的、耗费资源的、不容易出错、存在意识控制。

大量实验已证明，人更喜欢使用直觉进行判断和决策，而这正是人类决策偏误产生的根源。理论上来看，System 2会监控系统System 1的活动，并对由其导致的偏误进行纠正

本文创新：

引入了一种新的语言模型推理框架“思想树”（ToT），它概括了流行的“思想链”方法来提示语言模型，并能够探索连贯的文本单元（想法）作为解决问题的中间步骤。

框架概览：

思维树的优势：

(1) 通用性： IO、CoT、CoT-SC 等可以被视为 ToT的特例（即深度和广度有限的树）。

(2) 模块化：基础 LM 以及思想分解、生成、评估和搜索过程都可以独立变化。

(3) 适应性：可以适应不同的问题属性、LM 功能和资源限制。

(4) 方便：不需要额外的训练。

思维树推理的方法 ：

1. 将中间过程分解为思维步骤（利用问题属性来设计和分解中间思想步骤。）

2. 从每个状态中产生潜在的想法

3. 启发式评估状态（利用语言模型评估状态哪一个状态最接近当前问题的解决）

4. 搜索算法的选择（树的遍历方法：BFS和DFS*）

Experiment

1. 24点游戏

选择100场游戏分别对IO、CoT、CoT-SC方法测试

对于ToT方法，24点游戏会被分为三个步骤，使用广度优先遍历树、采用b=1-5参数。

IO、CoT 和 CoT-SC 提示方法在任务上表现较差

相比之下，使用

发表于 2024-06-17 19:10
阅读 ( 1690 )
分类：论文分享

论文分享-Tree of Thoughts: Deliberate Problem Solving with Large Language Models

Tree of Thoughts: Deliberate Problem Solving with Large Language Models

Introduction

大语言模型越来越多地被部署用于解决各种任务中的一般问题

最初设计用于生成文本，现已证明能够越来越多地执行需要运算的任务、常识和知识推理任务

框架概览：

Experiment

你可能感兴趣的文章

相关问题

0 条评论

作家榜 »