当前位置：首页 > news >正文

论文笔记--Toolformer: Language Models Can Teach Themselves to Use Tools

news 2026/2/10 3:04:44

论文笔记--Toolformer: Language Models Can Teach Themselves to Use Tools

1. 文章简介
2. 文章概括
3 文章重点技术
- 3.1 Toolformer
- 3.2 APIs
4. 文章亮点
5. 原文传送门

1. 文章简介

标题：Toolformer: Language Models Can Teach Themselves to Use Tools
作者：Timo Schick, Jane Dwivedi-Yu, Roberto Dessì, Roberta Raileanu, Maria Lomeli, Luke Zettlemoyer, Nicola Cancedda, Thomas Scialom
日期：2023
期刊：arxiv preprint

2. 文章概括

文章给出了一种可以自动调用API的LLM方法“Toolformer”，该工具可以自行决定是否调用API，何时调用API以及调用什么API，从而达到通过API检索增强增加LLM回答的可靠性。

3 文章重点技术

3.1 Toolformer

给定语言模型 $M$ ，给定一系列可供调用的API接口 $c=(a_c, i_c)$ ，其中 $a_c$ 为API的名称， $i_c$ 为API的输入，API会返回结果 $r$ ，记 $a_c(i_c) \to r</API>)$ ，其中 $\to$ 表示特殊token，用于区分API的输入和输出。给定数据集 $\mathcal{C} = \{x^1, \dots, x^{|\mathcal{C}|}\}$ ，其中 $x^i$ 表示输入的文本。则Toolformer按照如下的步骤进行训练、推理：

Sampling API Calls：首先，对每个API接口，我们设计一个对应的prompt“ $P (x)$ "让模型自动改写原始输入为调用API的输入。如下图所示，对一个原始输入文本 $x$ ，对任意位置 $i\in\{1, \dots, n\}$ ，我们基于 $x_1, \dots, x_{i-1}, P(x)$ 预测下一个token是 $< A P I >$ 的概率 $p_i = p_M (<API>|P(x) , x_{1:i-1})$ ，如果条件概率值高于给定阈值 $\tau_s$ ，则认为模型应该在该位置调用API，如果存在高于 $k$ 个位置的概率值大于 $\tau_s$ ，则只保留top $k$ 个位置。最终得到需要调用API的位置集合 $I=\{i|p_i > \tau_s\}$ (不超过k个)。接下来，对每个 $i\in I$ ，我们基于 $x_1, \dots, x_{i-1}, <API>]$ 调用API接口得到接下来的预测结果。
Executing API Calls: 接下来执行上述语言模型自动生成的API调用文本 $c_i$ ，得到对应的结果 $r_i$ 。
Filtering API Calls：令 $L_i(z) = -\sum_{j=i}^n w_{j-i} \log p_M(x_j | z, x_{1:j-1})\\L_i^+ = L_i(e(c_i, r_i))\\L_i^- = \min (L_i(\epsilon), L_i(e(c_i, \epsilon)))$ ，其中 $\epsilon$ 表示空序列。上述 $L_i^+$ 实际表示给定 $x_1, \dots, x_{j-1}$ 和API返回结果 $r_i$ ，模型预测得到 $x_j$ 的加权概率的负数， $L_i^-$ 表示不进行API访问，或者只进行API访问但是不返回结果的情况下，模型得到 $x_j$ 的最小损失。如果 $L_i^+$ 比 $L_i^-$ 小很多，则可以认为访问API确实带来了收益。从而我们可以通过设置阈值 $\tau_f$ ，当 $L_i^- - L_i^+ \ge \tau_f$ 时，认为模型应该在 $i$ 位置访问API。
Model Finetuning：给定文本 $x$ 和位置 $i$ 处的API访问结果 $c_i, r_i)$ ，我们可重写输入文本为 $x_{1:i-1}, e(c_i, r_i), x_{i:n}$ ，最后基于数据集 $\mathcal{C}$ 生成SFT数据集 $\mathcal{C}^*$ 。在 $\mathcal{C}^*$ 上对模型进行微调，得到我们的toolformer工具。
Inference：推理阶段，我们进行正常的解码，直至模型生成 $\to$ 特殊token，此时我们将 $\to$ 之间的文本输入待调用的API，得到结果 $r$ ，然后我们将该结果拼接到模型的解码结果中，并插入 $< / A P I >$ 特殊token进行标记，然后继续解码直至结束。

3.2 APIs

我们选择了多种API对语言模型进行加强：

针对问答类型的文本，文章采用问答大模型Atlas作为API进行加强
针对数学计算，文章采用一个简单的python工具作为API进行加强
针对维基百科搜索，文章采用BM25作为API进行加强
针对多语言，文章采用fast-text进行语言检测，然后通过NLLB作为API统一翻译成英文进行加强
针对日期类问题，文章直接返回系统当前日期作为API进行加强

4. 文章亮点

文章提出了Toolformer工具，可通过对数据集进行采样、过滤生成SFT数据集，从而对LM进行微调，得到一个通过访问不同API来对LM能力进行加强对工具。实验表明，文章提出的Toolformer在多个API相关的下游任务上有明显提升，且ppl结果表示模型在自然语言生成任务上的能力并没有降级。

5. 原文传送门

Toolformer: Language Models Can Teach Themselves to Use Tools

论文笔记--Toolformer: Language Models Can Teach Themselves to Use Tools

论文笔记--Toolformer: Language Models Can Teach Themselves to Use Tools 1. 文章简介2. 文章概括3 文章重点技术3.1 Toolformer3.2 APIs 4. 文章亮点5. 原文传送门 1. 文章简介标题：Toolformer: Language Models Can Teach Themselves to Use Tools作者&#…...

编程日记 2023/11/27 20:42:44

stm32实现0.96oled图片显示，菜单功能

stm32实现0.96oled图片显示，菜单功能功能展示简介代码介绍oled.coled.holedfont.h（字库文件）main函数代码思路讲解本期内容，我们将学习0.96寸oled的进阶使用，展示图片，实现菜单切换等功能，关…...

编程日记 2023/11/27 20:40:42

sqlite外键约束保证数据一致性

1. 外键约束在SQLite中，可以通过使用外键（Foreign Key）约束和CASCADE选项来实现通过外键删除相关信息。 CASCADE选项是指在主键表中删除记录时，相应的外键表中的相关记录也将被自动删除。 -- 创建主键表 CREATE TABLE Persons…...

编程日记 2023/11/27 20:39:41

Vue轻松入门，附带学习笔记和相关案例

目录案例一Vue基础什么是Vue？ 补充：mvvm框架 mvvm的组成详解 Vue的使用方法 1.直接下载并引入 2.通过 CDN 使用 Vue 3.通过npm安装 4.使用Vue CLI创建项目二插值表达式什么是插值表达式？ 插值表达式的缺点解决方法 …...

编程日记 2023/11/27 20:38:40

【青蛙跳台阶问题 —— (三种算法）】

青蛙跳台阶问题 —— (三种算法） 一.题目介绍1.1.题目1.2.图示二.解题思路三.题解及其相关算法3.1.递归分治法3.2.动态规划算法（Dynamic Programming）3.3.斐波那契数列法四.注意细节一.题目介绍 1.1.题目一只青蛙一次可以跳上1级台阶&am…...

编程日记 2023/11/27 20:37:39

联想yoga AMD处理器转接头无法电量外接显示器

第一次买AMD的处理器，当时就是为了yogaAMD这款的接口要比英特尔的接口多，没想到AMD处理器真的问题多。经常蓝屏不说，偶尔还点不亮外接显示器。遇到这种问题，不是什么驱动问题，可能你按照网上各种方法打开设备管理器→显…...

编程日记 2023/11/27 20:36:38

OSG粒子系统与阴影 - 阴影shadow（7）

OSG阴影在虚拟现实仿真中，为了真实地模拟自然效果，阴影效果是不可缺少的，它对一个场景的真实性是非常重要的。在游戏或仿真中，一个高效的阴影往往能够提供非常强悍的视觉真实感。 osgShadow库在OSG中专门定义了一个名字空间osg…...

编程日记 2023/11/27 20:34:37

vue3项目中使用富文本编辑器

前言适配 Vue3 的富文本插件不多，我看了很多插件官网，也有很多写的非常棒的，有UI非常优雅让人耳目一新的，也有功能非常全面的。如： Quill，简单易用，功能全面。editorjs，UI极其优…...

编程日记 2023/11/27 20:33:35

Java EE 进程线程

JavaEE 进程&线程文章目录 JavaEE 进程&线程1. 进程1.1 概念1.2 进程管理1.3 PCB (Process Control Block) 2. 线程2.1 概念2.1 线程与进程的区别2.3 创建线程 1. 进程 1.1 概念什么是进程？ 进程是操作系统对一个正在执行的程序的一种抽象我们可以打开…...

编程日记 2023/11/27 20:32:34

GPT写SQL的模版

表：profit_loss_sum_m_snapshot 计算字段：成本cost_whole求和，收入income_whole求和，收入求和-成本求和，成本目标cost_target求和，收入求和-成本目标求和条件：日期statis_date在2023-11-01&…...

编程日记 2023/11/27 20:31:34

蓝桥杯官网练习题（平均）

问题描述有一个长度为 n 的数组（ n 是 10 的倍数），每个数 ai 都是区间 [0,9] 中的整数。小明发现数组里每种数出现的次数不太平均，而更改第 i 个数的代价为 bi，他想更改若干个数的值使得这 10 种数出现的次数相等…...

编程日记 2023/11/27 20:30:32

【无标题】动手学深度学习_现代神经网络_未完

这里写目录标题深度学习之前的网络 AlexNetAlexNet得到了竞赛冠军AlexNet架构Alex net更多细节数据增强 VGGNiN知识补充flop暂退法 drop_out 深度学习之前的网络 1、核方法机器学习 SVM现在还是很广泛的使用，因为对调参的需求不那么大，对调参不太敏感…...

编程日记 2023/11/27 20:29:30

Java王者荣耀

GameFrame 图片 package 王者荣耀;import java.awt.*; import java.awt.event.ActionEvent; import java.awt.event.ActionListener; import java.awt.event.KeyAdapter; import java.awt.event.KeyEvent; import java.io.File; import java.util.ArrayList;import javax.soun…...

编程日记 2023/11/27 20:28:29

【理解ARM架构】操作寄存器实现UART | 段的概念 | IDE背后的命令

🐱作者：一只大喵咪1201 🐱专栏：《理解ARM架构》 🔥格言：你只管努力，剩下的交给时间！ 目录 🍠操作寄存器实现UART🍟UART原理🍟编程 🍠…...

编程日记 2023/11/27 20:26:25

python 左值查找右值查找

左值查找在一组数据中查找出数字x 在这组数据中第一次出现的索引并输出，没有找到则输出-1查找方式：二分查找数据前提：一组数据要有序一组数据： arr [2, 3, 3, 3, 5, 7, 9, 11, 13, 15, 17]测试： 示例1&#xff…...

编程日记 2023/11/27 20:25:24

机器学习之自监督学习（四）MoCo系列翻译与总结（二）

MoCo中相关工作的对比分析去噪自动编码器（Denoising Autoencoder）是一种用于学习数据表示的神经网络模型。它的主要目标是通过去除输入数据中的噪声，学习到输入数据的有用表示，从而提高模型对干净数据的鲁棒性。下面是对去噪自动…...

编程日记 2023/11/27 20:24:21

元宇宙企业3d数字展厅轻松低本搭建更全面、多元、趣味化的展览

对所有企业来说，拥有一个3D线上展厅是互联网营销必不可少的部分，但是3D线上展厅定制周期长费用高，让很多企业公司望而却步，web3d开发公司制作的3D线上企业展厅制作平台备导览地图、语音解说、交互热点、全景漫游、自主行走、链接跳…...

编程日记 2023/11/27 20:23:19

华为OD机试真题-开源项目热榜-2023年OD统一考试（C卷）

题目描述：某个开源社区希望将最近热度比较高的开源项目出一个榜单，推荐给社区里面的开发者。对于每个开源项目，开发者可以进行关注(watch)、收藏(star)、fork、提issue、提交合并请求(MR)等。数据库里面统计了每个开源项目关注、收藏、fork、issue、MR的数量，开源项目的热…...

编程日记 2023/11/27 20:22:18

深入探索Maven：优雅构建Java项目的新方式（一）

Maven高级 1，分模块开发1.1 分模块开发设计1.2 分模块开发实现 2，依赖管理2.1 依赖传递与冲突问题2.2 可选依赖和排除依赖方案一:可选依赖方案二:排除依赖 3，聚合和继承3.1 聚合步骤1:创建一个空的maven项目步骤2:将项目的打包方式改为pom步骤…...

编程日记 2023/11/27 20:21:17

Shopee如何入驻？如何防封？

Shopee作为东南亚领航电商平台，面向东南亚蓝海市场，近年来随着东南亚市场蒸蒸日上，虾皮也吸引了大批量的跨境商家入驻。那么接下来就给想要入驻的虾皮小白一个详细的安全入驻教程。一、商家如何入驻虾皮与LAZADA最大的区别就是商家即卖家&…...

编程日记 2023/11/27 20:20:16

UE5 学习系列（二）用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇，在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下： 【Note】：如果你已经完成安装等操作，可以只执行第一篇博客中 2. 新建一个空白游戏项目章节操作，重…...

编程新知 2026/2/8 4:37:41

内存分配函数malloc kmalloc vmalloc

内存分配函数malloc kmalloc vmalloc malloc实现步骤： 1）请求大小调整：首先，malloc 需要调整用户请求的大小，以适应内部数据结构（例如，可能需要存储额外的元数据）。通常，这包括对齐调整，确保分配的内存地址满足特定硬件要求（如对齐到8字节或16字节边界）。 2）空闲…...

编程新知 2025/11/1 5:21:39

日语学习-日语知识点小记-构建基础-JLPT-N4阶段（33）：にする

日语学习-日语知识点小记-构建基础-JLPT-N4阶段（33）：にする 1、前言（1）情况说明（2）工程师的信仰2、知识点（1）　にする1，接续：名词＋にする2，接续：疑问词＋にする3，（A）は（B）にする。（2）復習：（1）复习句子（2）ために　＆　ように（３）そう（４）にする3、…...

编程新知 2025/11/20 7:52:01

Cesium1.95中高性能加载1500个点

一、基本方式： 图标使用.png比.svg性能要好 <template><div id"cesiumContainer"></div><div class"toolbar"><button id"resetButton">重新生成点</button><span id"countDisplay&qu…...

编程新知 2025/12/17 2:10:10

深入浅出：JavaScript 中的 `window.crypto.getRandomValues()` 方法

深入浅出：JavaScript 中的 window.crypto.getRandomValues() 方法在现代 Web 开发中，随机数的生成看似简单，却隐藏着许多玄机。无论是生成密码、加密密钥，还是创建安全令牌，随机数的质量直接关系到系统的安全性。Jav…...

编程新知 2025/10/8 4:56:09

vscode（仍待补充）

写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用侧边栏 vscode还能连接ssh？ debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

编程新知 2026/1/24 13:04:10

大语言模型如何处理长文本？常用文本分割技术详解

为什么需要文本分割？引言：为什么需要文本分割？一、基础文本分割方法1. 按段落分割（Paragraph Splitting）2. 按句子分割（Sentence Splitting）二、高级文本分割策略3. 重叠分割（Sliding Window）4. 递归分割（Recursive Splitting）三、生产级工具推荐5. 使用LangChain的…...

编程新知 2025/11/18 0:32:13

深入解析C++中的extern关键字：跨文件共享变量与函数的终极指南

🚀 C extern 关键字深度解析：跨文件编程的终极指南 📅 更新时间：2025年6月5日 🏷️ 标签：C | extern关键字 | 多文件编程 | 链接与声明 | 现代C 文章目录前言🔥一、extern 是什么？&…...

编程新知 2026/2/1 6:50:07

Mac下Android Studio扫描根目录卡死问题记录

环境信息操作系统: macOS 15.5 (Apple M2芯片)Android Studio版本: Meerkat Feature Drop | 2024.3.2 Patch 1 (Build #AI-243.26053.27.2432.13536105, 2025年5月22日构建) 问题现象在项目开发过程中，提示一个依赖外部头文件的cpp源文件需要同步，点…...

编程新知 2026/2/6 1:00:00

零基础在实践中学习网络安全-皮卡丘靶场（第九期-Unsafe Fileupload模块）（yakit方式）

本期内容并不是很难，相信大家会学的很愉快，当然对于有后端基础的朋友来说，本期内容更加容易了解，当然没有基础的也别担心，本期内容会详细解释有关内容本期用到的软件：yakit（因为经过之前好多期…...

编程新知 2026/1/21 12:29:04

论文笔记--Toolformer: Language Models Can Teach Themselves to Use Tools

1. 文章简介

2. 文章概括

3 文章重点技术

3.1 Toolformer

3.2 APIs

4. 文章亮点

5. 原文传送门

相关文章：