AskIt: Unified Programming Interface for Programming with Large Language Models
本文是LLM系列文章,针对《AskIt: Unified Programming Interface for Programming with Large Language Models》的翻译。
AskIt:用于大型语言模型编程的统一编程接口
- 摘要
- 1 引言
- 2 动机例子
- 3 设计与实现
- 4 实验评估
- 5 相关工作
- 6 结论
摘要
在不断发展的软件开发环境中,大型语言模型(LLM)表现出一种被称为涌现能力的独特现象,在从文本摘要到代码生成的众多任务中表现出娴熟的能力。虽然这些能力为软件设计和制作开辟了新的途径,但它们的结合带来了巨大的挑战。开发人员努力解决在应用程序中直接嵌入LLM的决策,而不是将其用于代码生成。此外,考虑到从自然语言输出中提取数据的必要性,有效的提示设计成为一个关键问题。为了解决这些复杂问题,本文介绍了AskIt,这是一种专门为LLM设计的领域专用语言(DSL)。AskIt简化了LLM集成,提供了类型导向的输出控制、基于模板的函数定义和统一接口,从而减少了基于LLM的代码生成和应用程序集成之间的区别。此外,通过示例编程(PBE),AskIt在编程语言层面利用了少小样本学习的力量。我们的评估强调了AskIt的效力。在50个任务中,AskIt为给定的任务生成了简洁的提示,相对于基准,提示长度减少了16.14%。此外,通过实现从直接LLM应用程序使用到函数生成的过渡,AskIt实现了显著的加速,正如我们在GSM8K基准测试实验中观察到的那样。通过这些进步,AskIt简化了软件开发中LLM的集成,为利用紧急能力提供了一种更高效、更通用的方法。AskIt在TypeScript和Python中的实现可在https://github.com/katsumiok/ts-askit和https://github.com/katsumiok/pyaskit分别地找到。
1 引言
2 动机例子
3 设计与实现
4 实验评估
5 相关工作
6 结论
在本文中,我们介绍了一种领域专用语言(DSL),AskIt。AskIt提供了一个统一的接口,用于与各种任务的大型语言模型(LLM)进行交互。统一接口支持(1)LLM的类型引导输出控制,(2)基于模板的函数定义,(3)可编码任务的代码生成,以及(4)示例编程。我们为TypeScript和Python实现了AskIt,并用三个不同的实验对它们进行了评估。
相关文章:
AskIt: Unified Programming Interface for Programming with Large Language Models
本文是LLM系列文章,针对《AskIt: Unified Programming Interface for Programming with Large Language Models》的翻译。 AskIt:用于大型语言模型编程的统一编程接口 摘要1 引言2 动机例子3 设计与实现4 实验评估5 相关工作6 结论 摘要 在不断发展的软…...
【wireshark抓取数据包-PGSQL协议】
测试查看PGSQL协议的网络流量数据明细 1)捕获过滤的条件设置,tcp.port5432(数据库的端口) 2)上面是wireshark的主窗口,分三大主块:Packlist List(数据包列表)…...
【idea学习】
1.debug: 文章详解 2.导入SpringBoot项目 文章详情...
ZooKeeper数据模型/znode节点深入
1、Znode的数据模型 1.1 Znode是什么? Znode维护了一个stat结构,这个stat包含数据变化的版本号、访问控制列表变化、还有时间戳。版本号和时间戳一起,可让Zookeeper验证缓存和协调更新。每次znode的数据发生了变化,版本号就增加。…...
容器编排工具的比较:Kubernetes、Docker Swarm、Nomad
随着容器化技术的普及,容器编排工具成为了现代应用部署和管理的重要组成部分。容器编排工具能够自动化容器的部署、扩展和管理,从而提高应用的可靠性和可伸缩性。在众多的容器编排工具中,Kubernetes、Docker Swarm和Nomad是三个备受关注的主要…...
nginx--技术文档--架构体系--底层核心-原理
Nginx的架构体系可以概括为“一个核心、两个模型。” “一个核心”指Nginx的核心功能,即HTTP请求处理。Nginx作为一个高性能的Web服务器,其核心功能是处理HTTP请求,包括接收请求、解析请求、处理请求和返回响应等。 “两个模型”指Nginx的多…...
Java23种设计模式之【单例模式】
目录 一.单例模式的起源,和应用场景 1.单例模式的前世今生! 2.什么是单例模式? 2.1使用单例模式的注意事项 2.2如何理解单例模式? 2.3单例模式的优势以及不足! 2.4使用场景 二.实现 1.实现思路 1.1创建一个 S…...
SQLserver基础入门理论(超基础)二
♥️作者:小刘在C站 ♥️个人主页: 小刘主页 ♥️努力不一定有回报,但一定会有收获加油!一起努力,共赴美好人生! ♥️学习两年总结出的运维经验,以及思科模拟器全套网络实验教程。专栏…...
macbookpro怎么删除软件没有鼠标
macbookpro怎么删除软件没有鼠标,macbookpro触摸板可以替代鼠标进行操作。左右键功能与鼠标相同,可用于执行删除操作。此外,还可以利用键盘上的Delete键来删除选中的文件。 删除软件方法 方法1、打开应用程序,键盘按住control,加点…...
华为数通方向HCIP-DataCom H12-821题库(单选题:241-260)
第241题 LS Request报文不包括以下哪一字段? A、通告路由器(Advertising Router) B、链路状态 ID (Link Srate ID) C、数据库描述序列号(Database Dascription Sequence lumber) D、链路状态类型 Link state type) 答案:C 解析: LS Request 报文中包括以下字段…...
PHP8内置函数中的变量函数-PHP8知识详解
在php8中,与变量相关的内置函数比较多,本文说一些比较重要的、常见的内置函数。今日着重讲解了5个,分别是:检测变量是否为空的函数empty()、判断变量是否定义过的函数isset()、销毁指定的变量的函数unset()、获取变量的类型的函数…...
9月3日,每日信息差
第一、中国中铁与广州市城中村改造做地主体签署战略合作框架协议。根据协议,双方将积极响应广州市统筹做地推进高质量发展工作精神,充分发挥双方优势资源,共同加大在物业复建安置、基础设施建设、综合开发投资、城中村改造(微改造…...
2023年了,java后端还有未来吗?
前言 Java当下确实是比较的内卷,但关键在于个人,可以看看不同地方(这里主要举例北上广深一线城市)对于Java开发工程师这个职位的具体要求: 在以下北上广深这些一线大城市的面试招聘当中不难看出,凡是工资…...
使用cmake,将github上的某一个库进行集成到vs2022上
可以参考如下链接的内容: (还未完成,将在后序补充) 1.首先使用cmake,得到对应库的lib,include,bin文件夹 可以参考 https://www.youtube.com/watch?vu5-Df1YlxCI 2.现在我用cmake对这个第三方库进行编译,生成了三个文件夹:一个放的是lib文件(lib文件…...
第二张微服务的调用与注册
文章目录 工程导入利用RestTemplate调用服务需求创建RestTemplate的实例到Spring容器使用RestTemplate发送请求消费者和提供者 Eureka注册中心服务远程调用会出现的问题Eureka的结构和作用Eureka的配置过程搭建注册中心服务注册服务发现 Ribbon负载均衡负载均衡原理源码跟踪总结…...
iWatch框架设计
iWatch框架设计 一、项目框架结构设计 1、项目文件介绍 OverSeaProject:是IOS相关文件文件内容iWatchApp和iWatch Extension:是之前使用xcode14之前的xcode创建的360 app的Watch App,产生的文件结构,包含一个app和Extension的ta…...
【python】读取.dat格式文件
import binascii# 打开二进制文件以只读二进制模式 with open(EXCEL/文件.dat, rb) as file:binary_data file.read()print(binary_data)# 将二进制数据转换为十六进制字符串 hex_data binascii.hexlify(binary_data).decode(utf-8) # binary_data 现在包含了文件的二进制内容…...
机器学习课后习题 --- 朴素贝叶斯
(一)单选题 1.假设会开车的本科生比例是15%,会开车的研究生比例是23%。若在某大学研究生占学生比例是20%,则会开车的学生是研究生的概率是多少? A:80%B:16.6% C:23% D:15% 2.下列关于朴素贝叶斯的特点说法错误的是…...
【设备树笔记整理7】实践操作
1 使用设备树给DM9000网卡_触摸屏指定中断 1.1 修改方法 根据设备节点的compatible属性,在驱动程序中构造/注册 platform_driver,在 platform_driver 的 probe 函数中获得中断资源。 1.2 实验方法 以下是修改好的代码:第6课第1节_网卡_触摸…...
使用VisualStudio制作上位机(六)
文章目录 使用VisualStudio制作上位机(六)第五部分:应用程序打包第一步:勾选为Release模式第二步:生成解决方案第三步:将我们额外添加的文件放入到Release这个文件夹里 使用VisualStudio制作上位机…...
3步破解QQ音乐加密限制:qmcdump工具全场景应用指南
3步破解QQ音乐加密限制:qmcdump工具全场景应用指南 【免费下载链接】qmcdump 一个简单的QQ音乐解码(qmcflac/qmc0/qmc3 转 flac/mp3),仅为个人学习参考用。 项目地址: https://gitcode.com/gh_mirrors/qm/qmcdump 一、解密…...
如何评估Android测试自动化成熟度:从入门到精通的完整指南
如何评估Android测试自动化成熟度:从入门到精通的完整指南 【免费下载链接】testing-samples A collection of samples demonstrating different frameworks and techniques for automated testing 项目地址: https://gitcode.com/gh_mirrors/te/testing-samples …...
Obsidian-skills日志系统:如何记录和分析AI技能使用情况
Obsidian-skills日志系统:如何记录和分析AI技能使用情况 【免费下载链接】obsidian-skills Agent skills for Obsidian. Teach your agent to use Markdown, Bases, JSON Canvas, and use the CLI. 项目地址: https://gitcode.com/GitHub_Trending/ob/obsidian-sk…...
Phi-4-mini-reasoning应用场景:技术文档自动逻辑校验与漏洞推理辅助工具
Phi-4-mini-reasoning应用场景:技术文档自动逻辑校验与漏洞推理辅助工具 1. 模型概述 Phi-4-mini-reasoning是一款由微软开发的3.8B参数轻量级开源模型,专为数学推理、逻辑推导和多步解题等强逻辑任务设计。该模型以"小参数、强推理、长上下文、低…...
Unity3D RPG游戏开发:从零构建角色扮演游戏的核心系统
1. 环境准备与项目初始化 第一次打开Unity Hub时,新手常会被各种版本和选项搞得晕头转向。我建议直接安装最新的LTS版本(比如2022.3),这个版本就像游戏界的"稳定版安卓系统",既不会太老缺少功能,…...
011、性能建模与容量规划
性能建模与容量规划:从一次深夜告警说起 凌晨两点,手机突然狂震。线上核心服务的响应时间曲线像坐了火箭,从平时的50毫秒直冲3000毫秒。登录监控系统一看,CPU使用率早已突破90%红线,数据库连接池全满。这不是第一次了——每次大促前我们都在拍脑袋扩容,但似乎永远猜不准…...
蓝桥杯二分算法通关指南:模板+真题+避坑,O(logn)秒杀大数据题
蓝桥杯二分算法通关指南:模板真题避坑,O(logn)秒杀大数据题 文章目录蓝桥杯二分算法通关指南:模板真题避坑,O(logn)秒杀大数据题一、蓝桥杯二分核心题型(精简必背)1. 二分查找(基础必考…...
2026年花洒产品推荐:四款热门花洒横评,闭眼入不踩雷
其实选花洒不用盲目追大牌,核心看体验、看品质、看适配性。今天就带来四款热门花洒的深度横评,涵盖瑞尔特、飞利浦、小米米家、九牧四大主流品牌,每款都结合真实使用体验拆解,不罗列参数、不夸大宣传,让每天的沐浴都能…...
OpenClaw备份策略:千问3.5-9B实现增量备份与版本对比
OpenClaw备份策略:千问3.5-9B实现增量备份与版本对比 1. 为什么需要智能备份方案 上周我的移动硬盘突然罢工,导致三个月的项目文档全部丢失。这次惨痛经历让我意识到:传统备份方式存在两个致命缺陷。第一,手动备份依赖记忆&…...
力扣热门100题之最大子数组和
最优解法:Kadane 算法(一遍遍历)核心思想遍历数组时,维护当前最大和如果前面的和是负数,只会拖累当前数,直接抛弃前面否则,把当前数加进去全程记录最大值完整代码实现:class Solutio…...
