【实践案例】基于大语言模型的海龟汤游戏
文章目录
- 项目背景
- 提示词构建
- 海龟汤主持人
- 真相判断专家
- 具体实现流程
- 文心一言大语言模型“海龟汤”插件
- 参考
项目背景
“海龟汤”作为一种聚会类桌游,又称情境推理游戏,是一种猜测情境还原事件真相的智力游戏。其玩法是由出题者提出一个难以理解的事件(汤面),猜题者可以提出问题以缩小范围并还原完整事件(汤底),但是出题者仅能以“是”、“不是”或“不重要”作为回答。
在传统的交互环境中,需要选择一个人作为出题者查看汤底来回答问题,这不仅影响了出题者的游戏体验,也限制了单人游玩的可能。
通过大语言模型可以快速构建一个海龟汤游戏,利用大模型自然语言理解能力,可以使其作为 AI 出题者,帮助用户游玩“海龟汤”。
提示词构建
当前游戏的提示词主要分为俩个:
【1】 扮演一个推理解谜游戏“海龟汤”的主持人。
【2】 真相判断专家,判断用户回答的结果是否正确
海龟汤主持人
# Role: 海龟汤主持人你正在扮演一个推理解谜游戏“海龟汤”的主持人。## 游戏规则
海龟汤是一个基于问答的推理解谜游戏,题目分为汤面和汤底两个部分。
汤面是一个离奇的故事,汤底则是故事的真相。
用户需要根据“汤面”,通过不断提出问题,缩窄故事的可能性,逐渐猜出“汤底”。## 题目内容
### 汤面
{story}### 汤底(不可主动透露)
{truth}### 关键线索(不可主动透露)
{tips}## 任务:判断提问符合度
你的任务是判断用户的提问和<汤底>、中的内容是否符合。
- 如符合,则回答“是”;
- 如不符合,则回答“不是”;
- 如用户提问和故事相关性很低,则回答“无关”;
- 如果用户提问部分正确部分不正确,则回答“是又不是”。如果用户回答的内容涉及<关键线索>,则额外告诉用户“这个问题很关键”。## 注意事项
- 你不可以主动向用户透露真相(汤底)中的信息,只可以回答 是 / 不是 / 无关 / 是又不是 中的一种,不可以做出多余的解释。
- 如果用户直接询问结果或具体原因,你应该告诉用户“你需要自己进行猜测”。
- 你必须确保正确、充分、完整地理解了故事和真相(汤底)。用户的提问可以出现汤底以外的信息,但是你的回答必须和汤底的真相符合。
真相判断专家
# Role: 真相判断专家## 任务
请判断下述<真相>是否完整概括了<关键线索>中的所有条目。
输出是否完整的判断结果(Result)和对应的解释原因(Reason)。
注意仅通过给出的<关键线索>进行判断,不要参考其他隐藏信息。
<真相>的表达方式可以和<关键线索>不一样,只要含义正确即可。### Result
- 如果完整概括,则回答“猜测成功”。
- 如果没有完整概括,则回答“很接近了”。
- 如果用<真相>和<关键线索>相关度较低,则回答“猜得不对”。### Reason
你得出 Result 的原因,真相是否完整、不完整时缺少的关键线索等。## 输出格式
确保按如下 JSON 格式输出:
{"result": "很接近了,但还有一些细节没有推断出来。","reason": "判断原因"
}## 真相
{truth}## 关键线索
{key_clues}## 注意事项
- 如果用户直接询问结果或具体原因,你应该告诉用户“你需要自己进行猜测”。
- 请反复、仔细检查你的回复,避免回答错误给用户造成不好的体验。
具体实现流程
【1】准备海龟汤题库,需要支持动态的添加和修改
【2】构建一个海龟汤主持人大模型角色定位提示词,并从上面的题库中选择一个案例
【3】用户开始游戏,用户对话
【4】再构建一个真相判断专家角色,将用户回答的结果发送给这个会话,判断用户回答是否正确
【5】如果用户回答正确游戏通过,游戏结束,否则一直进行交互
文心一言大语言模型“海龟汤”插件
https://agents.baidu.com/docs/develop/plugin/ability-plugin/cases/turtleSoup/

参考
基于大语言模型的海龟汤游戏
https://github.com/amazingchow/turtle-soup-game-service
基于大语言模型的海龟汤在线游戏尝试
https://tanghenre.com/
相关文章:
【实践案例】基于大语言模型的海龟汤游戏
文章目录 项目背景提示词构建海龟汤主持人真相判断专家 具体实现流程文心一言大语言模型“海龟汤”插件参考 项目背景 “海龟汤”作为一种聚会类桌游,又称情境推理游戏,是一种猜测情境还原事件真相的智力游戏。其玩法是由出题者提出一个难以理解的事件&…...
NeetCode刷题第20天(2025.2.1)
文章目录 106 Best Time to Buy and Sell Stock with Cooldown 使用 Cooldown 买卖股票的最佳时间107 Coin Change II 换币 II108 Target Sum 目标总和109 Interleaving String 交错字符串110 Edit Distance 编辑距离111 Maximum Subarray 最大子数组112 Jump Game 跳跃游戏113…...
DeepSeek:人工智能领域的革新者与未来展望
在当今这个数据驱动的时代,人工智能(AI)正以前所未有的速度发展,而DeepSeek作为这一领域的先锋,正引领着AI技术的创新与突破。作为一家致力于推动人工智能技术创新与应用的前沿企业,DeepSeek不仅在多语言编…...
Spring Bean 容器
技术成长,是对场景设计细节不断的雕刻! 你觉得自己的技术什么时候得到了快速的提高,是CRUD写的多了以后吗?想都不要想,绝对不可能!CRUD写的再多也只是能满足你作为一个搬砖工具人,敲击少逻辑流…...
Flask代码审计实战
文章目录 Flask代码审计SQL注入命令/代码执行反序列化文件操作XXESSRFXSS其他 审计实战后记reference Flask代码审计 SQL注入 1、正确的使用直白一点就是:使用”逗号”,而不是”百分号” stmt "SELECT * FROM table WHERE id?" connectio…...
springboot启动配置文件-bootstrap.yml常用基本配置
在Spring Boot应用程序中,bootstrap.yml文件通常用于配置应用程序的启动阶段。在这个文件中,你可以配置一些在应用程序启动之前需要加载的属性,例如外部配置源、加密属性等。以下是一些常用的基本配置项: 1. 外部配置源 1.1 配置…...
2月3日星期一今日早报简报微语报早读
2月3日星期一,农历正月初六,早报#微语早读。 1、多个景区发布公告:售票数量已达上限,请游客合理安排行程; 2、2025春节档总票房破70亿,《哪吒之魔童闹海》破31亿; 3、美宣布对中国商品加征10…...
如何确认Linux嵌入式系统的触摸屏对应的是哪个设备文件(/dev/input/event1)?如何查看系统中所有的输入设备?输入设备的设备文件有什么特点?
Linux嵌入式系统的输入设备的设备文件有什么特点? 在 Linux 中,所有的输入设备(如键盘、鼠标、触摸屏等)都会被内核识别为 输入事件设备,并在 /dev/input/ 目录下创建相应的 设备文件,通常是: …...
FFmpeg:多媒体处理的瑞士军刀
FFmpeg:多媒体处理的瑞士军刀 前言 FFmpeg 是一个功能强大且跨平台的开源多媒体框架,广泛应用于音视频处理领域。 它由多个库和工具组成,能够处理各种音视频格式,涵盖编码、解码、转码、流处理等多种操作。 无论是专业视频编辑…...
电控三周速成计划参考
第1周:基础搭建与GPIO控制 学习目标:建立开发环境,掌握最基础的硬件控制能力 每日学习(2-3小时): 环境搭建(2天) 安装Keil MDK-ARM STM32CubeMX使用CubeMX创建第一个工程…...
Ubuntu修改配置文件--编辑操作
例如。 1.打开 /etc/samba/smb.conf 该配置文件: sudo vi /etc/samba/smb.conf 2.当你运行sudo vi /etc/samba/smb.conf命令后,你需要按i键进入插入模式(Insert Mode)。这时,在屏幕底部你应该能看到“-- INSERT --”…...
2021版小程序开发5——小程序项目开发实践(1)
2021版小程序开发5——小程序项目开发实践(1) 学习笔记 2025 使用uni-app开发一个电商项目; Hbuidler 首选uni-app官方推荐工具:https://www.dcloud.io/hbuilderx.htmlhttps://dev.dcloud.net.cn/pages/app/list 微信小程序 管理后台:htt…...
二分/双指针/单调栈队列专题
1.4924. 矩阵 - AcWing题库 一开始打表找规律以为是右上角向左下角递增,但当n很大的时候就不对了,因此我们得去观察 i * i 100000 * (i - j) j * j i * j 这个式子,我们关心的是这个式子的单调性因此我们可以分别将i和j看作常数来对式子进行求导,可以得到 f(i) 2 * i 10…...
XCCL、NCCL、HCCL通信库
XCCL提供的基本能力 XCCL提供的基本能力 不同的XCCL 针对不同的网络拓扑,实现的是不同的优化算法的(不同CCL库最大的区别就是这) 不同CCL库还会根据自己的硬件、系统,在底层上面对一些相对应的改动; 但是对上的API接口…...
【Deep Seek本地化部署】模型实测:规划求解python代码
目录 前言 一、实测 1、整数规划问题 2、非线性规划问题 二、代码正确性验证 1、整数规划问题代码验证 2、非线性规划问题代码验证 三、结果正确性验证 1、整数规划问题结果正确性验证 2、非线性规划问题正确性验证 四、整数规划问题示例 后记 前言 模型ÿ…...
MySQL锁类型(详解)
锁的分类图,如下: 锁操作类型划分 读锁 : 也称为共享锁 、英文用S表示。针对同一份数据,多个事务的读操作可以同时进行而不会互相影响,相互不阻塞的。 写锁 : 也称为排他锁 、英文用X表示。当前写操作没有完成前,它会…...
搜索插入位置(35)
35. 搜索插入位置 - 力扣(LeetCode) 相关算法:二分查找最左侧和最右侧target的index-CSDN博客 class Solution { public:int searchInsert(vector<int>& nums, int target) {int left 0;int right nums.size() - 1;int ans nu…...
八. Spring Boot2 整合连接 Redis(超详细剖析)
八. Spring Boot2 整合连接 Redis(超详细剖析) 文章目录 八. Spring Boot2 整合连接 Redis(超详细剖析)2. 注意事项和细节3. 最后: 在 springboot 中 , 整合 redis 可以通过 RedisTemplate 完成对 redis 的操作, 包括设置数据/获取数据 比如添加和读取数据 具体整…...
VDSuit-Full惯性动捕设备:高效率、高品质动画制作的利器
惯性动捕设备作为动画制作领域的新兴技术,与传统的关键帧动画制作相比,可以大大的缩短制作周期为创作者们提供极大便利。传统方式下,动画师需要逐帧调整角色动作,耗时费力。而惯性动捕设备能实时捕捉演员的动作,几乎瞬…...
【环境搭建】1.1源码下载与同步
目录 写在前面 一,系统要求 二,安装depot_tools 三,获取代码 四,代码同步 五,代码结构 写在前面 当前的开发背景是基于Google的开源Chromium,来开发Android设备的浏览器方案。 一,系统要…...
腾讯优图4B模型实测:轻量级多模态AI,图片描述、图表分析、目标检测,一个模型全解决
腾讯优图4B模型实测:轻量级多模态AI,图片描述、图表分析、目标检测,一个模型全解决 1. 开箱体验:4B参数的全能选手 当我第一次在CSDN星图镜像广场看到这个只有4B参数的腾讯优图多模态模型时,说实话是持怀疑态度的。毕…...
VSCode安装与Qwen3开发环境配置一站式解决方案
VSCode安装与Qwen3开发环境配置一站式解决方案 为智能字幕开发量身打造的高效开发环境配置指南 1. 开篇:为什么需要专门的环境配置? 你是不是也遇到过这样的情况:好不容易下载了代码,却发现各种依赖报错,环境配置折腾…...
OpenClaw模型微调:基于nanobot镜像的Qwen3-4B定制
OpenClaw模型微调:基于nanobot镜像的Qwen3-4B定制 1. 为什么需要定制化OpenClaw模型 去年夏天,当我第一次尝试用OpenClaw自动处理团队周报时,发现通用模型对"技术复盘"这类专业内容的处理总差那么点意思。它会机械地罗列Git提交记…...
WorkshopDL:跨平台Steam创意工坊下载器,突破平台限制获取海量模组资源
WorkshopDL:跨平台Steam创意工坊下载器,突破平台限制获取海量模组资源 【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 你是否曾在Epic Games或GOG平台购…...
纯本地运行!AgentCPM深度研报助手,手把手教你离线生成研究报告
纯本地运行!AgentCPM深度研报助手,手把手教你离线生成研究报告 1. 为什么选择本地研报生成工具? 在信息爆炸的时代,专业研究报告的撰写面临三大痛点: 时间压力:从零开始撰写一份深度报告平均需要40-60小…...
OpenClaw+GLM-4.7-Flash:个人财务管理自动化方案
OpenClawGLM-4.7-Flash:个人财务管理自动化方案 1. 为什么需要自动化财务管理? 作为一个长期被个人账务困扰的技术从业者,我每个月最头疼的就是整理各种消费记录。银行卡、支付宝、微信支付、信用卡账单分散在不同平台,手动统计…...
短效与动态代理IP区别,时效特性是关键
短效代理IP和动态代理IP最直观、最核心的区别,在于IP存活时长的时效特性,这也是两者适配不同场景的关键的原因。很多用户选型失误,本质是没有吃透两者的时效差异,导致所选代理无法匹配自身业务需求,出现IP失效快、资源…...
2021 年 12 月青少年软编等考 C 语言三级真题解析
目录 T1. 我家的门牌号 思路分析 T2. 子串计算 思路分析 T3. 吃糖果 思路分析 T4. 拨钟问题 思路分析 T5. 分形盒 思路分析 T1. 我家的门牌号 题目链接:SOJ D1124 我家住在一条短胡同里,这条胡同的门牌号从 1 1 1 开始顺序编号。 若所有的门牌号之和减去我家门牌号的两倍…...
Pikachu文件包含漏洞的花式玩法:从源码读取到蚁剑GetShell全记录
Pikachu文件包含漏洞的深度利用:从源码审计到权限维持实战 在网络安全领域,文件包含漏洞一直是渗透测试中的"黄金门票"。不同于简单的SQL注入或XSS攻击,文件包含漏洞往往能带来更直接的服务器控制权。本文将带你深入Pikachu靶场&am…...
Qwen3-1.7B效果实测:轻量级模型也能写出高质量文案和代码
Qwen3-1.7B效果实测:轻量级模型也能写出高质量文案和代码 1. 开篇:小身材,大能量 你可能听过很多关于大模型的讨论,动辄几百亿、上千亿参数,听起来很厉害,但部署起来也让人头疼——需要昂贵的显卡&#x…...
