自动创作PPT 利用提示词和大模型自动创建ppt
背景
ppt创作可以分为3个步骤:1.大纲撰写;2.内容填充;3.ppt实现。我前几天用十分钟的时间做了一个ppt,主讲大模型测评。这里给大家分享一下我的创作过程。
关于步骤1和步骤2,最近发现一个非常好的提示词,能够帮助模型更好的思考,并给出逻辑完备的大纲和内容填充。关于步骤3,我发现了几个好用的网站,最后会议并分享给大家。
步骤1:大纲撰写
1.1 提示词
我使用kimi探索版完成相关任务。创作大纲,你可以使用以下的提示词帮助模型思考、反思、创作。
您是一个旨在提供详细的、逐步的回答的Al助手。您的输出应遵循以下结构:
1.以<thinking>部分开始。
2.在思考部分内:a.简要分析问题并概述您的方法。b.提出一个清晰的解决问题的步骤计划。c.如有必要,使用"思维链"推理过程,将您的思考过程分解为编号的步骤。
3.为每个想法包含一个<reflection>部分,其中您要:a.回顾您的推理。b.检查潜在的错误或疏忽。c.如有必要,确认或调整您的结论。
4.确保关闭所有反思部分。
5.以</thinking>结束思考部分。
6.在<output>部分提供您的最终答案。
在您的回答中始终使用这些标签。在您的解释中要彻底,展示您推理过程的每一步。努力使您的方法精确和合乎逻辑,不要犹豫将复杂问题分解为更简单的组成部分。您的语气应该是分析性的,稍微正式一些,重点是清晰地传达您的思维过程。
记住:<thinking>和<reflection>必须是标签,并且必须在结束时关闭。确保所有<标签>都在单独的行上,没有其他文本。不要在包含标签的行上包含其他文本。
请帮我解决这个问题:请撰写大纲,介绍大模型评估方面的知识。
1.2 模型输出思考过程
使用该提示词,模型会首先输出思考过程:
<thinking>
a. 分析问题并概述方法:
用户要求撰写一个大纲,介绍大模型评估方面的知识。为了满足这个需求,需要涵盖大模型评估的基本概念、评估方法、指标、工具以及当前的挑战和未来发展方向。b. 解决问题的步骤计划:
介绍大模型评估的背景和重要性。
详细描述大模型评估的主要维度和类别。
介绍常用的评估方法和指标。
讨论大模型评估的工具和平台。
分析当前大模型评估面临的挑战。
展望大模型评估的未来发展方向。c. 思维链推理过程:
背景和重要性:解释为什么大模型评估是必要的,以及它在AI发展中的角色。
评估维度和类别:列出并解释不同的评估维度,如知识和能力评测、对齐评测、安全评测等。
评估方法和指标:详细介绍各种评估方法和指标,如BLEU、ROUGE、F1分数等。
工具和平台:介绍一些常用的大模型评估工具和平台,如OpenCompass、FlagEval等。
当前挑战:讨论大模型评估中存在的问题,如数据标注困难、评估成本高等。
未来方向:展望大模型评估的潜在发展方向,如动态评测、智能体评测等。
<reflection>a. 回顾推理:
上述步骤涵盖了大模型评估的各个方面,从背景到具体方法,再到工具和未来展望,确保了内容的全面性和逻辑性。b. 检查潜在的错误或疏忽:
需要确保每个部分都有足够的详细信息,并且逻辑上前后连贯。同时,确保引用的内容准确无误。c. 确认或调整结论:
当前的步骤计划合理且全面,可以按照这个大纲进行详细撰写。</reflection>
</thinking>
1.3 模型生成大纲
然后,模型会生成以下的大纲:
<output>
大模型评估大纲
1. 背景和重要性
1.1 大模型的定义和发展
1.2 大模型评估的必要性
1.3 大模型评估在AI发展中的角色2. 评估维度和类别
2.1 知识和能力评测
2.1.1 问答能力评测
2.1.2 知识补全能力评测
2.1.3 推理能力评测
2.1.4 工具学习能力评测
2.2 对齐评测
2.2.1 道德和伦理评测
2.2.2 偏见性评测
2.2.3 毒性评测
2.2.4 诚实性评测
2.3 安全评测
2.3.1 鲁棒性评测
2.3.2 风险评测
2.4 行业大模型评测
2.4.1 生物 & 医疗
2.4.2 教育
2.4.3 法律
2.4.4 计算机
2.4.5 金融
2.5 综合评测组织
2.5.1 评测基准
2.5.2 评测平台和排行榜3. 评估方法和指标
3.1 直接评估指标
3.1.1 BLEU
3.1.2 ROUGE
3.1.3 F1分数
3.2 基于辅助模型的评估
3.2.1 QAEval
3.2.2 QuestEval
3.3 基于模型的评估
3.3.1 Perplexity
3.3.2 Generation-based methods4. 工具和平台
4.1 OpenCompass
4.1.1 概述和特点
4.1.2 安装和使用
4.1.3 评测结果可视化
4.2 FlagEval
4.2.1 概述和特点
4.2.2 使用方法
4.3 其他评估工具
4.3.1 Scikit-learn
4.3.2 TensorFlow 和 Keras
4.3.3 PyTorch
4.3.4 Hugging Face Transformers5. 当前挑战
5.1 数据标注困难
5.2 评估成本高
5.3 标准答案的多样性和复杂性
5.4 真实应用场景中的表现难以评估6. 未来发展方向
6.1 动态评测
6.2 智能体评测
6.3 风险评测
6.4 以优化大模型为目标的评测
</output>
可以看到,生成的大纲非常的全面,除了章节4.3之外,基本满足了我作为一个计算机专业人员的需求。
不是用相关提示词,大纲如下:
大纲:大模型评估知识
一、引言
背景介绍:大模型在人工智能领域的重要性及其广泛应用。
评估的必要性:确保模型的可靠性、安全性、公平性和实际应用效果。
二、评估动力与需求
技术创新推动:通过评估发现模型的优势和局限性,推动技术进步。
实际应用验证:验证模型在实际场景中的表现。
安全性与合规评估:确保模型在使用过程中不产生潜在危害。
用户体验提升:通过评估优化用户交互体验。
三、评估维度与框架
文本理解:文本分类、命名实体识别、信息抽取等。
文本生成:摘要生成、文本改写、作文生成等。
知识掌握:学科知识问答、常识推理等。
逻辑推理:逻辑推理、数学计算等。
多模态能力:视觉问答、视觉推理、图文一致性等。
智能性与鲁棒性:指令跟随能力、思维链能力、鲁棒性等。
四、评估方法
人工评估:通过人类专家对模型输出进行定性和定量评估。
自动评估:基于规则或模型的自动化评估方法。
Rule-based方法:基于预定义规则的评估。
Model-based方法:使用裁判员模型或对等评估的方法。
五、评估指标
基础评估指标:准确率、召回率、F1分数等。
高级评估指标:BLEU、ROUGE、METEOR等。
RAI指标:评估模型的责任性,包括公平性、安全性等。
应用场景评估指标:根据具体应用场景定制的评估指标。
六、评估工具与平台
Azure AI Studio:用于构建、评估和部署大模型的平台。
Prompt Flow:简化大模型应用开发的工具。
Weights & Biases:用于跟踪实验和评估模型性能的平台。
LangSmith:帮助跟踪和评估大模型应用的平台。
TruLens:用于神经网络评估和监控的工具。
Vertex AI Studio:评估生成式AI模型的平台。
Amazon Bedrock:支持大模型评估的Amazon平台。
七、评估挑战与未来展望
评估数据集构建:高质量评估数据集的构建及其挑战。
动态评估:持续更新测试样本和评估方法。
智能体评估:在模拟环境中评估大模型的自主性和风险。
以优化为目标的评估:不仅给出评分,还提供改进建议。
八、总结
全面性与公正性:未来评估体系的发展方向。
行业结合:针对不同领域的需求制定专门的评估标准。
持续改进:随着技术发展不断更新和完善评估体系
1.4 效果分析
以评估方法和指标为例,前者说得更详细,例如关于模型评估,前者详细的说出了方法名字“QAEval”,而后者只是一笔带过,这说明前者更加专业。前者更像大纲,后者写了很多具体内容,这些内容应该在步骤2实现,这说明提示词帮助模型更好的理清了我的需求。前者的章节5,也比后者的章节7更加提纲挈领。
步骤2:内容填充
在内容撰写的时候,你可以直接把大纲丢给模型,让模型生成相关内容。
你也可以参照步骤1中的方法,把1.1中的提示词和1.3中的大纲结合起来,重新提问(你可以每次让模型写一个小章节,也可以让模型一口气完成6个章节的思考和撰写,前者效果更好)。我让模型每次撰写一个章节,以章节2“评估维度和类别”为例(这里仍然使用kimi探索版):
2. 评估维度和类别
2.1 知识和能力评测
2.1.1 问答能力评测
问答能力评测主要评估大模型在回答问题时的准确性和流畅性。
常用的评测工具包括QAEval、QAFactEval和QuestEval,分别关注答案的质量、事实准确性和信息完整性。
评估指标包括精确度、召回率和F1分数等。复杂问答任务中,模型需要展示出色的多跳推理和低资源语言处理能力。2.1.2 知识补全能力评测
知识补全能力评测考察模型掌握大量事实性知识的能力。
常用的方法和基准包括LAMA(使用完形填空形式的知识探针评估语言模型中的关系知识)、Kola(针对世界知识的大规模中文评测基准)和WikiFact(基于维基百科构建的事实准确性评估方法)。
这些方法帮助评估模型在知识问答和知识补全任务中的表现。
步骤3:ppt实现
你可以使用以下几个软件来撰写ppt。你可以把步骤2中文字内容发给他们。个人使用了gamma。
islide、
Kimi、
gamma、
wps的AI生成、
MotionGO、
mindshow、
博思AI PPT、
腾讯文档、
canva:https://www.canva.com/design/
相关文章:

自动创作PPT 利用提示词和大模型自动创建ppt
背景 ppt创作可以分为3个步骤:1.大纲撰写;2.内容填充;3.ppt实现。我前几天用十分钟的时间做了一个ppt,主讲大模型测评。这里给大家分享一下我的创作过程。 关于步骤1和步骤2,最近发现一个非常好的提示词,…...

二分类评价指标AUROC和AUPR
文章目录 一、AUROC(Area Under the Receiver Operating Characteristic Curve)二、AUPR(Area Under the Precision-Recall Curve)三、区别3.1 案例3.2 如何选择? 在分类任务中, AUROC(受试者工…...

雅迪控股营收、净利润和毛利下滑:销量大幅减少,屡屡抽查不合格
《港湾商业观察》廖紫雯 日前,雅迪集团控股有限公司(以下简称:雅迪控股,01585.HK)发布业绩报告,披露2024年上半年营收净利双下滑等情况,在业绩承压的情况下,雅迪控股遭多家券商下调…...

【网络安全】记一次漏洞挖掘
Spring Cloud Data Flow 热点漏洞详细分析 环境搭建 2.10.0 - 2.11.2版本都可以,这里下的2.11.2 源码下载https://github.com/spring-cloud/spring-cloud-dataflow/tree/v2.11.2 在src/docker-compose里面是有docker文件的,使用docker即可 最近是爆出…...

Redis遇到Hash冲突怎么办?
这是小伙伴之前遇到的一个面试题,感觉也是一个经典八股,和大伙分享下。 一 什么是 Hash 冲突 Hash 冲突,也称为 Hash 碰撞,是指不同的关键字通过 Hash 函数计算得到了相同的 Hash 地址。 Hash 冲突在 Hash 表中是不可避免的&am…...

React综合指南(四)
61、描述React事件处理。 为了解决跨浏览器兼容性问题,React中的事件处理程序将传递SyntheticEvent实例,该实例是React跨浏览器本机事件的跨浏览器包装器。这些综合事件具有与您惯用的本机事件相同的界面,除了它们在所有浏览器中的工作方式相…...

Spring集成Redisson及存取几种基本类型数据
目录 一.什么是Redisson 二.为什么要使用Redisson 三.Spring集成Redisson 1.添加依赖 2.添加配置信息 3.添加redisson配置类 四.Redisson存取各种类型数据 1.字符串(String类型) 存储 获取 2.object对象类型 1.实体类信息 2.存储 3.获取 3.List集合类型 第一种…...

Maplibre-gl\Mapbox-gl改造支持对矢量瓦片加密
Maplibre-gl是Mapbox-gl剔除自带地图服务之后的一个分支,代码很相似。Maplibre-gl\Mapbox-gl使用的pbf格式的矢量瓦片,数据量小,渲染效果好。但也存在着信息泄露的风险。但如果想使用这个开发框架的前端渲染效果,还必须要使用这个格式。最近研究了一下如何对矢量瓦片进行加…...

【功能安全】技术安全概念TSC
目录 01 TSC定义 02 TSC注意事项 03 TSC案例 📖 推荐阅读 01 TSC定义 所处位置 TSC:Technical safety concept技术安全概念 TSR:Technical safety requirement技术安全需求 在系统开发阶段属于安全活动4-6 系统层产品开发示例 TSC目的...

Spark数据源的读取与写入、自定义函数
1. 数据源的读取与写入 1.1 数据读取 读文件 read.jsonread.csv csv文件由两个部分组成:头部数据(也就是字段数据)、行数据。 read.orc 读数据库 read.jdbc(jdbc连接地址,table‘表名’,properties{‘user’用户名,‘password’密码,‘driv…...

LeetCode 每日一题 2024/10/14-2024/10/20
记录了初步解题思路 以及本地实现代码;并不一定为最优 也希望大家能一起探讨 一起进步 目录 10/14 887. 鸡蛋掉落10/15 3200. 三角形的最大高度10/16 3194. 最小元素和最大元素的最小平均值10/17 3193. 统计逆序对的数目10/18 3191. 使二进制数组全部等于 1 的最少操…...

接口测试(六)jmeter——参数化(配置元件 --> 用户定义的变量)
一、jmeter——参数化(配置元件 --> 用户定义的变量) 注:示例仅供参考 1. 参数化格式:${变量名} 2. 配置元件:用户定义的变量 3. 添加【用户定义的变量】,【线程组】–>【添加】–>【配置元件】–…...

【学习笔记】网络流
背景 马上ICPC了,很惊奇的发现自己没整理网络流的板子。 最大流 dinic 这里选用的是二分图最大匹配的板子:飞行员配对方案问题 #include<bits/stdc.h> #define int long long using namespace std; const int N1e67,inf1e18; struct E {int to…...

【鸡翅Club】项目启动
一、项目背景 这是一个 C端的社区项目,有博客、交流,面试学习,练题等模块。 项目的背景主要是我们想要通过面试题的分类,难度,打标,来评估员工的技术能力。同时在我们公司招聘季的时候,极大的…...

python+大数据+基于热门视频的数据分析研究【内含源码+文档+部署教程】
博主介绍:✌全网粉丝10W,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业毕业设计项目实战6年之久,选择我们就是选择放心、选择安心毕业✌ 🍅由于篇幅限制,想要获取完整文章或者源码,或者代做&am…...

【电子电力】基于PMU相量测量单元的电力系统状态评估
摘要 相量测量单元(PMU)作为一种精确且快速的实时监控设备,在电力系统状态评估中发挥了重要作用。本文研究了在没有PMU和部署PMU情况下,电力系统的电压角度和电压幅值估计误差的差异。通过比较实验结果,发现PMU的应用…...

ubuntu修改默认开机模式(图形/终端)
将 Ubuntu 16 系统设置为开机进入终端模式: 打开终端。编辑 Grub 配置文件:sudo nano /etc/default/grub。找到 GRUB_CMDLINE_LINUX_DEFAULT 行,将其修改为 GRUB_CMDLINE_LINUX_DEFAULT"text"。保存并退出编辑器(Ctrl …...

LaMI-DETR:基于GPT丰富优化的开放词汇目标检测 | ECCV‘24
现有的方法通过利用视觉-语言模型(VLMs)(如CLIP)强大的开放词汇识别能力来增强开放词汇目标检测,然而出现了两个主要挑战:(1)概念表示不足,CLIP文本空间中的类别名称缺乏…...

AI大模型是否有助于攻克重大疾病?
AI大模型在攻克重大疾病方面展现出了巨大的潜力,特别是在疾病预测、药物研发、个性化医疗等领域有着广泛应用。具体来说,AI大模型能够帮助以下几方面: 1、疾病预测与诊断:AI大模型通过分析海量的医学数据,可以提高重大…...

【渗透测试】-红日靶场-获取web服务器权限
拓扑图: 前置环境配置: Win 7 默认密码:hongrisec201 内网ip:192.168.52.143 打开虚拟网络编辑器 添加网络->VMent1->仅主机模式->子网ip:192.168.145.0 添加网卡: 虚拟机->设置-> 添加->网络适配器 保存&a…...

python 深度学习 项目调试 图像分割 segment-anything
起因, 目的: 项目来源: https://github.com/facebookresearch/segment-anything项目目的: 图像分割。 提前图片中的某个目标。facebook 出品, 居然有 47.3k star! 思考一些问题 我可以用这个项目来做什么?给一个图片, 进行分割࿰…...

【GO实战课】第六讲:电子商务网站(6):支付和订单处理
1. 简介 本课程将探讨电子商务网站的支付和订单处理功能,以及使用GO语言实现。在本课程中,我们将介绍如何设计一个可扩展、可靠和高性能的支付和订单处理系统,并演示如何使用GO语言编写相关代码。 本课程的目标是帮助学生理解电子商务网站的支付和订单处理功能,并提供一个…...

专题十三_记忆化搜索_算法专题详细总结
目录 1. 斐波那契数(easy) 那么这里就画出它的决策树 : 解法一:递归暴搜 解法二:记忆化搜索 解法三:动态规划 1.暴力解法(暴搜) 2.对优化解法的优化:把已经计算过的…...

已发布金融国家标准目录(截止2024年3月)
已发布金融国家标准目录2024年3月序号标准编号标准名称...

【论文#快速算法】Fast Intermode Decision in H.264/AVC Video Coding
目录 摘要1.前言2.帧间模式决策概览2.1 H.264/AVC中的帧间模式决策2.2 发现和动机 3.同质性和平稳性的确定3.1 同质性区域的确定3.2 稳定性区域的决定3.3 整体算法 4.实验结果4.1 IPPP序列的测试4.2 IBBP序列测试 5.结论 《Fast Intermode Decision in H.264/AVC Video Coding》…...

Git核心概念图例与最常用内容操作(reset、diff、restore、stash、reflog、cherry-pick)
文章目录 简介前置概念.git目录objects目录refs目录HEAD文件 resetreflog 与 reset --hardrevert(撤销指定提交)stashdiff工作区与暂存区差异暂存区与HEAD差异工作区与HEAD差异其他比较 restore、checkout(代码撤回)merge、rebase、cherry-pick 简介 本文将介绍Git几个核心概念…...

【人工智能在医疗企业个人中的应用】
💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…...

IPv4头部和IPv6头部
IPv4和IPv6是互联网协议(IP)中的两个主要版本,它们在数据包头部(Header)结构上存在显著差异。以下是IPv4头部和IPv6头部的主要结构和区别: IPv4头部结构 IPv4(Internet Protocol Version 4&…...

从零开始手把手带你训练LLM保姆级教程,草履虫都能学会!零基础看完这篇就足够了~
导读 ChatGPT面世以来,各种大模型相继出现。那么大模型到底是如何训练的呢,在这篇文章中,我们将尽可能详细地梳理一个完整的 LLM 训练流程,包括模型预训练(Pretrain)、Tokenizer 训练、指令微调࿰…...

strcat函数追加字符串
char * strcat ( char * destination, const char * source ); dest:目标字符串,即要将源字符串追加到其末尾的字符串。src:源字符串,即要追加到目标字符串末尾的字符串 使用strcat函数给目标字符串追加字符时,首先要…...