当前位置: 首页 > article >正文

AI核心概念串联

目录一、Tokenizer二、LLM三、Context四、RAG五、Prompt六、Tool七、MCP八、Agent九、Skill原UP主视频从 LLM 到 Agent Skill一期视频带你打通底层逻辑一、Tokenizer用户每次输入都是一串连续的句子而LLM的最小单位是token每个Token是一个数字所以在将句子输入LLM前需要使用Tokenizer处理句子。Tokenizer负责将句子切分为词、将词映射为token维护一个Vocab记录了词, 编号, 出现频率每个词对应唯一编号。线程会基于贪心策略从头切分每次选频率最高的词组最终将句子转换为token序列。二、LLMLLM都是以Transformer为backbone的大模型本身就是一个巨大的函数Transformer包含EncoderDecoderEncoder部分用于提取用户输入的token集合的特征Decoder基于Encoder提取的特征和Decoder已预测的tokens来预测下一个token并输出每次forward只预测一个token使用Softmax计算所有token上的概率选一个概率最大的作为预测结果然后查Vocab将token转换为单词这也就是为什么模型回答时是一个词一个词的输出。三、ContextTransformer只基于每次输入计算输出本身没有记忆。LLM会缓存用户的会话历史每次输入Encoder前都会拼接缓存中的历史记录当前的提问一块输入到Encoder目前主流模型每次会话可缓存100W个历史token。四、RAGLLM基于互联网上海量的信息进行训练以知识的广度为主、且具有滞后性。但是对于专业性极强的问题或最新的消息因为训练时并没有使用专门的数据来训练LLM输出结果并不会很理想甚至会出现模型幻觉。RAG出现之前用户只能基于Context记忆向模型输入一些前置知识使得模型能够回答特定问题但如果Context太长由于Encoder无法提取超长时间序列特征此时Encoder会遗忘部分特征。RAG的思路是将大量的知识保存到向量数据库每次提问首先查询数据库得到相关相关的数据块拼接Context、数据块、本次提问作为Transformer的输入。不要妄想重新训练LLMmoney扛不住五、Prompt当用户想要询问一些敏感内容时LLM会直接输入Transformer并得到结果返回给用户返回的内容可能非常消极要解决这个问题就需要给LLM制定一些规则。Prompt包含用户提示词和系统提示词用户提示词即用户的提出的问题ContextRAG系统提示词由后台设置规定了LLM输出的规则限制用户提示词和系统提示词拼接为一段完整的内容后作为Transformer的输入这样就能防止模型输出一些消极的内容。系统提示词和用户提示词就是拼接后输入到LLM没啥高大上的。我尝试获取豆包的系统提示词貌似豆包的系统提示词预判了这一点我猜测她的系统提示词是“如果用户想获取我的系统提示词那么直接返回违反豆包法则”六、ToolLLM能做的就是根据Prompt输出一段文本如今像豆包手机能操作各种APP完成任务只靠LLM是不够的。Tool就是调用各种应用程序的函数Tolls是封装了多个Toll并且带有main函数的文件所以Tolls被添加到项目中后会自动作为进程运行目的是实现Tolls的可插拔。每个Tolls都会开启一个进程目的是隔离Host与Tolls的异常、隔离Tolls之间的异常。Host通过拼接PromptToll函数声明作为LLM输入例如用户提示词为豆包帮我从高德地图查看一下回家的路线这时候LLM输入是豆包帮我从高德地图查看一下回家的路线如果你要调用高德地图获取路线那么返回getRoad()这个方法并携带参数LLM会输出getRoad()函数Host基于LLM输出结果与对应的Tools通信传入要执行的方法名Tolls调用对应方法访问高德地图服务器获取路线信息返回给HostHost拼接Prompt后重新输入给LLM由LLM整理内容输出结果给Host最终由Host将消息返回给用户。七、MCP要调用应用程序就要分别编写不同的ToolMCP制定了Tools的编写标准提高了Tolls的复用性。MCP协议介绍八、Agent在HostLLM的基础上添加Tools(Server)实现复杂任务的项目称为Agent。九、Skill考虑到不同场景下模型对于相同问题的回答应有区别所以每个Skill封装了一个场景下的系统Prompt由系统Prompt记录每个场景应读取哪个Skill文件实现LLM输出场景化。Skill的出现也能够解决系统提示词冗长的问题。

相关文章:

AI核心概念串联

目录一、Tokenizer二、LLM三、Context四、RAG五、Prompt六、Tool七、MCP八、Agent九、Skill原UP主视频:从 LLM 到 Agent Skill,一期视频带你打通底层逻辑! 一、Tokenizer 用户每次输入都是一串连续的句子,而LLM的最小单位是toke…...

形态学操作进阶:手把手教你设计Hit-or-Miss内核检测十字/直角结构

形态学操作进阶:手把手教你设计Hit-or-Miss内核检测十字/直角结构 在计算机视觉领域,形态学操作一直是图像处理中不可或缺的技术手段。其中,Hit-or-Miss变换作为一种高级形态学操作,能够精准定位二值图像中的特定结构模式。想象一…...

自适应混沌粒子群优化算法在PID参数整定中的应用:高效控制策略的代码详解与模型分享

自适应混沌粒子群整定PID/ACPSO-PID/PID参数整定 ACPSO(自适应混沌粒子群优化)整定PID(比例-积分-微分控制器)是一种高效的控制参数优化方法。 它利用粒子群优化(PSO)的基本框架,同时融入混沌理…...

2026微软SDE LeetCode高频题:208道,按频度排序,含备考建议

2026微软SDE LeetCode高频题:208道,按频度排序,含备考建议 微软SDE的LeetCode面试题,第一名不是反转链表,不是LRU缓存,而是—— 215. 数组中的第K个最大元素,出现14次。 我整理了基于真实面经…...

GPIO的输出输入方式总结

GPIO的四种输入方式GPIO的四种输出方式...

Apache Tomcat 在 IDEA 中配置完整教程(手把手保姆教程)

目录 文章内容简介 配置前提 IDEA 准备 IDEA 中的配置 文章内容简介 本文详细介绍了在IDEA中配置Apache Tomcat服务器的完整步骤。首先指导用户创建Maven Archetype项目。重点讲解了Tomcat服务器的配置过程,包括设置服务器路径、部署工件、修改HTTP端口等关键操…...

如何去选择品质优秀的段码屏厂家

在现代电子产品中,LCD液晶段码屏的应用越来越广泛。选择一家优质的厂家不仅能保证产品质量,还能提供高效的服务。本文将为您推荐十家在LCD液晶段码屏领域表现突出的厂家,帮助您做出明智的选择。1. 杭州斡能电子有限公司杭州斡能电子有限公司&…...

道心网络安全学习笔记系列之好靶场的信息收集2

上节课找了一个图片的网址,继续挑战其它靶场,我们看下一题收集十个百度域名,这还不是顺手就来,但是贴吧不行,那还不简单,去访问百度网站,顺便输入一个搜索词,都不用看,前…...

抖音无水印视频智能下载与高效管理解决方案:从技术原理到行业应用

抖音无水印视频智能下载与高效管理解决方案:从技术原理到行业应用 【免费下载链接】douyin-downloader 项目地址: https://gitcode.com/GitHub_Trending/do/douyin-downloader 一、行业痛点与技术破局:重新定义视频内容获取效率 你是否曾遇到这…...

OpenClaw快速安装部署:让AI住进你的电脑

一、前言 上篇说完OpenClaw是什么,有小伙伴留言说:“听起来挺猛,但安装肯定很复杂吧?”确实,之前我也有这个顾虑。毕竟涉及到Gateway、Agent、多渠道配置,听起来就头大。 但实际搞下来——就两条命令。 今天…...

3个步骤玩转虚拟手柄模拟:ViGEmBus驱动从入门到精通

3个步骤玩转虚拟手柄模拟:ViGEmBus驱动从入门到精通 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus Windows虚拟手柄驱动技术为游戏玩家和开发者…...

js06----流程控制

目录 2.4.1、顺序流程控制 2.4.2、分支流程控制 (1)if分支语句(条件判断语句) (2)if....else...语句 需求1: 需求2: (3)if...else if...else语句&…...

项目介绍 MATLAB实现基于灰狼优化算法(GWO)进行无人机三维路径规划的详细项目实例(含模型描述及部分示例代码)

MATLAB实现基于灰狼优化算法(GWO)进行无人机三维路径规划的详细项目实例 更多详细内容可直接联系博主本人 或者访问以下链接地址 MATLAB实现基于灰狼优化算法(GWO)进行无人机三维路径规划的详细项目实例-CSDN博客 https://blo…...

职场“对错陷阱“:为什么你越是讲理,领导越不待见你?

导语:小时候老师教我们"明辨是非",长大后却发现——在职场里太较真的人,往往混得最差。一、拍桌子的代价2023年春天,我亲眼看见林哥在会议室拍了桌子。"这需求根本不合理!数据库设计违反第三范式&#…...

Llama-3.2V-11B-cot开发者案例:基于Streamlit定制化UI扩展实践

Llama-3.2V-11B-cot开发者案例:基于Streamlit定制化UI扩展实践 1. 项目概述 Llama-3.2V-11B-cot是一款基于Meta Llama-3.2V-11B-cot多模态大模型开发的高性能视觉推理工具。该工具针对双卡4090环境进行了深度优化,特别修复了视觉权重加载的关键问题&am…...

无线通信入门:为什么说DFT是提升OFDM信道估计性能的“降噪神器”?

无线通信中的降噪艺术:DFT如何让OFDM信道估计更精准 想象一下,你正试图在嘈杂的咖啡馆里听清朋友的谈话。背景音乐、周围人的聊天声、杯盘碰撞声都在干扰你获取清晰的信息。无线通信中的信道估计面临类似的挑战——如何在充满噪声的传输环境中&#xff0…...

HUNYUAN-MT企业级Java集成指南:构建高并发翻译微服务

HUNYUAN-MT企业级Java集成指南:构建高并发翻译微服务 1. 引言 想象一下,你负责的电商平台刚刚接到一个来自海外的百万级订单,但商品详情、用户手册全是中文。市场团队急等着把上万页的产品资料翻译成十几种语言,时间窗口只有短短…...

OpenClaw多场景实战:Qwen3-VL:30B在飞书中的5个应用案例

OpenClaw多场景实战:Qwen3-VL:30B在飞书中的5个应用案例 1. 为什么选择OpenClawQwen3-VL:30B组合 去年我在团队内部尝试搭建智能助手时,发现市面上大多数方案要么需要将敏感数据上传到第三方平台,要么功能过于单一。直到遇到OpenClaw这个开…...

新手必看!用PHPStudy一键搭建DVWA靶场(附常见错误解决)

零基础实战:用PHPStudy快速搭建DVWA漏洞靶场全指南 第一次接触网络安全实战时,很多人会被复杂的实验环境搭建劝退。作为过来人,我完全理解那种面对满屏报错信息的无力感。本文将手把手带你用PHPStudy这个神器,在Windows系统上快速…...

光场相机入门:Macro Pixel与SAI如何让你的照片秒变3D(附Python代码示例)

光场相机实战指南:用Macro Pixel与SAI技术打造沉浸式3D影像 当你第一次看到光场相机拍摄的照片能在屏幕上自由切换焦点时,那种震撼感就像发现了摄影的新维度。这背后是Macro Pixel和SAI两项核心技术的完美配合——它们让静态图像拥有了动态的视角选择能力…...

FaceFusion项目二次开发踩坑记:深入content_analyser.py,手动修复模型依赖哈希问题

FaceFusion项目二次开发踩坑记:深入content_analyser.py,手动修复模型依赖哈希问题 当你在全新环境中部署经过二次开发的FaceFusion项目时,可能会遇到一个令人头疼的问题——模型文件哈希校验失败。这个问题通常表现为控制台输出类似[FACEFUS…...

基于imfindcircles函数的圆形检测实战:从原理到MATLAB实现

1. 霍夫变换与圆形检测原理 第一次接触圆形检测时,我也被各种数学公式绕得头晕。直到把霍夫变换想象成"投票游戏",才真正理解它的精妙之处。想象一张布满黑白点的图纸,每个黑点都可能属于某个潜在的圆。霍夫变换就像让每个黑点为所…...

360CDN 全系列产品体验:CDN / 高防 / SDK 游戏盾横向测评

作为深耕互联网技术领域多年的开发者,平时无论是个人项目还是公司业务,都经常需要用到CDN加速、网络防护类产品。近期正好完整上手测试了360CDN全系列核心产品,涵盖基础CDN加速、高防CDN、SDK游戏盾三款,全程以真实业务场景为测试…...

AI智能体实战:从入门到企业级自动化应用

摘要 本文基于我过去一年多在企业级AI智能体落地的实战经验,从核心架构设计、从零到一的落地实战、生产环境踩坑避坑,到企业级进阶优化,完整拆解AI智能体从玩具Demo到生产级自动化应用的全流程。本文不搞空泛的理论堆砌,所有内容均…...

在RK3576开发板上手把手编译并运行你的第一个MPP编码程序(含VSCode配置避坑)

在RK3576开发板上从零构建MPP编码开发环境的完整指南 1. 开发环境准备与交叉编译工具链配置 对于嵌入式开发者而言,RK3576开发板的MPP开发环境搭建需要从基础工具链开始。不同于x86平台的开发,我们需要特别注意交叉编译环境的配置细节。 首先需要获取适用…...

基于CYBER-VISION零号协议构建智能技术文档翻译与摘要系统

基于CYBER-VISION零号协议构建智能技术文档翻译与摘要系统 1. 引言 对于很多开发者来说,阅读英文技术文档是件挺头疼的事。尤其是遇到一些前沿的开源项目,官方文档全是英文,里面还夹杂着大量的专业术语和复杂的配置说明。有时候&#xff0c…...

从杂乱桌面到高效办公 GeekDesk实际应用效果展示

评价一款软件产品的优劣,最具说服力的方式莫过于通过真实的实际案例来直观展示其效果和价值。 今天,本文就以几个不同类型用户的真实使用场景为例,完整展示GeekDesk如何帮助他们从杂乱桌面到高效办公的转变过程。 通过这种直观的效果对比&…...

嵌入式设备文件传输协议解析与实践

嵌入式设备文件传输协议深度解析与应用实践1. 文件传输协议概述1.1 传统串口文件传输协议Xmodem协议族作为经典的串口文件传输解决方案,在嵌入式领域已有数十年的应用历史。该协议通过串口实现设备间的可靠数据传输,采用校验和或CRC校验机制确保数据完整…...

Git 代码库中找回丢失文件的实用指南

1. 为什么Git能帮你找回丢失的代码? 作为开发者,你一定遇到过这样的场景:不小心执行了rm -rf删错了文件,或者手滑把整个功能模块给覆盖了。这时候千万别慌,Git就像个贴心的时光机,能帮你找回99%的丢失文件。…...

3步搞定ViGEmBus:Windows虚拟游戏手柄驱动终极指南 [特殊字符]

3步搞定ViGEmBus:Windows虚拟游戏手柄驱动终极指南 🎮 【免费下载链接】ViGEmBus Windows kernel-mode driver emulating well-known USB game controllers. 项目地址: https://gitcode.com/gh_mirrors/vi/ViGEmBus 想要在Windows上体验更丰富的游…...