AI基础知识(LLM、prompt、rag、embedding、rerank、mcp、agent、多模态)
AI基础知识(LLM、prompt、rag、embedding、rerank、mcp、agent、多模态)
1、LLM大语言模型
--基于深度学习技术,通过海量文本数据训练而成的超大规模人工智能模型,能够理解、生成和推理自然语言文本
--产品,国内为deepseek、阿里千问、豆包、KIMI等,国外为openAI、deepMind等
--参数,B=billion=十亿,LLM模拟了大脑的神经元,参数量越大代表大脑的基础能力越强大
--内嵌知识,通过数据训练形成的参数间的关系,本质是统计归纳,在遇到相同的问题时可以给出对应的答案,比如给出100万张猫的图片,告诉LLM这些是猫,它会自动总结归纳猫的特征,形成参数间的关系,以后再遇到猫的图片,它就能识别这是不是猫
--token,llm处理数据时的最小单位,通过token数量计费,分输入与输出,输出token为一个个输出,每一个输出token都要将之前所有的输出token作为输入
2、prompt提示词
--提示词非常重要,是用户输入给AI模型的指令或问题,用于引导AI生成符合预期的内容
--提示词编写通用结构
【角色】:你是什么身份?(专家/助手/特定角色)
【任务】:需要完成什么具体任务
【背景】:相关上下文或知识领域
【限制】:格式/风格/长度/关键点等
【输出】:展示期望的输出样本(可选)
【风格】:幽默类比(如"GPT像百科全书,Claude像班主任")
3、RAG外挂知识库
--LLM仅含有截止某日的公开信息训练后形成的知识,除此外的知识它是空缺的,需要通过RAG技术补充空缺知识,以保证能够回答非公开领域的知识
--RAG(Retrieval-Augmented Generation),通过检索器从外部知识库实时检索信息,再交由生成器LLM,融合检索结果生成答案
--知识库外挂涉及信息切片、信息向量化、关联信息搜索、关联度标识等
【如图】
3.1、Embedding向量生成算法
--用于将信息向量化,向量化后的数据描述的是信息与信息间的关系,这样在查询问题相关的信息时,通过向量化数据可以更容易的查找到对应的信息
--主流算法:bge、gte
3.2、Rerank信息关联权重排序算法
--基于问题去搜索相关信息时会搜索到大量信息,全部提交llm进行分析会浪费大量算力,为了减少算力消耗,对搜索到的信息进行关联度权重标识,然后只将关联度权责最高的信息提交llm进行分析
--主流算法:bge、gpt
4、MCP模型上下文协议
--MCP(Model Context Protocol,模型上下文协议),旨在为大型语言模型(LLM)提供统一的接口,安全连接外部数据源与工具,解决AI模型与数据系统间的“信息孤岛”问题
--当前LLM的数据来自于前置准备,这与实际的商业业务流程不一致,比如经营分析时,发现某个指标异常,那么LLM需要自动的去调取对应数据进行分析,以便查找问题原因,这时就可以通过MCP接口去调用数据库、或其它工具获取对应信息
--构成:MCP主机(Hosts)- MCP客户端(Clients)- MCP服务器(Servers)
5、Agent智能体
--Agent(人工智能代理) 是一种能够感知环境、自主决策并执行动作以实现特定目标的智能实体
--LLM是算法、是大脑、是CPU,负责处理信息,但是要完整的完成一件事,仅有大脑、CPU是不行的,需要有信息感知、行动能力等,才可以完整的完成一件事
--比如经营分析,需要通过MCP获取经营数据,然后提交LLM进行分析,再通过企业微信分别推送给各个部门的人员
6、算力
--LLM需要消耗大量算力,主要为GPU算力,当前本地化部署通用大模型成本极高,百万人民币起步
--可通过第三方的LLM API实现算力调用,如deepseek官方api、阿里百炼的各种LLM API等,不仅方便,而且成本可控
7、多模态
--每一种信息都是一个模态:文字、表格、图片、图表、视频、语音、CAD图、ER图等
--当前的LLM仅对文字一种模态有非常强大的支持能力,对其它模态的支持能力有限
--现实世界中的信息往往是多模态并存的,比如一份报告里面包含文字、图片、图表、表格等,所以在信息的理解方面会存在缺陷,需要等待其它模态的大模型成长
相关文章:

AI基础知识(LLM、prompt、rag、embedding、rerank、mcp、agent、多模态)
AI基础知识(LLM、prompt、rag、embedding、rerank、mcp、agent、多模态) 1、LLM大语言模型 --基于深度学习技术,通过海量文本数据训练而成的超大规模人工智能模型,能够理解、生成和推理自然语言文本 --产品&…...

[蓝桥杯]高僧斗法
高僧斗法 题目描述 古时丧葬活动中经常请高僧做法事。仪式结束后,有时会有"高僧斗法"的趣味节目,以舒缓压抑的气氛。 节目大略步骤为:先用粮食(一般是稻米)在地上"画"出若干级台阶(…...

pycharm F2 修改文件名 修改快捷键
菜单:File-> Setting, Keymap中搜索 Rename, 其中,有 Refactor-> Rename,右键添加快捷键,F2,删除原有快捷键就可以了。...

Python Flask中启用AWS Secrets Manager+AWS Parameter Store配置中心
问题 最近需要改造一个Python的Flask项目。需要在这个项目中添加AWS Secrets Manager作为配置中心,主要是数据库相关配置。 前提 得预先在Amazon RDS里面新建好数据库用户和数据库,以AWS Aurora为例子,建库和建用户语句类似如下࿱…...

机器学习与深度学习10-支持向量机02
目录 前文回顾6.如何构建SVM7.SVM与多分类问题8.SVM与逻辑回归9.SVM的可扩展性10.SVM的适用性和局限性 前文回顾 上一篇文章链接:地址 6.如何构建SVM 选择合适的核函数和超参数来构建支持向量机(SVM)模型通常需要一定的经验和实验。以下是…...
《深入解析UART协议及其硬件实现》-- 第二篇:UART硬件架构设计与FPGA实现
第二篇:UART硬件架构设计与FPGA实现 1. 模块化架构设计 1.1 系统级框图与时钟域划分 核心模块划分 : 发送模块(TX) :负责数据帧组装与串行输出。 接收模块(RX) :负责串行数据采样与…...
java swing 晃动鼠标改变背景颜色
import java.awt.Color; import java.awt.Component; import java.awt.event.MouseEvent; import java.awt.event.MouseMotionListener;import javax.swing.*; public class testA extends JFrame {testA(){super("晃动鼠标改变背景颜色");setBounds(600, 200, 600, …...

HikariCP 可观测性最佳实践
HikariCP 介绍 HikariCP 是一个高性能、轻量级的 JDBC 连接池,由 Brett Wooldridge 开发。它以“光”命名,象征快速高效。它支持多种数据库,配置简单,通过字节码优化和智能管理,实现低延迟和高并发处理。它还具备自动…...

简简单单探讨下starter
前言 今天其实首先想跟大家探讨下:微服务架构,分业务线了,接入第三方服务、包啥的是否自己定义一个stater更好? 一、starter是什么? 在 Spring Boot 中,Starter 是一种特殊的依赖模块,用于快速…...

PyTest框架学习
0. 优先查看学习教程 超棒的学习教程 1. yield 语句 yield ptc_udp_clientyield:在 Pytest fixture 中,yield 用于分隔设置和清理代码。yield 之前的代码在测试用例执行前运行,yield 之后的代码在测试用例执行后运行。ptc_udp_client&…...

SIP、SAP、SDP、mDNS、SSH、PTP
🌈 一、SIP 会话初始协议 会话初始协议 SIP 是一个在 IP 网络上进行多媒体通信的应用层控制协议,它被用来创建、修改和终结 1 / n 个参加者参加的会话进程。SIP 不能单独完成呼叫功能,需要和 RTP、SDP 和 DNS 配合来完成。 1. SIP 协议的功…...

【AI学习笔记】Coze工作流写入飞书多维表格(即:多维表格飞书官方插件使用教程)
背景前摇: 今天遇到一个需求,需要把Coze平台大模型和用户的对话记录保存进飞书表格,这个思路其实不难,因为官方提供了写入飞书表格和多维表格的插件,但是因为平台教程和案例的资料匮乏,依据现有的官方文档…...
System.Threading.Timer 和 System.Timers.Timer
在 .NET 中,System.Threading.Timer 和 System.Timers.Timer 都是用于定时任务的类,但它们的实现方式、使用场景和特性有所不同。以下是它们的 核心区别 和 使用示例: 1. System.Threading.Timer 特点 轻量级,基于线程池…...

在 Windows 系统下配置 VSCode + CMake + Ninja 进行 C++ 或 Qt 开发
在 Windows 系统下配置 VSCode CMake Ninja 进行 C 或 Qt 开发,是一个轻量级但功能强大的开发环境。下面我将分步骤详细说明如何搭建这个开发环境,支持纯 C 和 Qt 项目。 🧰 所需工具安装 1. 安装 Visual Studio Code(VSCode&…...
`tokenizer.decode` 出现乱码或异常输出,怎么处理
tokenizer.decode 出现乱码或异常输出,怎么处理 在使用 Hugging Face Transformers 库进行大语言模型(LLM)开发时,tokenizer.decode 出现乱码或异常输出,通常和模型输出的 token 序列、分词器对齐逻辑、特殊 token 处理有关。以下从模型侧、分词器侧、后处理环节给出解决…...
几何绘图与三角函数计算应用
几何绘图与三角函数计算应用 设计思路 左侧为绘图控制面板,右侧为绘图区域支持绘制点、线、矩形、圆、多边形等基本几何图形实现三角函数计算器(正弦、余弦、正切等)包含角度/弧度切换和常用数学常数历史记录功能保存用户绘图 完整实现代码…...

leetcode 二叉搜索树中第k小的元素 java
中序遍历 定义一个栈,用于存取二叉树中的元素 Deque<TreeNode> stack new ArrayDeque<TreeNode>();进入while循环while(! stack.isEmpty()|| root ! null){}将root的左节点入栈,直到rootnull while(rootnull){stack.push(root);root ro…...

5.1 初探大数据流式处理
在本节中,我们深入探讨了大数据流式处理的基础知识和关键技术。首先,我们区分了批式处理和流式处理两种大数据处理方式,了解了它们各自的适用场景和特点。流式处理以其低延迟和高实时性适用于需要快速响应的场景,而批式处理则适用…...
基于 Android 和 JBox2D 的简单小游戏
以下是一个基于 Android 和 JBox2D 的简单小游戏开发示例,实现一个小球在屏幕上弹跳的效果: 1. 添加 JBox2D 依赖 在项目的 build.gradle 文件中添加 JBox2D 的依赖: dependencies {implementation org.jbox2d:jbox2d-library:2.3.1 } 2.…...

传输层协议 UDP 介绍 -- UDP 协议格式,UDP 的特点,UDP 的缓冲区
目录 1. 再识的端口号 1.1 端口号范围划分 1.2 知名端口号(Well-Know Port Number) 2. UDP 协议 2.1 UDP 协议格式 2.2 UDP 的特点 2.3 UDP 的缓冲区 2.4 一些基于 UDP 的应用层协议 传输层(Transport Layer)是计算机网络…...
Python try-except-else 语句详解
try-except-else 是 Python 中用于异常处理的重要结构,它允许你优雅地处理可能出现的错误,并在没有错误发生时执行特定代码。下面我将详细解释这个结构及其用法。 基本语法 try:# 可能引发异常的代码块 except [ExceptionType]:# 异常处理代码块 else:…...

ApacheSuperset CVE-2023-27524
前言:CVE-2023-27524 是一种远程代码执行漏洞,攻击者通过该漏洞可在受影响系统上执行任意代码,从而获得未授权访问权 CVE-2023-27524 GitHubhttps://github.com/horizon3ai/CVE-2023-27524 任务一 代理 | 拉取镜像 vi /etc/proxychains4.conf //最下面修…...
Windows Server部署Vue3+Spring Boot项目
在Windows Server 上部署Vue3 Spring Boot前后端分离项目的详细步骤如下: 一、环境准备 安装JDK 17 下载JDK MSI安装包(如Oracle JDK 或 OpenJDK) 双击安装,配置环境变量: JAVA_HOME:JDK安装路径…...
malloc 是如何分配内存的?——C 语言内存分配详解
文章目录 malloc是如何分配内存的?——C语言内存分配详解一、引言二、内存分配的基本概念1. 虚拟内存与物理内存2. 进程内存布局 三、malloc函数详解1. 函数原型与功能2. 关键特性 四、malloc的底层实现机制1. 内存分配器的角色2. 分配策略3. 内存碎片问题 五、glib…...
Opencl
**OpenCL(Open Computing Language)**是一种用于异构平台(包括CPU、GPU、FPGA、DSP等)上的并行计算框架和编程标准。它由Khronos Group制定,旨在提供一种跨平台、统一的编程接口,使开发者可以利用不同硬件设…...

如何在 HTML 中添加按钮
原文:如何在 HTML 中添加按钮 | w3cschool笔记 (请勿将文章标记为付费!!!!) 在网页开发中,按钮是用户界面中不可或缺的元素之一。无论是用于提交表单、触发动作还是导航࿰…...
【优秀三方库研读】quill 开源库中的命名空间为什么要用宏封装
将命名空间封装成宏的作用与优势 QUILL_BEGIN_NAMESPACE 和 QUILL_END_NAMESPACE 这种宏封装是 C++ 库开发中的常见技巧,主要解决以下问题并提供显著优势: 1. 解决核心问题:命名空间嵌套与版本控制 问题场景: 库需要支持多版本共存(如 quill::v1, quill::v2),但希望默认…...
AlphaFold3运行错误及解决方法(1)
1. chemical_component_sets.pickle 运行alphafold3遇到下面的问题: FileNotFoundError: [Errno 2] No such file or directory: /xxx/xxx/anaconda3/envs/alphafold3/lib/python3.11/site-packages/alphafold3/constants/converters/chemical_component_sets.pickle搜索你的系…...

Linux--进程的程序替换
问题导入: 前面我们知道了,fork之后,子进程会继承父进程的代码和“数据”(写实拷贝)。 那么如果我们需要子进程完全去完成一个自己的程序怎么办呢? 进程的程序替换来完成这个功能! 1.替换原理…...

调教 DeepSeek - 输出精致的 HTML MARKDOWN
【序言】 不知道是不是我闲的蛋疼,对百度AI 和 DeepSeek 的回答都不太满意。 DeepSeek 回答句子的引用链接,始终无法准确定位。有时链接只是一个域名,有时它给的链接是搜索串如: baidu.com/?q"搜索内容"。 百度AI 回答句子的引用…...