当前位置: 首页 > article >正文

AI 术语通俗词典:RAG

RAG 是大语言模型、自然语言处理、知识问答、智能客服、企业知识库和 AI 应用开发中非常重要的一个术语全称是 Retrieval-Augmented Generation通常翻译为“检索增强生成”。它用来描述一种让大语言模型先从外部资料中检索相关内容再基于这些内容生成答案的方法。换句话说RAG 是在回答模型怎样在不完全依赖自身参数记忆的情况下利用外部知识回答问题。如果说普通大语言模型主要依靠训练阶段学到的参数知识来生成回答那么 RAG 更强调“先找资料再组织答案”。它把检索系统和生成模型结合起来让模型在回答问题前先从文档、数据库、网页、知识库或业务资料中取回相关片段再把这些片段放入上下文窗口作为生成答案的依据。因此RAG 常用于企业知识库问答、合同分析、论文问答、客服机器人、代码库问答、政策查询、医学资料检索、产品文档助手和私有数据问答中是理解大语言模型落地应用的重要基础概念。一、基本概念什么是 RAGRAG 是一种“检索 生成”的大语言模型应用方法。它的基本流程可以概括为用户问题 → 检索相关资料 → 放入上下文窗口 → 大语言模型生成答案图 1RAG 工作流程总览例如用户问这份合同中关于违约责任是怎么规定的如果直接让大语言模型回答它可能不知道这份合同的具体内容。RAG 的做法是先从合同文档中检索与“违约责任”相关的段落再把这些段落连同用户问题一起交给模型让模型基于检索到的内容回答。从通俗角度看RAG 像是给模型配了一个资料检索助手。模型不是凭空回答而是先翻资料再根据资料整理答案。RAG 中的三个关键词是• Retrieval检索找到与问题相关的资料• Augmented增强把检索内容作为额外上下文提供给模型• Generation生成由模型组织语言并回答问题因此RAG 不是一个单独的模型结构而是一种把外部知识和大语言模型结合起来的应用框架。二、为什么需要 RAGRAG 之所以重要是因为大语言模型虽然能力很强但仍然有明显边界。1、模型参数知识可能过时大语言模型的知识主要来自训练数据。如果某些信息在模型训练之后才出现模型参数中通常没有这些新信息。例如• 最新政策• 最新产品说明• 最新公司制度• 最新论文• 最新业务数据RAG 可以通过外部知识库实时检索把新资料提供给模型。2、模型不知道私有资料企业内部文档、合同、会议纪要、项目资料、客户记录通常不在模型训练数据中。如果不把这些资料提供给模型模型无法可靠回答相关问题。RAG 可以连接企业知识库让模型基于私有资料回答。3、减少凭空编造大语言模型可能在信息不足时生成看似合理但不真实的内容这通常称为幻觉。RAG 通过提供检索证据可以让模型更有依据地回答问题。从通俗角度看RAG 的价值不是让模型“更会猜”而是让模型“有资料可查”。4、突破上下文窗口限制外部知识库可能非常大不可能全部放进上下文窗口。RAG 的做法不是把整个知识库塞给模型而是根据问题只取回最相关的片段。这让模型可以在有限上下文窗口内使用大规模外部知识。三、RAG 的基本流程RAG 的基本流程通常包括五步准备知识库 → 切分文档 → 向量化与索引 → 检索相关片段 → 生成答案图 2RAG 的知识准备流程1、准备知识库知识库可以来自多种来源例如• PDF 文档• Word 文档• 网页内容• 产品手册• 合同文本• 论文资料• 数据库记录• 代码仓库说明这些资料需要先整理成可检索文本。从通俗角度看知识库就是 RAG 系统的“资料柜”。2、切分文档长文档通常不能直接作为一个整体检索和放入上下文。因此需要把文档切分成较小片段。例如完整文档 → 片段 1 → 片段 2 → 片段 3 → ...每个片段通常称为 chunk。chunk 的大小会影响检索效果。如果 chunk 太短可能缺少上下文。如果 chunk 太长可能包含太多无关内容。3、向量化与索引为了让系统能根据语义相似性检索内容通常会把每个文档片段转换成向量。这个过程称为 embedding。可以简单表示为其中• chunk 表示文档片段• v 表示该片段的向量表示然后这些向量会被存入向量索引或向量数据库中便于快速检索。4、检索相关片段当用户提出问题时系统也会把问题转换成向量其中• query 表示用户问题• q 表示问题向量然后系统计算问题向量与文档片段向量之间的相似度选出最相关的若干片段。常见相似度计算方式之一是余弦相似度其中• q 表示问题向量• v 表示文档片段向量• q · v 表示点积• ‖q‖ 和 ‖v‖ 表示向量长度cosine(q, v) 越大通常表示语义越相近。5、生成答案检索到相关片段后系统会把它们与用户问题一起组织成提示词交给大语言模型生成答案。可以概括为问题 相关片段 → 大语言模型 → 答案从通俗角度看检索负责“找材料”生成负责“组织表达”。四、RAG 与上下文窗口的关系RAG 与上下文窗口关系非常密切。上下文窗口是模型一次能够看到的最大 token 范围。外部知识库可能很大但模型不能一次读取全部内容。因此RAG 的核心做法是只把当前问题最相关的内容放进上下文窗口。可以简单表示为大知识库 → 检索筛选 → 少量相关片段 → 上下文窗口 → 生成答案从通俗角度看上下文窗口像模型当前的工作台RAG 像从资料柜中挑出最相关文件放到工作台上。这意味着• RAG 不是把整个知识库塞进模型• RAG 依赖检索质量• 放入窗口的片段要足够相关• 片段数量不能无限增加• 需要为模型输出预留 token 空间如果上下文窗口被无关片段占满模型可能反而更难回答。因此RAG 的关键不是“放得越多越好”而是“放得越准越好”。五、RAG 中的切分、Embedding 与向量检索RAG 的效果很大程度取决于文档切分和检索质量。1、文档切分文档切分的目标是把长文档拆成适合检索和放入上下文窗口的片段。常见切分方式包括• 按固定长度切分• 按段落切分• 按标题层级切分• 按语义结构切分• 按代码函数或类切分例如一份产品手册可以按章节和小节切分。一份代码文档可以按模块、函数或类切分。从通俗角度看切分不是随便剪开文本而是尽量让每个片段保持完整含义。2、Embedding 表示每个片段会被转换成向量表示。如果两个片段语义相近它们在向量空间中的距离通常更近。例如“违约责任条款”“合同解除后的赔偿责任”这两个片段虽然字面不同但语义可能相关向量检索有机会把它们关联起来。3、向量检索向量检索会根据用户问题找到语义相近的文档片段。例如用户问离职后还能使用公司资料吗系统可能检索到• 保密义务条款• 离职交接规定• 数据安全制度• 知识产权归属说明这说明向量检索不只是关键词匹配而是尝试根据语义相关性找资料。不过向量检索也不是万能的。如果问题表达模糊、文档切分不合理、Embedding 模型不适配领域检索结果可能不准确。六、RAG 的常见增强方式基础 RAG 流程比较简单但真实应用中通常需要增强检索和生成质量。1、关键词检索与向量检索结合向量检索擅长语义相似但有时会漏掉精确关键词。关键词检索擅长精确匹配但不理解深层语义。因此实际系统中常使用混合检索关键词检索 向量检索 → 合并候选片段例如查询合同条款编号、产品型号、函数名、法律条文时关键词检索非常重要。2、重排序初步检索可能返回很多候选片段。重排序会进一步判断哪些片段最适合作为回答依据。可以理解为• 粗检索先找一批可能相关的片段• 重排序再挑出最相关的片段从通俗角度看检索像“海选”重排序像“复筛”。3、查询改写用户问题有时比较口语化、模糊或缺少关键词。查询改写会把用户问题改写成更适合检索的形式。例如用户问题这个能退吗改写后产品退货条件、退款规则、售后政策这有助于检索系统找到更相关资料。4、引用来源为了提高可信度RAG 系统通常会在答案中附上来源片段、文档标题或页码。这可以让用户检查答案依据。从实践角度看RAG 最好不仅给答案还要给证据。七、RAG 与微调的区别RAG 经常和微调一起被比较。二者都可以让模型更适合特定任务但方式不同。图 3RAG 与微调的区别1、RAG把知识放在外部RAG 不一定改变模型参数。它通过检索外部资料把相关内容放入上下文窗口让模型基于这些内容回答。从通俗角度看RAG 是让模型“开卷考试”。它适合• 知识经常变化• 文档很多• 需要可追溯来源• 企业私有知识问答• 不希望频繁训练模型2、微调把能力写进参数微调会继续训练模型参数让模型更适合某类任务、语气、格式或领域表达。从通俗角度看微调是让模型“专项训练”。它适合• 固定输出格式• 特定任务风格• 专业表达习惯• 分类、抽取等稳定任务• 想让模型内化某种行为模式3、二者可以结合RAG 和微调不是互斥关系。很多系统会同时使用• 微调让模型更会按要求回答• RAG让模型回答时有最新资料依据从通俗角度看微调提升模型“答题方式”RAG 提供“答题资料”。如果问题是“模型不知道某份新文档内容”通常优先考虑 RAG。如果问题是“模型不会按固定格式输出”可以考虑微调或提示词工程。八、RAG 的优势、局限与使用注意事项1、RAG 的主要优势RAG 最大的优势是可以利用外部知识。它让模型不必只依赖训练时记住的知识而可以基于当前检索到的资料回答。其次RAG 适合知识更新。文档更新后只要更新索引或知识库模型就可以检索到新内容。再次RAG 便于溯源。答案可以附带来源片段让用户知道结论来自哪里。从通俗角度看RAG 的优势在于它让大语言模型从“闭卷回答”变成“带资料回答”。2、RAG 的主要局限RAG 也有局限。首先检索错了答案就容易错。如果相关片段没有被检索到模型可能无法正确回答。其次检索到了不等于模型一定用得好。如果上下文很长、片段冲突或信息组织混乱模型仍可能误解。再次RAG 对文档质量依赖很强。如果原始文档过时、错误、重复或结构混乱系统回答也会受到影响。此外RAG 不等于完全消除幻觉。它可以降低幻觉风险但不能保证模型永远忠实引用资料。3、使用 RAG 时需要注意的问题使用 RAG 时需要注意• 文档切分要尽量保持语义完整• 检索结果要与问题高度相关• chunk 过短会丢上下文过长会引入噪声• 关键词检索和向量检索可以结合使用• 重要场景应提供引用来源• 文档更新后要同步更新索引• 对冲突资料要提示不确定性• 不要把整个知识库直接塞进上下文窗口• 需要让模型明确“基于资料回答不要编造”从实践角度看RAG 的质量取决于整个链路而不仅仅取决于大语言模型本身。九、Python 示例下面给出一个极简 RAG 思路示例用来帮助理解它的基本流程。示例 1用关键词模拟简单检索# 文档列表企业内部规定等documents [ 公司规定员工离职后不得继续使用内部资料。, 产品支持 7 天无理由退货但定制商品除外。, 合同违约方应承担相应赔偿责任。, 报销申请应在费用发生后 30 天内提交。] # 用户查询问题query 离职后还能使用公司资料吗 # 提取查询中的关键词模拟实际会用分词/向量keywords [离职, 资料] results [] # 遍历文档计算关键词命中次数作为相关性分数for doc in documents: score sum(keyword in doc for keyword in keywords) # 每个关键词在文档中出现则1 if score 0: # 只保留有命中的文档 results.append((score, doc)) # 按分数降序排序分数高表示相关性高results sorted(results, reverseTrue) # 输出检索结果for score, doc in results: print(score, doc)这个例子只是演示用户问题 → 找相关文档片段真实 RAG 系统通常不会只靠简单关键词而会使用 embedding、向量数据库和重排序等方法。示例 2模拟把检索结果放入提示词# 用户查询query 离职后还能使用公司资料吗 # 检索到的相关文档实际可能来自搜索系统retrieved_docs [ 公司规定员工离职后不得继续使用内部资料。, 离职员工应完成资料交接并删除个人设备中的公司文件。] # 将多个文档拼接成上下文添加编号context \n.join( f资料 {i 1}{doc} for i, doc in enumerate(retrieved_docs)) # 构建提示词要求模型仅基于提供资料回答不足则说明无法判断prompt f请只根据下面资料回答问题。如果资料不足请说明无法判断。 {context} 问题{query} # 打印提示词实际会将此提示送入大模型print(prompt)这个例子展示了 RAG 中常见的提示词组织方式检索资料 用户问题 回答要求其中“只根据资料回答”可以降低模型凭空发挥的风险。示例 3模拟向量检索的流程下面示例只展示流程不实现真实 embedding 模型。# 真实系统中embed(text) 会调用 embedding 模型如 Sentence-BERT将文本转为向量def embed(text): # 这里只是占位函数用于说明流程实际应返回固定维度向量 return [0.1, 0.2, 0.3] # 计算两个向量的余弦相似度def cosine_similarity(a, b): dot sum(x * y for x, y in zip(a, b)) # 点积 norm_a sum(x * x for x in a) ** 0.5 # 向量a的模长 norm_b sum(y * y for y in b) ** 0.5 # 向量b的模长 return dot / (norm_a * norm_b) # 余弦值 # 文档片段库实际应分块存储chunks [ 员工离职后不得继续使用内部资料。, 产品支持 7 天无理由退货。, 合同违约方应承担赔偿责任。] # 用户查询query 离职后还能使用公司资料吗 # 将查询文本转为向量query_vec embed(query) # 计算每个文档片段与查询的相似度scored_chunks []for chunk in chunks: chunk_vec embed(chunk) # 文档片段向量 score cosine_similarity(query_vec, chunk_vec) # 相似度分数 scored_chunks.append((score, chunk)) # 按相似度降序排序取前2个最相关的片段top_chunks sorted(scored_chunks, reverseTrue)[:2] print(top_chunks)真实 RAG 系统中• embed(query) 会生成问题向量• embed(chunk) 会生成片段向量• 系统会从大量片段中快速找出相似度最高的内容• 通常还会加入重排序、过滤和引用来源示例 4在 token 预算内选择片段# 检索到的文本片段含 token 数和相关性分数retrieved_chunks [ {text: 片段 A违约责任条款……, tokens: 300, score: 0.91}, {text: 片段 B合同解除规定……, tokens: 500, score: 0.86}, {text: 片段 C无关背景资料……, tokens: 900, score: 0.40}, {text: 片段 D赔偿范围说明……, tokens: 350, score: 0.82},] # 上下文 token 预算限制总长度context_budget 900used 0selected [] # 按分数降序排序优先选择高分片段for chunk in sorted(retrieved_chunks, keylambda x: x[score], reverseTrue): # 如果加入当前片段不超过预算则选取 if used chunk[tokens] context_budget: selected.append(chunk) used chunk[tokens] print(选入上下文的片段)for chunk in selected: print(chunk[text]) print(已用 token, used)这个例子说明RAG 需要在有限上下文窗口中选择片段。并不是检索到的内容都要放进去而是优先放入相关性高、信息密度高的片段。 小结RAG 是“检索增强生成”的方法它让大语言模型先从外部知识库中检索相关资料再基于这些资料生成答案。它适合企业知识库问答、长文档分析、私有资料查询和需要可追溯来源的场景。对初学者而言可以把 RAG 理解为让模型从“闭卷答题”变成“先查资料再答题”。“点赞有美意赞赏是鼓励”

相关文章:

AI 术语通俗词典:RAG

RAG 是大语言模型、自然语言处理、知识问答、智能客服、企业知识库和 AI 应用开发中非常重要的一个术语,全称是 Retrieval-Augmented Generation,通常翻译为“检索增强生成”。它用来描述一种让大语言模型先从外部资料中检索相关内容,再基于这…...

ChatGPT生成图表总“丑”?3步精准调优Prompt+4类D3.js/Plotly适配模板,即刻提升专业度

更多请点击: https://intelliparadigm.com 第一章:ChatGPT数据可视化建议 在利用ChatGPT辅助数据分析与可视化时,关键在于将模型生成的结构化洞察高效映射到视觉表达层。ChatGPT本身不直接渲染图表,但可精准生成符合主流库&#…...

ICLR 2026小米AI 技术深度解读

注:小米最新的 AI 顶会成果实际入选了 ICLR 2026(国际学习表征会议),推测您提到的 ICML 为会议名称的混淆,本文将基于小米此次入选的核心研究成果,以及配套的 MiMo-V2.5 系列技术,按您要求的五大…...

【深度解析】从 Mythos 到 DeepSeek 降价:大模型工程化选型、成本控制与 API 实战

摘要 近期 AI 大模型市场持续加速迭代:Anthropic Mythos 进入部署测试信号增强,OpenAI、Gemini 系列持续升级,DeepSeek 则通过永久降价重塑开发成本结构。本文从工程视角解析模型发布信号、Agentic 系统成本模型,并给出 OpenAI 兼…...

Android 框架入门到实战:从系统架构到四大组件,面试官问的全在这了(附流程图)

Android 框架入门到实战:从系统架构到四大组件,面试官问的全在这了(附流程图) 目录 一、Android 系统架构 二、四大组件概览 三、Activity 详解 3.1 生命周期 3.2 四种启动模式 3.3 Activity 之间的数据传递 四、Service 详解 五、BroadcastReceiver 详解 六、ContentProv…...

OpenCV实战:用Python从零实现Canny边缘检测(含完整代码与调参技巧)

OpenCV实战:用Python从零实现Canny边缘检测(含完整代码与调参技巧)计算机视觉领域中,边缘检测是图像分析的基础步骤之一。1986年由John F. Canny提出的Canny边缘检测算法,至今仍是效果最佳的边缘检测方法之一。本文将带…...

从‘栅栏’看频谱:一个音频信号处理的例子,讲透FFT分辨率与泄漏的权衡

从‘栅栏’看频谱:一个音频信号处理的例子,讲透FFT分辨率与泄漏的权衡想象你正在调试一段钢琴录音,其中有两个非常接近的音符——比如C4(261.63Hz)和C#4(277.18Hz)。在频谱分析仪上,…...

破解‘特质波动率之谜’?用Python回测A股创业板数据,看看风险与收益到底啥关系

特质波动率与A股创业板收益关系的Python实证研究 现象背后的思考:为什么特质波动率会引发争议? 2006年Ang等人的研究像一颗投入金融学平静湖面的石子,激起了持续至今的涟漪。他们发现了一个与传统金融理论相悖的现象:高特质波动率…...

多重检验策略:提升NPLM信号无关搜索的鲁棒性与均匀性

1. 项目概述在粒子物理实验数据分析中,我们常常面临一个核心困境:我们不知道新物理信号会以何种形式出现。传统的“模型依赖”搜索,比如针对特定质量的希格斯玻色子或暗物质候选粒子,需要预先定义一个精确的理论模型。然而&#x…...

对称性自适应机器学习力场:高效精准计算碳纳米管声子谱

1. 项目概述:当机器学习“学会”了对称性在计算材料科学领域,我们常常面临一个经典的“精度-效率”困境。一方面,基于第一性原理的密度泛函理论(DFT)计算,能提供近乎量子力学精度的结果,是探索材…...

【AI问答/前端】前端瞒天过海局(三)

问三:还有一件事,就是浏览器按钮的前进后退,他真实还原了js改前端的过程,就好像真的有过访问纪录,这个是JS纪录下了自己的路由操作历史,改的浏览器地址栏?还是这个路由操作历史真的是写进了浏览…...

【AI问答/前端】现代前端的满天过海局(二)

现在JS能改浏览器的东西了?他不是被限在操作html里面了吗?笼子里面的狗不可能自己把门外的插销打开吧?好你这个“笼子里的狗和门外插销”的比喻简直绝了!这说明你对浏览器的安全沙箱机制(Sandbox)有着极其深刻且正确的防范意识。你的直觉没…...

Android 全栈体系 150 讲 - 49 深度完整版 Android 常用设计模式 + 架构模式 源码剖析、业务落地、面试精讲

...

基于静态动态障碍物DWA、DWA+RRT*、改进A*、RRT* 2D和3D的路径规划算法Matlab代码

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 &#x1f381…...

基于Simulink的四开关buck-boost变换器闭环仿真模型

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 &#x1f381…...

FPG平台:行业前景下的战略定位评估

FPG平台:行业前景下的战略定位评估金融服务行业的复杂性决定了平台需要在多个维度上同时具备较高的水准。FPG平台经过多年的发展,已经在合规、技术、服务、教育等方面形成了一套相互支撑的体系。本文从评测视角出发,对其综合实力进行多维度的…...

FPG平台:信息透明度建设的深度解析

FPG平台:信息透明度建设的深度解析金融服务行业的复杂性决定了平台需要在多个维度上同时具备较高的水准。FPG平台经过多年的发展,已经在合规、技术、服务、教育等方面形成了一套相互支撑的体系。本文从评测视角出发,对其综合实力进行多维度的…...

PostgreSQL COPY命令:高效数据导入的最佳实践

引言 在处理大量数据插入场景时,传统的INSERT语句往往会成为性能瓶颈。PostgreSQL提供了COPY命令,能够显著提升数据导入效率。本文将深入探讨COPY命令的工作原理、使用方法以及为什么它比普通INSERT更快。 什么是COPY命令? COPY是PostgreSQL提…...

阴阳师智能自动化脚本:5个步骤实现游戏任务全托管

阴阳师智能自动化脚本:5个步骤实现游戏任务全托管 【免费下载链接】OnmyojiAutoScript Onmyoji Auto Script | 阴阳师脚本 项目地址: https://gitcode.com/gh_mirrors/on/OnmyojiAutoScript 还在为阴阳师中重复的日常任务感到厌倦吗?每天花费数小…...

[SpringBoot 对象存储实战]:预签名 URL 直传 OSS 全流程设计与实现

🔥你好我是fengxin_rou这是我的个人主页fengxin_rou的主页 ❄️欢迎查看我的专栏我的专栏 《Java后端学习》、《JAVASE基础》、《JUC并发》、《redis》、《JVM虚拟机》、《MYSQL》、《黑马点评》、《rabbitmq》、《JavaWebAI的talis学习系统》、《苍穹外卖》 目录…...

【SpringBoot+Elasticsearch 内容搜索系统实战】:架构设计与全流程实现

🔥你好我是fengxin_rou这是我的个人主页fengxin_rou的主页 ❄️欢迎查看我的专栏我的专栏 《Java后端学习》、《JAVASE基础》、《JUC并发》、《redis》、《JVM虚拟机》、《MYSQL》、《黑马点评》、《rabbitmq》、《JavaWebAI的talis学习系统》、《苍穹外卖》 目录…...

SpringBoot+Vue汽车4S店销售管理系统源码+论文

代码可以查看文章末尾⬇️联系方式获取,记得注明来意哦~🌹 分享万套开题报告任务书答辩PPT模板 作者完整代码目录供你选择: 《SpringBoot网站项目》1800套 《SSM网站项目》1500套 《小程序项目》1600套 《APP项目》1500套 《Python网站项目》…...

2026免费在线去水印保姆级教程!不用下载,3秒去除,一看就会

你是不是也遇到过这种抓狂时刻?在抖音、小红书刷到一个超好看的视频,想保存下来自己收藏或做素材,结果下载下来发现角落顶着个大大的水印,画面瞬间就没了那股质感。更气的是,找了一堆号称“免费去水印”的软件&#xf…...

2026保姆级免费在线去水印教程:想保存无水印视频?用这些方法就够了

你是不是也遇到过这样的尴尬:刷到一个特别喜欢的视频想保存下来做素材,结果画面中间杵着大大的水印;或者朋友发来一张好图,角落的Logo怎么都去不掉?自己研究半天,又是下软件又是找教程,结果要么…...

LeetCode热题100-排序链表

给你链表的头结点 head ,请将其按 升序 排列并返回 排序后的链表 。示例 1:输入:head [4,2,1,3] 输出:[1,2,3,4]核心思路(3 步记住)1. 分:找中点 切分快慢指针:快指针走 2 步&…...

AI Agent的产品市场契合度验证:寻找高ROI场景的五个核心问题

AI Agent的产品市场契合度验证:寻找高ROI场景的五个核心问题 关键词:AI Agent、产品市场契合度PMF验证、ROI计算框架、Agent适配场景、高价值循环、量化验证、MVP构建 摘要:当AI Agent像“2024年的移动APP”一样成为科技圈新宠时,…...

紧急更新!OpenAI API v4.5对脑筋急转弯类输出新增隐式过滤机制——立即启用这7个绕过策略,保住你的创意产能

更多请点击: https://codechina.net 第一章:OpenAI API v4.5脑筋急转弯过滤机制的底层原理与影响评估 OpenAI API v4.5 引入的脑筋急转弯过滤机制并非独立模块,而是深度集成于请求预处理与响应后置校验双阶段的语义安全策略。其核心依赖于轻…...

【企业级长文本AI落地红线】:金融/法律/医疗场景中超过64K tokens必踩的4类合规与事实性崩塌风险

更多请点击: https://intelliparadigm.com 第一章:【企业级长文本AI落地红线】:金融/法律/医疗场景中超过64K tokens必踩的4类合规与事实性崩塌风险 在金融、法律与医疗等强监管垂直领域,当AI系统处理超长文档(如IPO招…...

鸿蒙问卷投票台页面构建:问卷统计与状态网格模块详解

鸿蒙问卷投票台页面构建:问卷统计与状态网格模块详解 前言 在 HarmonyOS 6.0 应用开发中,问卷调研类页面的核心挑战在于如何清晰展示问卷进度、回收数据和题型分布。本文将以“问卷投票台”应用的主页面为例,深入解析如何在鸿蒙平台上构建问卷…...

Agent开发五层架构详解,AI智能体开发知识点

AI Agent 的五层架构是构建具备自主规划与执行能力的智能代理系统的核心设计范式。 该架构将复杂的智能行为解耦为五个逻辑层次,确保了系统的模块化、可扩展性与可维护性。 以下是对每一层的深度讲解,涵盖其核心概念、应包含的组件以及关键设计要点。 …...