当前位置：首页 > article >正文

【大模型面试每日一题】Day 20：大模型出现“幻觉”（Hallucination）的可能原因有哪些？如何从数据或训练层面缓解？

article 2026/2/8 6:57:38

【大模型面试每日一题】Day 20：大模型出现“幻觉”（Hallucination）的可能原因有哪些？如何从数据或训练层面缓解？

📌 题目重现 🌟🌟

面试官：大模型出现“幻觉”（Hallucination）的可能原因有哪些？如何从数据或训练层面缓解？

🎯 核心考点

幻觉归因能力：能否识别数据、训练、推理多阶段的潜在风险
缓解方案设计意识：对知识注入、训练目标、解码策略的系统优化能力
工程实践适配经验：是否具备权威知识库对接、事实性约束等技术落地能力
风险控制意识：对幻觉危害的量化评估与应对策略

📖 回答

一、核心区别拆解

维度	数据阶段	训练阶段	推理阶段
主要风险	错误知识注入	最大似然偏差	解码策略缺陷
典型表现	虚构事实	过度泛化	逻辑矛盾
缓解成本	高（需重训练）	中（调整损失函数）	低（修改解码参数）

二、深度解析

1. 幻觉成因拆解

数据阶段：

错误知识污染：

- 医疗领域：爬取网页含虚假广告内容（如"某草药治愈癌症"）  
- 法律领域：过期法规未标注时效性（如引用已废止的司法解释）

知识冲突：

# 知识一致性检测示例  
def check_knowledge_conflict(text):  if "维生素C可治愈感冒" in text:  return "与WHO医学共识冲突"

训练阶段：
- 最大似然偏差：
  $\text{模型倾向最大化} P_{\theta}(y|x) \Rightarrow \text{可能选择高频但错误的输出}$
  - 案例：在GSM8K数学题中，模型可能选择"1/3=0.33"（截断错误）而非精确分数表示
- 参数记忆效应：
```
- 对罕见实体（如冷门药物）的表示不稳定 → 生成捏造属性  
- 实验显示：LoRA微调可减少15%此类错误  
```

推理阶段：

解码策略缺陷：

# Greedy Decoding vs Beam Search对比  
model.generate(input_ids, num_beams=5, early_stopping=True)  # 减少随机性错误

上下文溢出：

- 2048长度文本摘要时，关键事实可能被遗忘 → 生成矛盾结论  
- 解决方案：滑动窗口注意力 + 显式事实提示（"基于上述文档..."）

2. 缓解方案设计

（1）数据阶段：构建可信知识体系

权威数据筛选：

# 使用知识图谱过滤错误信息  
def filter_unreliable(text):  for entity in extract_entities(text):  if not knowledge_graph.contains(entity):  return False  return True

案例：医疗领域对接UpToDate、法律领域使用北大法宝数据库

合成数据增强：

1. 对原始数据中的实体进行替换生成对抗样本（如将"北京"替换为"上海"）  
2. 强迫模型学习事实边界（类似Contrastive Learning）

（2）训练阶段：事实性约束强化

对比学习（Contrastive Learning）：

# SimCSE式训练目标  
def simcse_loss(z_pos, z_neg, z_pred):  loss = -torch.log(  F.cosine_similarity(z_pred, z_pos) /  (F.cosine_similarity(z_pred, z_pos) + F.cosine_similarity(z_pred, z_neg))  )

效果：在TruthfulQA基准上提升12%事实正确率

知识增强训练：

- 构建三元组损失（Triplet Loss）：  - 锚点：原始问题  - 正例：权威答案  - 负例：模型生成的错误答案

（3）推理阶段：可控生成技术

解码策略优化：

# 约束解码实现  
def constrained_decoding(prompt, constraints):  generated = model.generate(  prompt,  prefix_allowed_tokens_fn=lambda batch_id, sent: constraints.get_allowed_tokens()  )

案例：生成医疗建议时，强制要求输出包含"请咨询专业医生"免责声明

知识检索增强（RAG）：
- 实验表明：在PubMed医学问答中，RAG可将幻觉率从32%降至9%

3. 评估指标设计

指标	定义	典型值
事实性得分	与权威知识库匹配度	≥0.8（满分1.0）
一致性得分	多次生成结果稳定性	≥0.95（BERTScore）
可解释性	生成依据的可追溯性	≥70%步骤可验证
风险等级	幻觉危害程度（1-5级）	目标≤2级

三、典型案例分析

1. 医疗对话场景

问题：用户询问"维生素C能否预防新冠？"
幻觉输出：“临床试验证明维生素C可使感染风险降低70%”
缓解方案：

# 医疗知识增强流程  
def medical_check(text):  if contains_medical_claim(text):  evidence = search_pubmed(text)  if not evidence:  return add_disclaimer(text)  # 添加"尚无明确证据"提示

2. 法律咨询场景

问题：“合同违约金上限是多少？”
幻觉输出：“根据《民法典》第585条，违约金不得超过合同金额的50%”（实际为30%）
缓解方案：

1. 在训练时注入带时效性的法律条文版本  
2. 解码时强制要求引用具体条款并验证内容

四、典型错误认知辨析

错误观点	正确解释
“增大模型规模可减少幻觉”	参数规模与幻觉率无直接关系（LLaMA-65B与30B幻觉率相近）
“仅需增加训练数据”	噪声数据可能加剧错误记忆（需配合数据清洗）
“Top-k采样优于Greedy”	在事实性任务中，Greedy更稳定（实验显示BLEU提升2.3%）

⚡️ 工程级技术选型建议

场景	推荐方案	理由
医疗/金融	RAG + 人工审核	严格监管需求
新闻摘要	事实性约束训练	需要高可信度
创意写作	有限制的Top-p采样	平衡创造性与准确性
客服对话	知识检索+规则过滤	需要可追溯性

🏭 业界案例参考

1. Anthropic医疗模型优化

技术栈：
- 数据清洗：过滤非同行评审内容
- 训练目标：加入逻辑一致性损失函数
效果：
- MedQA准确率提升18%
- 虚构药物推荐减少83%

2. Meta CICERO项目

方法	幻觉率
基线模型	27%
+ RAG	15%
+ 约束解码	8%

🛠️ 工程实践技巧

1. 动态知识注入

# 实时知识更新机制  
def dynamic_knowledge_update(kb_path):  latest_data = fetch_latest_research()  update_knowledge_base(kb_path, latest_data)  reload_model_knowledge()

2. 错误传播监控

# 构建幻觉传播图谱  
hallucination_graph.add_edge("错误前提", "错误结论", weight=0.8)

📈 总结速记图谱

✅ 一句话总结：大模型幻觉是数据噪声、训练偏差、推理不确定共同作用的结果，需通过可信数据注入、事实性约束训练、可控生成技术的三层防护体系，在知识边界与生成自由度间取得平衡。

🎬明日预告：

对比Chain-of-Thought（CoT）和Self-Consistency方法在复杂推理任务中的优劣

（欢迎在评论区留下你的方案，次日公布参考答案）

🚅附录延展

1、难度标识：

• 🌟 基础题（校招必会）

• 🌟🌟 进阶题（社招重点）

• 🌟🌟🌟 专家题（团队负责人级别）

🚀 为什么值得关注？

每日进阶：碎片化学习大厂高频考点，30天构建完整知识体系
实战代码：每期提供可直接复现的PyTorch代码片段
面试预警：同步更新Google/Meta/字节最新面试真题解析

📣 互动时间

💬 你在面试中遇到过哪些「刁钻问题」？评论区留言，下期可能成为选题！
👉 点击主页「关注」，第一时间获取更新提醒
⭐️ 收藏本专栏，面试前速刷冲刺

如果觉得内容有帮助，欢迎点赞+收藏+关注，持续更新中…

【大模型面试每日一题】Day 20：大模型出现“幻觉”（Hallucination）的可能原因有哪些？如何从数据或训练层面缓解？

【大模型面试每日一题】Day 20：大模型出现“幻觉”（Hallucination）的可能原因有哪些？如何从数据或训练层面缓解？ 📌 题目重现 🌟🌟 面试官：大模型出现“幻觉”&#xf…...

编程日记 2026/1/30 6:50:13

简单图像自适应亮度对比度调整

一、背景介绍继续在刷对比度调整相关算法，偶然间发现了这个简单的亮度/对比度自适应调整算法，做个简单笔记记录。也许后面用得到。二、自适应亮度调整 1、基本原理方法来自论文:Adaptive Local Tone Mapping Based on Retinex for High Dynamic Ran…...

编程日记 2026/2/2 5:01:24

ApiOperation(value "首页统计")GetMapping("/statistics")public UnifyResponse<List<BusinessStatisticsVO>> statistics() throws Exception {StatisticsPermissionQuery permissionQuery getPermission();ThreadPoolExecutor executor …...

编程日记 2026/2/1 21:08:39

neo4j框架：ubuntu系统中neo4j安装与使用教程

在使用图数据库的时候，经常需要用到neo4j这一图数据库处理框架。本文详细介绍了neo4j安装使用过程中的问题与解决方法。一、安装neo4j 在安装好了ubuntu系统、docker仓库和java的前提下在ubuntu系统命令行依次输入如下命令： # 安装依赖库 sudo apt-…...

编程日记 2025/12/17 21:39:29

ECPF 简介

ECPF（Embedded CPU Function，嵌入式CPU功能）是NVIDIA BlueField DPU特有的一种功能类型，和PF（Physical Function，物理功能）、VF（Virtual Function，虚拟功能）密…...

编程日记 2026/1/30 10:41:42

eSwitch manager 简介

eSwitch manager 的定义和作用 eSwitch manager 通常指的是能够配置和管理 eSwitch（嵌入式交换机）的实体或接口。在 NVIDIA/Mellanox 的网络架构中，Physical Function（PF）在 switchdev 模式下充当 eSwitch manager&am…...

编程日记 2026/1/30 12:08:02

深入理解二叉树：遍历、存储与算法实现

在之前的博客系列中，我们系统地探讨了多种线性表数据结构，包括顺序表、栈和队列等经典结构，并通过代码实现了它们的核心功能。从今天开始，我们将开启一个全新的数据结构篇章——树结构。与之前讨论的线性结构不同，树形…...

编程日记 2026/2/2 2:08:19

Python3 简易DNS服务器实现

使用Python3开发一个简单的DNS服务器，支持配置资源记录(RR)，并能通过dig命令进行查询。让自己理解DNS原理实现方案我们将使用socketserver和dnslib库来构建这个DNS服务器。dnslib库能帮助我们处理DNS协议的复杂细节。 1. 安装依赖首先确保安装了d…...

编程日记 2026/1/31 2:02:55

【Win32 API】 lstrcmpA()

作用比较两个字符字符串（比较区分大小写）。 lstrcmp 函数通过从第一个字符开始检查，若相等，则检查下一个，直到找到不相等或到达字符串的末尾。函数 int lstrcmpA(LPCSTR lpString1, LPCSTR lpString2); 参数 lpStr…...

编程日记 2026/2/2 4:06:54

（C语言）超市管理系统（正式版）（指针）（数据结构）（清屏操作）（文件读写）

目录前言： 源代码： product.h product.c fileio.h fileio.c main.c 代码解析： 一、程序结构概述二、product.c 函数详解 1. 初始化商品列表 Init_products 2. 添加商品 add_product 3. 显示商品 display_products 4. 修改商品 mo…...

编程日记 2026/2/2 5:10:55

NAT转换和ICMP

NAT nat原理示意 nat实现 ICMP ICMP支持主机或路由器： 差错或异常报告网络探寻 2类icmp报文： 差错报告报文（5种） 目的不可达源抑制--拥塞控制超时&超期--TTL超时参数问题--问题报文丢弃重定向--不应该由这个路由器转发&a…...

编程日记 2026/2/2 5:08:48

Executors类详解

Executors类详解 Executors 是Java中用于快速创建线程池的工具类，提供了一系列工厂方法，简化了 ThreadPoolExecutor 和 ScheduledThreadPoolExecutor 的配置。以下是其核心方法、实现原理及使用注意事项： 1. 常用线程池工厂方法 (1) newFixedThreadPool 作用：创建固定大小…...

编程日记 2026/2/1 7:34:02

【专利信息服务平台-注册/登录安全分析报告】

前言由于网站注册入口容易被黑客攻击，存在如下安全问题： 暴力破解密码，造成用户信息泄露短信盗刷的安全问题，影响业务及导致用户投诉带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞…...

编程日记 2026/2/2 2:35:24

BUUCTF——web刷题第一页题解

共31题，admin那题没有，因为环境问题，我做的非常卡目录极客大挑战 2019]Havefun [HCTF 2018]WarmU [ACTF2020 新生赛]Include [ACTF2020 新生赛]Exec [GXYCTF2019]Ping Ping Ping [SUCTF 2019]EasySQL [极客大挑战 2019]LoveSQL [极…...

编程日记 2026/2/2 5:51:12

哪个品牌的智能对讲机好用？推荐1款，能扛事更智能

在专业通信领域，智能对讲机早已突破传统设备的局限，成为集通信、调度、数据传输于一体的智能化终端。面对复杂多变的作业环境，用户对设备的稳定性、通信效率和智能化水平提出了更高要求。但是，市面上产品同质化严重，部…...

编程日记 2026/2/2 4:50:26

【Win32 API】 lstrcpyA()

作用将字符串复制到指定的字符串缓冲区。函数 LPSTR lstrcpyA(LPSTR lpString1, LPCSTR lpString2); 参数 lpString1 类型：LPTSTR 一个缓冲区，用于接收由 lpString2 参数指向的字符串的内容。缓冲区必须足够大才能包含字符串，包括终止…...

编程日记 2026/2/2 3:41:22

Vue3——Watch侦听器

目录手动指定监听对象侦听ref对象侦听ref对象中的某个属性 reactive写法 watchEffect 自动侦听多源侦听一次性侦听器 watch 是⼀个⽤于观察和响应Vue响应式系统中数据变化的⽅法。它允许你指定⼀个数据源（可以是响应式引⽤、计算属性、组件的属性等&#xf…...

编程日记 2026/2/2 2:42:11

Go的单测gomock及覆盖率命令

安装gomock： go get github.com/golang/mock/gomockgo get github.com/golang/mock/mockgen 使用 mockgen 生成 mock 代码: 参考 mockgen -sourceservice/user.go -destinationservice/mocks/mock_user_service.go -packagemocks go test -coverprofilecoverage.out…...

编程日记 2026/2/3 3:57:11

Leetcode209做题笔记

力扣209 题目分析：想象一个窗口遍历着这个数组，不断扩大右边界，让r。往窗口中添加数字： 此时我们找到了这个窗口，它的和满足了大于等于target的条件，题目让我求最短的，那么我们就尝试来缩短它&…...

编程日记 2026/2/3 3:06:55

Suna: 开源多面手 AI 代理

GitHub：GitHub - kortix-ai/suna: Suna - Open Source Generalist AI Agent 更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现 - 小众AI Suna 是一个完全开源的 AI 助手，可帮助您轻松完成实际任务。通过自然对话&#xff0c…...

编程日记 2026/2/3 5:15:26