当前位置: 首页 > news >正文

清华大学《DeepSeek与AI幻觉》(无套路免费分享)

随着人工智能技术的飞速发展,以DeepSeek为代表的国产大模型正逐渐成为各行各业的重要工具。然而,AI在生成内容时常常会出现“幻觉”——即生成与事实不符、逻辑断裂或脱离上下文的内容。

清华大学新闻与传播学院与人工智能学院联合推出的这篇教程《DeepSeek与AI幻觉》,系统性地讲解了AI幻觉的成因、评测方法及应对策略,旨在帮助用户更好地理解和使用AI工具。

《DeepSeek与AI幻觉》:https://pan.quark.cn/s/d213450b7a8d

一、核心要义

  1. AI幻觉的定义与分类:AI幻觉分为事实性幻觉(与事实不符)和忠实性幻觉(与用户指令不符)。

  2. DeepSeek的幻觉成因:数据偏差、泛化困境、知识固化、意图误解等是导致AI幻觉的主要原因。

  3. AI幻觉的双刃剑效应:虽然幻觉可能带来信息污染和信任危机,但也可能激发创造力和科学突破。

  4. 应对AI幻觉的策略:通过联网搜索、双AI验证、提示词工程等方法,用户可以有效减少幻觉带来的负面影响。


二、AI幻觉的定义与案例

AI幻觉指的是AI模型生成的内容与事实不符、逻辑断裂或脱离上下文的现象。通俗地说,就是AI“一本正经地胡说八道”。教程通过多个案例生动展示了AI幻觉的表现:

  1. 金融行业应用案例(第3页):
    DeepSeek在金融领域的应用案例中,某银行利用其构建因果归因网络,成功降低了小微企业的不良率。然而,AI生成的某些案例可能存在虚构成分,如“某头部银行”的具体名称和数据的真实性无法验证。

  2. 推荐错误(第4页):
    用户让DeepSeek推荐阿布扎比的本地市场,结果AI推荐了一个根本不存在的商场。虽然AI道歉后再次推荐,但依然出现了错误。

  3. 医疗转录错误(第5页):
    OpenAI的Whisper系统在医疗转录中出现了大量幻觉问题。例如,原音频为“她的父亲再婚后不久就去世了”,转录文本却变成了“她确实在65岁时去世了”,这种错误可能对患者健康和医疗系统产生严重影响。

  4. 虚构事件(第16页):
    当被问及“水浒传中李逵为什么大闹五台山”时,DeepSeek生成了虚构的情节,实际上大闹五台山的是鲁智深,而非李逵。


三、AI幻觉的成因

教程深入分析了AI幻觉的成因,主要包括以下几点:

  1. 数据偏差:训练数据中的错误或片面性被模型放大。例如,医学领域的过时论文可能导致AI生成错误的医疗建议。

  2. 泛化困境:模型难以处理训练集外的复杂场景。例如,预测南极冰层融化对非洲农业的影响时,AI可能生成不准确的结论。

  3. 知识固化:模型过度依赖参数化记忆,缺乏动态更新能力。例如,AI可能虚构2023年后的事件。

  4. 意图误解:用户提问模糊时,模型容易“自由发挥”。例如,用户要求“介绍深度学习”,AI可能生成与用户需求无关的内容。


四、AI幻觉的评测

教程通过多个测试案例,展示了如何评测AI幻觉:

  1. 通用提示语测试(第12页):
    随机生成100条通用提示语,模仿普通用户的真实使用场景,评测各大模型的幻觉率。结果显示,DeepSeek V3的幻觉率为2%,DeepSeek R1为3%。

  2. 事实性幻觉测试(第13页):
    随机抽取300道事实性幻觉测试题,涵盖健康、科学、历史等领域。DeepSeek V3的幻觉率为29.67%,DeepSeek R1为22.33%。

  3. 常识错误与逻辑陷阱(第14-15页):
    在常识问题和逻辑推理任务中,AI模型常常生成错误的答案。例如,当被问及“为什么一向见钱眼开的小明仍然会被金钱蒙住双眼”时,DeepSeek生成了复杂的逻辑分析,但并未直接回答问题的核心。


五、如何应对AI幻觉?

教程提供了三种应对AI幻觉的策略:

  1. 联网搜索(第20页):
    通过联网功能,AI可以实时检索权威信息,减少幻觉率。例如,DeepSeek V3在开启联网搜索后,事实性测试的幻觉率从29.67%降至24.67%。

  2. 双AI验证(第21页):
    利用多个AI模型进行交叉验证。例如,先用DeepSeek生成答案,再用其他大模型进行审查,确保答案的准确性。

  3. 提示词工程(第22-23页):
    通过设计精准的提示词,约束AI的生成内容。例如,使用“时间锚定法”限定时间范围,或使用“知识锚定法”限定权威来源,减少虚构内容的生成。


六、AI幻觉的创造力价值

尽管AI幻觉可能带来风险,但它也具有一定的创造力价值:

  1. 科学发现(第27页):
    AI幻觉在蛋白质设计中发挥了重要作用。大卫·贝克团队利用AI的“错误折叠”启发新型蛋白质结构,最终获得了2024年诺贝尔化学奖。

  2. 文艺与设计(第28页):
    AI幻觉可以突破人类思维定式,生成超现实的艺术作品和设计灵感。例如,AI生成的虚拟环境和角色设计为游戏开发提供了无限的可能性。

  3. 技术创新(第30页):
    AI幻觉在某些技术任务中意外提升了系统性能。例如,DeepMind团队发现,AI在图像分割任务中产生的“超现实边界”提升了自动驾驶系统在极端天气下的识别精度。


七、教程的优势
  1. 全面覆盖:从AI幻觉的定义、成因到应对策略,教程涵盖了用户在使用AI工具时可能遇到的所有关键问题。

  2. 案例丰富:通过多个真实案例,教程生动展示了AI幻觉的表现及其潜在风险。

  3. 操作性强:教程提供了具体的应对策略,如联网搜索、双AI验证、提示词工程等,用户可以直接套用。

  4. 创造力启发:教程不仅关注AI幻觉的负面影响,还探讨了其在科学、艺术和技术创新中的潜在价值。


八、总结

AI幻觉是当前大模型技术面临的一个重要挑战,但它并非完全负面。通过理解AI幻觉的成因,并采取有效的应对策略,用户可以最大限度地减少其带来的风险,同时利用其创造力价值。清华大学的这篇教程为普通用户提供了一份详实的指南,帮助他们在AI时代更好地驾驭这一强大的工具。正如教程中所说:“与其追求‘绝对正确’,不如学会与AI的‘想象力’共舞——因为最伟大的创新,往往诞生于理性与狂想的交界处。”


这篇教程不仅适合AI领域的专业人士,也适合普通用户。通过学习如何应对AI幻觉,用户可以在工作、学习和生活中更高效地使用AI工具,同时避免因AI的“胡说八道”而陷入困境。

相关文章:

清华大学《DeepSeek与AI幻觉》(无套路免费分享)

随着人工智能技术的飞速发展,以DeepSeek为代表的国产大模型正逐渐成为各行各业的重要工具。然而,AI在生成内容时常常会出现“幻觉”——即生成与事实不符、逻辑断裂或脱离上下文的内容。 清华大学新闻与传播学院与人工智能学院联合推出的这篇教程《Deep…...

代码随想录算法【Day52】

Day51 101. 孤岛的总面积 思路 从周边找到陆地然后 通过 dfs或者bfs 将周边靠陆地且相邻的陆地都变成海洋&#xff0c;然后再去重新遍历地图 统计此时还剩下的陆地 代码 #include <iostream> #include <vector> using namespace std; int dir[4][2] {-1, 0, …...

Spark 和 Flink

Spark 和 Flink 都是目前流行的大数据处理引擎&#xff0c;但它们在架构设计、应用场景、性能和生态方面有较大区别。以下是详细对比&#xff1a; 1. 架构与核心概念 方面Apache SparkApache Flink计算模型微批&#xff08;Micro-Batch&#xff09;为主&#xff0c;但支持结构…...

Unity结合Vuforia虚拟按键实现AR机械仿真动画效果

零、最终效果 待上传 一、资源准备 1、Vuforia Vuforia版本不能高于10.17.4&#xff08;往上的版本虚拟按键功能被删除&#xff09; 2、Unity Unity版本必须要高于2022.3.x&#xff0c;不然使用Vuforia插件时会出现bug 二、主要内容 1、添加虚拟按钮 2、为虚拟按钮设置…...

PL/SQL 异常处理

目录 一、命名的系统异常 1.常见命名的系统异常 2.预定义的系统异常数量以及描述 3.处理命名的系统异常的一般步骤 二、程序员定义的异常 1.概念 2.自定义异常的定义与抛出 3.自定义异常的处理 三、未命名的系统异常 1.概述 2.处理未命名的系统异常的方法 3.使用场景 …...

【自学笔记】Spring Boot框架技术基础知识点总览-持续更新

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 Spring Boot框架技术基础知识点总览一、Spring Boot简介1.1 什么是Spring Boot&#xff1f;1.2 Spring Boot的主要特性 二、Spring Boot快速入门2.1 搭建Spring Boo…...

Redis 缓存穿透、击穿、雪崩:问题与解决方案

在使用 Redis 作为缓存中间件时&#xff0c;系统可能会面临一些常见的问题&#xff0c;如 缓存穿透、缓存击穿 和 缓存雪崩。这些问题如果不加以解决&#xff0c;可能会导致数据库压力过大、系统响应变慢甚至崩溃。本文将详细分析这三种问题的起因&#xff0c;并提供有效的解决…...

第一个CMAKE项目hello cmake

#注意&#xff01; 这篇文章是为WINDWOS用户写的 #请检查你的电脑上已经安装了MINGW和CMAKE 快速检查方法如下 C:\Users\Basicoperation>g --version g (x86_64-win32-seh-rev1, Built by MinGW-Builds project) 14.2.0 Copyright (C) 2024 Free Software Foundation, Inc. …...

骶骨神经

骶骨肿瘤手术后遗症是什么_39健康网_癌症 [健康之路]匠心仁术&#xff08;七&#xff09; 勇闯禁区 骶骨肿瘤切除术...

基于Django的购物商城平台的设计与实现(源码+lw+部署文档+讲解),源码可白嫖!

摘要 当今社会进入了科技进步、经济社会快速发展的新时代。国际信息和学术交流也不断加强&#xff0c;计算机技术对经济社会发展和人民生活改善的影响也日益突出&#xff0c;人类的生存和思考方式也产生了变化。传统购物管理采取了人工的管理方法&#xff0c;但这种管理方法存…...

使用快捷键高效管理 VSCode:提升工作效率,告别鼠标操作

如果你想提高工作效率&#xff0c;减少鼠标操作&#xff0c;掌握键盘快捷键是一个非常有效的方式。在编程过程中&#xff0c;熟练使用快捷键能够快速管理文件、标签页&#xff0c;节省时间并提升效率。比如&#xff0c;Ctrl P 和 Ctrl W 可以快速打开和关闭文件&#xff0c;而…...

【找工作】C++和算法复习(自用)

文章目录 C头文件自定义排序函数stl 算法数据结构树状数组 数学 自用随便记录 C 排序 stl 头文件 全能头文件&#xff1a; #include<bits/stdc.h>自定义排序函数 bool compare(const int &odd1,const int &odd2) {return odd1>odd2; }stl 枚举map map&…...

大语言模型基础

简介 AI大模型是“人工智能预训练大模型”的简称,包含了“预训练”和“大模型”两层含义,二者结合产生了一种新的人工智能模式,即模型在大规模数据集上完成了预训练后无需微调,或仅需要少量数据的微调,就能直接支撑各类应用。AI大模型主要分为三类:大语言模型、CV大模型…...

深入浅出机器学习:概念、算法与实践

目录 引言 机器学习的基本概念 什么是机器学习 机器学习的基本要素 机器学习的主要类型 监督学习&#xff08;Supervised Learning&#xff09; 无监督学习&#xff08;Unsupervised Learning&#xff09; 强化学习&#xff08;Reinforcement Learning&#xff09; 机器…...

2024年国赛高教杯数学建模A题板凳龙闹元宵解题全过程文档及程序

2024年国赛高教杯数学建模 A题 板凳龙闹元宵 原题再现 “板凳龙”&#xff0c;又称“盘龙”&#xff0c;是浙闽地区的传统地方民俗文化活动。人们将少则几十条&#xff0c;多则上百条的板凳首尾相连&#xff0c;形成蜿蜒曲折的板凳龙。盘龙时&#xff0c;龙头在前领头&#x…...

老游戏回顾:d2

游戏中玩家创建属于自己的角色&#xff0c;在一片片暗黑大地上奔跑、杀敌、寻宝、成长&#xff0c;最终打败统治各个大陆的黑暗势力&#xff0c;拯救游戏中的各个种族。 《暗黑破坏神II》的制作团队包括编程小组、运动物体制作小组和背景制作小组。游戏设计很大程度上是开放的&…...

【深度学习】Pytorch的深入理解和研究

一、Pytorch核心理解 PyTorch 是一个灵活且强大的深度学习框架&#xff0c;广泛应用于研究和工业领域。要深入理解和研究 PyTorch&#xff0c;需要从其核心概念、底层机制以及高级功能入手。以下是对 PyTorch 的深入理解与研究的详细说明。 1. 概念 动态计算图&#xff08;D…...

什么是 Vue 的自定义事件?如何触发和监听?

Vue 的自定义事件详解 什么是自定义事件&#xff1f; 在 Vue 中&#xff0c;自定义事件是组件之间通信的重要机制。自定义事件允许子组件向父组件发送消息&#xff0c;通常用于处理用户交互或异步操作的结果。这种机制使得组件间的通信更加灵活和解耦。 自定义事件的基本概念…...

windows上vscode cmake工程搭建

安装vscode插件&#xff1a; 1.按装fastc&#xff08;主要是安装MinGW\mingw64比较方便&#xff09; 2.安装C&#xff0c;cmake&#xff0c;cmake tools插件 3.准备工作完成之后&#xff0c;按F1&#xff0c;选择cmake:Quick Start就可以创建一个cmake工程。 4.设置Cmake: G…...

DEMF模型赋能多模态图像融合,助力肺癌高效分类

目录 论文创新点 实验设计 1. 可视化的研究设计 2. 样本选取和数据处理 3. 集成分类模型 4. 实验结果 5. 可视化结果 图表总结 可视化知识图谱 在肺癌早期筛查中,计算机断层扫描(CT)和正电子发射断层扫描(PET)作为两种关键的影像学手段,分别提供了丰富的解剖结构…...

智慧医疗能源事业线深度画像分析(上)

引言 医疗行业作为现代社会的关键基础设施,其能源消耗与环境影响正日益受到关注。随着全球"双碳"目标的推进和可持续发展理念的深入,智慧医疗能源事业线应运而生,致力于通过创新技术与管理方案,重构医疗领域的能源使用模式。这一事业线融合了能源管理、可持续发…...

css实现圆环展示百分比,根据值动态展示所占比例

代码如下 <view class""><view class"circle-chart"><view v-if"!!num" class"pie-item" :style"{background: conic-gradient(var(--one-color) 0%,#E9E6F1 ${num}%),}"></view><view v-else …...

【决胜公务员考试】求职OMG——见面课测验1

2025最新版&#xff01;&#xff01;&#xff01;6.8截至答题&#xff0c;大家注意呀&#xff01; 博主码字不易点个关注吧,祝期末顺利~~ 1.单选题(2分) 下列说法错误的是:&#xff08; B &#xff09; A.选调生属于公务员系统 B.公务员属于事业编 C.选调生有基层锻炼的要求 D…...

pikachu靶场通关笔记22-1 SQL注入05-1-insert注入(报错法)

目录 一、SQL注入 二、insert注入 三、报错型注入 四、updatexml函数 五、源码审计 六、insert渗透实战 1、渗透准备 2、获取数据库名database 3、获取表名table 4、获取列名column 5、获取字段 本系列为通过《pikachu靶场通关笔记》的SQL注入关卡(共10关&#xff0…...

Android 之 kotlin 语言学习笔记三(Kotlin-Java 互操作)

参考官方文档&#xff1a;https://developer.android.google.cn/kotlin/interop?hlzh-cn 一、Java&#xff08;供 Kotlin 使用&#xff09; 1、不得使用硬关键字 不要使用 Kotlin 的任何硬关键字作为方法的名称 或字段。允许使用 Kotlin 的软关键字、修饰符关键字和特殊标识…...

项目部署到Linux上时遇到的错误(Redis,MySQL,无法正确连接,地址占用问题)

Redis无法正确连接 在运行jar包时出现了这样的错误 查询得知问题核心在于Redis连接失败&#xff0c;具体原因是客户端发送了密码认证请求&#xff0c;但Redis服务器未设置密码 1.为Redis设置密码&#xff08;匹配客户端配置&#xff09; 步骤&#xff1a; 1&#xff09;.修…...

学校时钟系统,标准考场时钟系统,AI亮相2025高考,赛思时钟系统为教育公平筑起“精准防线”

2025年#高考 将在近日拉开帷幕&#xff0c;#AI 监考一度冲上热搜。当AI深度融入高考&#xff0c;#时间同步 不再是辅助功能&#xff0c;而是决定AI监考系统成败的“生命线”。 AI亮相2025高考&#xff0c;40种异常行为0.5秒精准识别 2025年高考即将拉开帷幕&#xff0c;江西、…...

SAP学习笔记 - 开发26 - 前端Fiori开发 OData V2 和 V4 的差异 (Deepseek整理)

上一章用到了V2 的概念&#xff0c;其实 Fiori当中还有 V4&#xff0c;咱们这一章来总结一下 V2 和 V4。 SAP学习笔记 - 开发25 - 前端Fiori开发 Remote OData Service(使用远端Odata服务)&#xff0c;代理中间件&#xff08;ui5-middleware-simpleproxy&#xff09;-CSDN博客…...

C++.OpenGL (14/64)多光源(Multiple Lights)

多光源(Multiple Lights) 多光源渲染技术概览 #mermaid-svg-3L5e5gGn76TNh7Lq {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-3L5e5gGn76TNh7Lq .error-icon{fill:#552222;}#mermaid-svg-3L5e5gGn76TNh7Lq .erro…...

Mysql中select查询语句的执行过程

目录 1、介绍 1.1、组件介绍 1.2、Sql执行顺序 2、执行流程 2.1. 连接与认证 2.2. 查询缓存 2.3. 语法解析&#xff08;Parser&#xff09; 2.4、执行sql 1. 预处理&#xff08;Preprocessor&#xff09; 2. 查询优化器&#xff08;Optimizer&#xff09; 3. 执行器…...