当前位置: 首页 > news >正文

AIGC(生成式AI)试用 26 -- 跟着清华教程学习 - DeepSeek与AI幻觉

目标:继续学习

个人理解:
- AI幻觉:一本正经的胡说八道,你还觉得很道理,倾向于相信;事实不一致,指令(预期)与实际不一致:跑题
- 潜在风险:把AI带坏了;信息误导、过度信任导致的误判、失控、恶意利用,伦理不设限(比如回答中可以带脏话)
- 事实幻觉? -- 指AI生成的内容与现实世界事实相矛盾
- RAG:RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索生成的技术,旨在提高语言模型生成内容的准确性和可靠性。RAG的核心思想是通过从外部知识库中检索相关信息,辅助模型生成更符合事实、更高质量的文本。
- AI幻觉,有风险,同样存在迷之创造,可能帮你打开新思路,关键是你如何提问和使用

DeepSeek与AI幻觉

  • 什么是AI幻觉
    - 学术:指模型生成与事实不符、逻辑断裂或脱离上下文的内容,本质是统计概率驱动的“合理猜测”
    - 说人话:一本正经地胡说八道
    - 事实性幻觉:指模型生成的内容与可验证的现实世界事实不一致
    - 忠实性幻觉:指模型生成的内容与用户的指令或上下文不一致

    提问:画一幅画:有山 、有河、有人、有飞机、有大炮、有亭子、有跑车、有雪、有瀑布 -- 这样的场景存在吗?
  • DeepSeek为什么会产生幻觉
    - 数据偏差:训练数据中的错误或片面性被模型放大(如医学领域过时论文导致错误结论)-- 错误引导
    - 泛化困境:模型难以处理训练集外的复杂场景(如南极冰层融化对非洲农业的影响预测)-- 解构、重构偏离实际
    - 知识固化:模型过度依赖参数化记忆,缺乏动态更新能力(如2023年后的事件完全虚构)-- 知识库更新不及时
    - 意图误解:用户提问模糊时,模型易“自由发挥”(如“介绍深度学习”可能偏离实际需求)-- 自主意识?

    - 主观较多的内容一般不易产生幻觉 -- 正确性评价缺少量化,多以描述为主(非数据化度量),结果与评价人喜好、所处的文化环境、语境有极大关系

    - AI幻觉的潜在风险
      > 信息污染风险:由于DeepSeek的低门槛和普及度高,大量AI生成内容涌入中文互联网,加剧了虚假信息传播的“雪球效应”,甚至污染下一代模型训练数据
      > 信任危机:普通用户难以辨别AI内容的真实性,可能对医疗建议、法律咨询等专业场景的可靠性产生长期怀疑
      > 控制欠缺:DeepSeek的对齐工作较其他闭源大模型有所欠缺,其开源特性也允许使用者随意使用,可能会成为恶意行为的工具
      > 安全漏洞:若错误信息被用于自动化系统(如金融分析、工业控制),可能引发连锁反
  • AI幻觉评测
    - 不同模型、相同条目的通用提示语、相同应用场景 -- 人工判断、标注、交叉验证
    - 不同模型、相同条目、随机抽取事实幻觉测试题 -- 事实幻觉?
    - 推理逻辑能力强,幻觉率减少,同样AI会“处以为是”的“增强”问答
  • 如何减缓AI幻觉
    - 增加AI数据库的容量,使AI能从既有事实经验中得到更准确的结果
    - 交叉验证,使用不同的AI工具相互验证结果 -- 同样要有自我的经验判断
    - 提示词技巧:少开放性问题(推理性),多指令性问题;复杂问题简单化,问题层层递进、迭代,增加连界约束,增加结果验证、反思步骤
      > RAG框架:利用检索增强生成(如先搜索权威数据库,再生成答案)
      > 外部知识库:结合外部知识库,砍通用知识,强化垂直领域
      > 精细训练:针对不同任务类型进行具体的微调或强化
      > 评估工具:开发高效的自动化AI幻觉识别工具,对生成内容进行及时验证

    - 应对AI幻觉
      > 三角验证法:交叉比对多个AI回答或权威来源。
      > 警惕“过度合理”:越细节丰富的回答越需谨慎(如AI虚构论文标题与作者)。-- 只回答你想听到的,过度迎合:需要关注提示词有意向引导
      > 理解幻觉,享受幻觉:理解幻觉的特点和应对方法,享受幻觉带来的创意灵感 -- 创造性
  • AI幻觉的创造力价
    - 科学发现:从“错误”到突破的范式跃迁 -- AI的胡说八道带给我们的判断和新思考
    - 文艺与设计:突破人类思维定式的“超现实引擎” -- 非量化的创新,带来不一样的天马行空,灵感
    - 乐与游戏:创造新的视觉和听觉体验
    - 技术创新:从“缺陷”到方法论的转化 -- 不一样的思考方式、不同角色和行业的思维融合
      新型科研范式:科学界正构建“AI幻觉-实验验证-理论重构”的三阶段研究流程 -- 狂创意→理性筛选

提问:AI幻觉

DeepSeek文心一言

I幻觉(AI Hallucination)是指人工智能模型(尤其是生成模型,如大型语言模型或图像生成模型)在生成内容时,产生与输入不符、不符合事实或逻辑上不合理的输出。这种现象通常是因为模型在训练数据中学习到的模式不够准确,或者在生成过程中缺乏对真实世界的精确理解。


AI幻觉的表现

  1. 文本生成中的幻觉

    • 生成与输入无关的内容。

    • 提供错误的事实或虚构的信息(例如,编造不存在的书籍、事件或人物)。

    • 在逻辑推理中出现矛盾或不合常理的结论。

  2. 图像生成中的幻觉

    • 生成不符合物理规律的图像(例如,扭曲的物体、不合理的透视关系)。

    • 生成与文本描述不符的图像(例如,描述“一只猫在草地上”,但生成的图像中猫有六条腿)。

    • 生成包含虚假细节的图像(例如,虚构的建筑物或风景)。

  3. 多模态生成中的幻觉

    • 在文本到图像生成中,生成的图像与文本描述不完全匹配。

    • 在视频生成中,生成的视频帧之间缺乏连贯性。


AI幻觉的原因

  1. 训练数据的局限性

    • 模型训练数据可能不全面或存在偏差,导致模型无法准确理解某些概念或场景。

    • 数据中可能包含噪声或错误信息,影响模型的学习。

  2. 模型的生成机制

    • 生成模型(如GPT、DALL·E)基于概率生成内容,可能会优先选择高频模式,而忽略低频但正确的模式。

    • 模型缺乏对真实世界的物理和逻辑规则的深刻理解。

  3. 输入的模糊性

    • 如果用户输入模糊或不明确,模型可能会生成与预期不符的内容。

    • 模型可能会过度解读或错误解读输入中的某些细节。

  4. 缺乏实时反馈机制

    • 模型在生成过程中无法实时验证内容的正确性或合理性。


AI幻觉的影响

  1. 误导用户

    • 如果用户依赖AI生成的内容,可能会被错误信息误导。

    • 在教育、医疗等关键领域,AI幻觉可能导致严重后果。

  2. 降低信任度

    • 频繁的幻觉会降低用户对AI系统的信任。

  3. 增加人工审核成本

    • 为了确保生成内容的准确性,可能需要额外的人工审核。


解决AI幻觉的方法

  1. 改进训练数据

    • 使用更高质量、更全面的数据集进行训练。

    • 引入领域专家审核数据,确保数据的准确性和多样性。

  2. 引入外部知识

    • 将模型与知识库(如维基百科、专业数据库)结合,增强模型对事实的理解。

    • 使用检索增强生成(RAG)技术,实时检索相关信息辅助生成。

  3. 模型优化

    • 引入逻辑推理模块,增强模型对物理和逻辑规则的理解。

    • 使用对抗训练或强化学习,减少生成不合理内容的概率。

  4. 用户反馈机制

    • 允许用户对生成内容进行反馈,帮助模型不断改进。

    • 提供“不确定性提示”,让用户知道生成内容可能存在错误。

  5. 多模态验证

    • 在多模态任务中,通过多种模态(如文本、图像、音频)相互验证,减少幻觉。


实际案例

  1. ChatGPT的幻觉

    • 当被问及某个不存在的历史事件时,ChatGPT可能会编造一个看似合理但完全虚构的故事。

  2. DALL·E的幻觉

    • 当输入“一只猫在弹钢琴”时,DALL·E可能会生成一只猫与钢琴分离的图像,或者猫的形态不符合现实。


AI幻觉是当前生成式AI面临的重要挑战之一,但随着技术的进步和方法的改进,这一问题有望逐步得到缓解。

AI幻觉是指人工智能系统(尤其是自然语言处理模型)生成的内容与真实数据不符,或偏离用户指令的现象。以下是对AI幻觉的详细解析:

一、AI幻觉的类型

AI幻觉主要分为两类:事实幻觉和忠诚度幻觉。

  1. 事实幻觉:指AI生成的内容与现实世界事实相矛盾。这包括事实不一致和事实捏造两种情况。例如,当被问及“世界上最高的山峰是哪座”时,如果AI回答“深圳塘朗山是世界上最高的山峰”,这就是一个事实不一致的例子。另外,如果AI描述说“2024年,考古学家在埃及金字塔内发现了一座隐藏的密室,里面藏有古代法老的宝藏和未知的高科技装置”,这就是完全虚构的信息,属于事实捏造。

  2. 忠诚度幻觉:指AI的回答偏离用户的要求或上下文信息。这包括指令不一致、上下文不一致和逻辑不一致三种情况。例如,如果用户要求AI“讲解一下龙飞凤舞”,但AI回答了“老铁,我给你搜了几段舞蹈教学”,这就完全偏离了原始的问题,属于指令不一致。另外,如果在一个讨论中国传统节日的上下文中,AI说“春节是纪念屈原的节日,人们会吃粽子和赛龙舟”,这就是上下文不一致的例子。逻辑不一致则是指AI的输出存在内在逻辑矛盾。

二、AI幻觉的特点

  1. 内容流畅性:尽管内容可能有误,AI生成的文本通常仍然连贯流畅。

  2. 表面合理性:生成的内容表面上看起来可信,给人以“这看起来很对”的第一印象,非专业人士难以辨别。

  3. 上下文相关:AI的幻觉内容并非凭空出现,它们通常与特定的上下文情境紧密相关。

  4. 不可预测性:很难预测AI何时会产生幻觉,且幻觉可能很难复现。

三、AI幻觉的产生原因

  1. 数据问题

    • 数据缺陷:训练数据可能包含错误、偏见或过时信息。

    • 知识边界:AI存在领域知识缺陷,可能无法覆盖所有相关知识。

    • 利用率低:AI在利用数据时可能过度依赖某些模式,导致在新情况下推导错误。

  2. 训练过程问题

    • 预训练和对齐阶段问题:预训练阶段学习通用表示并获取世界知识,对齐阶段微调模型使其更好地与人类偏好一致,这两个阶段可能出现问题导致幻觉。

    • 架构缺陷:基于前一个token预测下一个token的单向建模方式可能阻碍模型捕获复杂的上下文关系。

    • 曝露偏差:模型推理时依赖于自己生成的token进行后续预测,可能导致级联错误。

  3. 模型本身问题

    • 模型结构限制:AI通过统计模式预测,但可能无法真正理解信息。

    • 能力错位:大模型内在能力与标注数据中描述的功能之间可能存在错位。

    • 信念错位:模型有时会倾向于迎合人类偏好,从而牺牲信息真实性。

四、如何避免AI幻觉

  1. 提示工程:通过优化AI的输入提示,使生成的内容更准确。例如,使用检索增强生成(RAG)技术,在内容生成前、中、后阶段检索并整合外部知识,确保内容的准确性和时效性。

  2. 模型开发:不断进化AI模型与训练过程是减少幻觉产生的关键。可以采用创新解码技术、知识图谱的应用、基于忠实度的损失函数以及监督微调等方法来提升模型的准确性和可靠性。

  3. AI Agent:为模型加Buff,提高模型的可靠性。例如,使用程序辅助语言模型(PAL)技术,将程序化逻辑嵌入到语言模型中,使AI能够执行特定的程序或算法来完成任务。

五、AI幻觉的实例

在实际应用中,AI幻觉可能导致严重的问题。例如,在商标侵权案件中,原告通过非正常搜索触发搜索引擎系统故障,导致大模型出现幻觉,认为被告的推广页面是“正确答案”,从而输出了貌似侵权的结果。这类案件的发生提醒我们,在使用AI技术时需要谨慎对待其生成的内容,并进行充分的核实和审查。

综上所述,AI幻觉是人工智能系统在使用过程中可能出现的一种现象。了解AI幻觉的类型、特点、产生原因以及避免方法对于提高AI技术的准确性和可靠性具有重要意义。

相关文章:

AIGC(生成式AI)试用 26 -- 跟着清华教程学习 - DeepSeek与AI幻觉

目标:继续学习 个人理解: - AI幻觉:一本正经的胡说八道,你还觉得很道理,倾向于相信;事实不一致,指令(预期)与实际不一致:跑题 - 潜在风险:把AI带坏了;信息误…...

Ubuntu 下 nginx-1.24.0 源码分析 - ngx_conf_add_dump

ngx_conf_add_dump 定义在src\core\ngx_conf_file.c static ngx_int_t ngx_conf_add_dump(ngx_conf_t *cf, ngx_str_t *filename) {off_t size;u_char *p;uint32_t hash;ngx_buf_t *buf;ngx_str_node_t *sn;ngx_conf_dump_t *cd;has…...

QEMU源码全解析 —— 内存虚拟化(23)

接前一篇文章:QEMU源码全解析 —— 内存虚拟化(22) 本文内容参考: 《趣谈Linux操作系统》 —— 刘超,极客时间 《QEMU/KVM源码解析与应用》 —— 李强,机械工业出版社 QEMU内存管理模型...

【北京迅为】itop-3568 开发板openharmony鸿蒙烧写及测试-第1章 体验OpenHarmony—烧写镜像

瑞芯微RK3568芯片是一款定位中高端的通用型SOC,采用22nm制程工艺,搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码,支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU,可用于轻量级人工…...

TypeScript 类型声明

在 TypeScript 开发中简化类型声明,可以通过以下 7 种实用技巧 显著提升效率: 一、善用类型推断(30% 场景免声明) // ❌ 冗余写法 const user: { name: string; age: number } { name: Jack, age: 25 };// ✅ 自动推断&#xff…...

从0搭建Tomcat第二天:深入理解Servlet容器与反射机制

在上一篇博客中,我们从0开始搭建了一个简易的Tomcat服务器,并实现了基本的HTTP请求处理。今天,我们将继续深入探讨Tomcat的核心组件之一——Servlet容器,并介绍如何使用反射机制动态加载和管理Servlet。 1. Servlet容器的作用 S…...

【Python】yield函数

【Python】yield函数 1. yield介绍2.yield基本用法3.yield高级用法3.1 yield send() 方法3.2 yield from方法3.3 yield 和yield from叠加处理复杂情况下的叠加 4.yield主要应用场景5.总结 python官方api地址 1. yield介绍 在Python中,yield关键字主要用于生成器函…...

Android13修改多媒体默认音量

干就完了! 设置音量为最大音量,修改如下: /framework/base/media/java/android/media/AudioSystem.java/** hide */public static int[] DEFAULT_STREAM_VOLUME new int[] {4, // STREAM_VOICE_CALL7, // STREAM_SYSTEM5, // STREAM_RING-5, // STREAM_MUSIC15, // STREAM…...

nginx+keepalived负载均衡及高可用

一、环境准备 主机名ip地址备注openEuler-1 192.168.121.11(本机) 192.168.131.11(心跳连接) nginx主负载均衡调度器openEuler-2 192.168.121.12(本机) 192.168.131.12(心跳连接) n…...

SP导入智能材质球

智能材质球路径 ...\Adobe Substance 3D Painter\resources\starter_assets\smart-materials 放入之后就会自动刷新...

Kotlin语言特性(一):空安全、扩展函数与协程

Kotlin语言特性(一):空安全、扩展函数与协程 一、引言 Kotlin作为Android官方推荐的开发语言,相比Java具有诸多现代化特性。本文将重点介绍Kotlin三个最具特色的语言特性:空安全、扩展函数和协程,并结合A…...

Sqlserver安全篇之_启用TLS即配置SQL Server 数据库引擎以加密连接

官方文档 https://learn.microsoft.com/zh-cn/sql/database-engine/configure-windows/configure-sql-server-encryption?viewsql-server-ver16 https://learn.microsoft.com/zh-cn/sql/database-engine/configure-windows/manage-certificates?viewsql-server-ver15&pre…...

Python 爬虫 – BeautifulSoup

Python 爬虫(Web Scraping)是指通过编写 Python 程序从互联网上自动提取信息的过程。 爬虫的基本流程通常包括发送 HTTP 请求获取网页内容、解析网页并提取数据,然后存储数据。 Python 的丰富生态使其成为开发爬虫的热门语言,特…...

【星云 Orbit-STM32F4】07. 用判断数据尾来接收据的串口通用程序框架

【星云 Orbit-STM32F4】用判断数据尾来接收一串数据的串口通用程序框架 摘要 本文介绍了一种基于STM32F407微控制器的串口数据接收通用程序框架。该框架通过判断数据尾来实现一串数据的完整接收,适用于需要可靠数据传输的应用场景。本文从零开始,详细讲…...

授权与认证之jwt(一)创建Jwt工具类

JWT的Token要经过加密才能返回给客户端&#xff0c;包括客户端上传的Tokn,后端项目需要验证核 实。于是我们需要一个WT工具类&#xff0c;用来加密Token和验证Token的有效性。 一、导入依赖 <dependency><groupId>com.auth0</groupId><artifactId>jav…...

Kubernetes Service服务发现dns之CoreDNS

文章目录 背景什么是Service、服务发现、Endpoint什么是CoreDNSCoreDNS 的工作原理 常用命令coredns 运行状态根据服务名&#xff0c;判断某个服务dns解析是否正常 背景 Kubernetes 集群内部的服务发现是微服务架构的核心基础&#xff0c;而 DNS 服务则是实现这一机制的关键组…...

Spring Boot 测试:单元、集成与契约测试全解析

一、Spring Boot 分层测试策略 Spring Boot 应用采用经典的分层架构&#xff0c;不同层级的功能模块对应不同的测试策略&#xff0c;以确保代码质量和系统稳定性。 Spring Boot 分层架构&#xff1a; Spring Boot分层架构 A[客户端] -->|HTTP 请求| B[Controller 层] …...

用友NC系列漏洞检测利用工具

声明&#xff01;本文章所有的工具分享仅仅只是供大家学习交流为主&#xff0c;切勿用于非法用途&#xff0c;如有任何触犯法律的行为&#xff0c;均与本人及团队无关&#xff01;&#xff01;&#xff01; 目录标题 YongYouNcTool启动及适配环境核心功能界面预览一键检测命令执…...

PostgreSQL 创建表格

PostgreSQL 创建表格 在数据库管理中&#xff0c;表格&#xff08;Table&#xff09;是数据存储的基础。PostgreSQL作为一款强大的开源对象关系型数据库管理系统&#xff08;ORDBMS&#xff09;&#xff0c;创建表格是其最基本的功能之一。本文将详细讲解如何在PostgreSQL中创…...

一周一个Unity小游戏2D反弹球游戏 - 球的死区及球重生

前言 本文将实现当球弹到球板下方的死亡区域后,球会被重置到球板上发射点,并且重置物理状态的逻辑。 创建球的死亡区 之前创建的在屏幕下方的空气墙碰撞体可以将其Is Trigger勾选上,让其成为一个触发器,用来检测球是否进入该区域,如下。 创建一个脚本名为Deadzone…...

<6>-MySQL表的增删查改

目录 一&#xff0c;create&#xff08;创建表&#xff09; 二&#xff0c;retrieve&#xff08;查询表&#xff09; 1&#xff0c;select列 2&#xff0c;where条件 三&#xff0c;update&#xff08;更新表&#xff09; 四&#xff0c;delete&#xff08;删除表&#xf…...

树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频

使用rpicam-app通过网络流式传输视频 使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素 文章来源&#xff1a; http://raspberry.dns8844.cn/documentation 原文网址 使用 rpicam-app 通过网络流式传输视频 本节介绍来自 rpica…...

定时器任务——若依源码分析

分析util包下面的工具类schedule utils&#xff1a; ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类&#xff0c;封装了定时任务的 创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz&#xff0c;先构建任务的 JobD…...

Python实现prophet 理论及参数优化

文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化 之前初步学习prophet的时候&#xff0c;写过一篇简单实现&#xff0c;后期随着对该模型的深入研究&#xff0c;本次记录涉及到prophet 的公式以及参数调优&#xff0c;从公式可以更直观…...

【Go】3、Go语言进阶与依赖管理

前言 本系列文章参考自稀土掘金上的 【字节内部课】公开课&#xff0c;做自我学习总结整理。 Go语言并发编程 Go语言原生支持并发编程&#xff0c;它的核心机制是 Goroutine 协程、Channel 通道&#xff0c;并基于CSP&#xff08;Communicating Sequential Processes&#xff0…...

Matlab | matlab常用命令总结

常用命令 一、 基础操作与环境二、 矩阵与数组操作(核心)三、 绘图与可视化四、 编程与控制流五、 符号计算 (Symbolic Math Toolbox)六、 文件与数据 I/O七、 常用函数类别重要提示这是一份 MATLAB 常用命令和功能的总结,涵盖了基础操作、矩阵运算、绘图、编程和文件处理等…...

云原生玩法三问:构建自定义开发环境

云原生玩法三问&#xff1a;构建自定义开发环境 引言 临时运维一个古董项目&#xff0c;无文档&#xff0c;无环境&#xff0c;无交接人&#xff0c;俗称三无。 运行设备的环境老&#xff0c;本地环境版本高&#xff0c;ssh不过去。正好最近对 腾讯出品的云原生 cnb 感兴趣&…...

DingDing机器人群消息推送

文章目录 1 新建机器人2 API文档说明3 代码编写 1 新建机器人 点击群设置 下滑到群管理的机器人&#xff0c;点击进入 添加机器人 选择自定义Webhook服务 点击添加 设置安全设置&#xff0c;详见说明文档 成功后&#xff0c;记录Webhook 2 API文档说明 点击设置说明 查看自…...

Canal环境搭建并实现和ES数据同步

作者&#xff1a;田超凡 日期&#xff1a;2025年6月7日 Canal安装&#xff0c;启动端口11111、8082&#xff1a; 安装canal-deployer服务端&#xff1a; https://github.com/alibaba/canal/releases/1.1.7/canal.deployer-1.1.7.tar.gz cd /opt/homebrew/etc mkdir canal…...

渗透实战PortSwigger Labs指南:自定义标签XSS和SVG XSS利用

阻止除自定义标签之外的所有标签 先输入一些标签测试&#xff0c;说是全部标签都被禁了 除了自定义的 自定义<my-tag onmouseoveralert(xss)> <my-tag idx onfocusalert(document.cookie) tabindex1> onfocus 当元素获得焦点时&#xff08;如通过点击或键盘导航&…...