AI“胡说八道”?怎么解?
原创 | 文 BFT机器人

01
引言
近年来,人工智能产业迅猛发展,大型语言模型GPT-4发展势头强劲,OpenAI推出ChatGPT、微软推出Bing、马斯克推出“最好的聊天机器人Grok”……科技巨头纷纷入局AI领域,引入人工智能作为办公工具的行业也越来越多。
人工智能的便利性,让人们越来越依赖它的帮助,正因如此,AI的各项危机也逐渐浮现。人们在寻求AI帮助的时候,往往抱着信任的态度,而AI却也可能会传递错误讯息。
02
什么是人工智能幻觉?
人工智能幻觉是指人工智能模型在处理数据或执行任务时产生的自我欺骗现象。
近日,剑桥词典公布2023年度词语:“Hallucinate”。这个词的释义原本为“似乎看到、听到、感觉到或闻到一些不存在的东西,通常是因为健康状况或因为你服用了某种药物而产生幻觉”。但在AI时代的背景下,“Hallucinate”新增了一个注解:“当AI制造幻觉,它会产生错误讯息”。
剑桥词典官方对选择“Hallucinate”为年度代表词做出了解释:新含义“触及了人们正在谈论的AI核心”。

图片来源:新浪网
“幻觉”的含义是:在没有相应的外部或躯体刺激的情况下的感觉知觉,并根据其发生的感觉域进行描述。无论是否了解幻觉的本质,幻觉都可能发生。人工智能幻觉隐喻性地借鉴了这个概念,将人工智能产生的不准确信息描述为“幻觉”。
举个例子:
1.图像识别领域:一张包含斑点的狗的照片可能被错误地识别为豹子,这种错误识别即是幻觉的一种表现。
2.自然语言处理:人工智能模型可能产生语法不通或语义混乱的句子,甚至是完全无意义的文字。这可能导致误解、信息错误传达或者根本无法理解的输出结果,称为语言领域的幻觉。
人工智能幻觉有很多种类型,但所有这些都归结为同一个问题:混合和匹配它们接受过训练的数据,以生成一些全新的错误的东西。这些幻觉现象可能会对人工智能应用的可靠性和准确性造成严重影响。

03
人工智能的答案可信吗?
生成式人工智能的诞生,推动了AI产业的发展,人们对于人工智能的评价多为肯定。人工智能聊天机器人擅长从不同来源收集信息,并将其以对话式、易于理解的格式合成。
但许多人在使用人工智能时,发现AI给出了不合理的结论,甚至是彻头彻尾的谎言。AI的许多回应都很滑稽。例如,ChatGPT收集了很多公众人物的出生和死亡日期,但无法明确表明他(她)已经死亡;它还声称有人徒步穿越英吉利海峡,金门大桥两次穿越埃及;谷歌的巴德声称詹姆斯·韦伯太空望远镜拍摄到了太阳系以外行星的第一张图像,而事实上,第一张此类图像是由另一台望远镜在2004年拍摄的。
这些例子引出了一个词:“人工智能幻觉”。大型语言模型(LLM)生成的信息与现实的关系很微妙。其中一些内容似乎完全是捏造的,而另一些似乎借鉴事实虚构的,对于空白内容,人工智能会引用不相关内容填充。
调查显示,这些不准确的回复内容在人工智能的应用中非常常见,而人类的反馈对于确保它们不会完全偏离轨道至关重要。

04
人工智能幻觉是怎么产生的?
目前,对于人工智能幻觉产生的原因众说纷纭。研究人员认为,人工智能环境的现象与设计和测试期间数据提供不足有关。人工智能技术在不断发展,但支持AI产品运转的数据不充分,这会导致人工智能给出的答案偏离轨道。
另外,人工智能没有情感,它们通过算法理解用户的诉求,而有些问题人工智能无法理解,它们就有可能给出无意义或不准确的答案。
05
为什么人工智能幻觉是一个问题?
人工智能幻觉的产生根植于模型的处理复杂性以及对输入数据的误解。模型可能在处理数据时过于注重某些特定特征,而忽略了其他重要的上下文信息。
如今有数百万人使用人工智能,有些人是出于好奇,有些人则把人工智能当做生活工作的工具,甚至有很多人非常依赖和信任人工智能。而人工智能平台已经多次出现提供错误信息的现象,使人们对失误的认知造成影响。

如果生活中的错误是小事,那么当人工智能用于关于生命的领域时,会直接影响到结果。例如:在医疗诊断中,人工智能模型的幻觉可能导致错误的疾病诊断,严重威胁患者的健康;在自动驾驶汽车领域,幻觉可能导致错误的环境感知,增加交通事故的风险。
人工智能幻觉也可能在社会层面引发问题。误导性的信息输出可能导致负面影响,例如在社交媒体传播虚假新闻,影响公共舆论。
人工智能幻觉的问题不仅仅是技术发展中的拦路虎,更是社会发展中的潜在风险。
06
人工智能幻觉问题怎么解决?
在迎接人工智能时代的挑战中,OpenAI提出的“过程监督”策略为解决“AI幻觉”问题提供了新的思路。通过奖励大模型每个正确的推理步骤,而非简单地奖励最终答案,这一方法为人工智能的发展注入了更多的透明度和可信度。

图片来源:新浪网
然而,我们作为使用者,同样有责任保持警惕,不能完全信赖人工智能平台给出的答案。要积极参与反馈,及时指出错误,让技术人员尽快修补人工智能的漏洞,确保其他人在问相类似问题时人工智能不再给出错误答案。
另外,开发者也需要投入更多的时间测试人工智能、寻找更多的数据支持,让模型尽可能多地熟悉数据,并不断更新支持模型运转的数据,确保模型数据来源的真实性。
注:部分图片来源网络
注:文章版权归原作者所有,如有不妥,请联系删除。
相关文章:
AI“胡说八道”?怎么解?
原创 | 文 BFT机器人 01 引言 近年来,人工智能产业迅猛发展,大型语言模型GPT-4发展势头强劲,OpenAI推出ChatGPT、微软推出Bing、马斯克推出“最好的聊天机器人Grok”……科技巨头纷纷入局AI领域,引入人工智能作为办公工具的行业…...
[SIGGRAPH-23] 3D Gaussian Splatting for Real-Time Radiance Field Rendering
pdf | proj | code 本文提出一种新的3D数据表达形式3D Gaussians。每个Gaussian由以下参数组成:中心点位置、协方差矩阵、可见性、颜色。通过世界坐标系到相机坐标系,再到图像坐标系的仿射关系,可将3D Gaussian映射到相机坐标系,通…...
大话设计模式C++实现
大话设计模式,讲得非常好,但是作者是用C#写的,为了方便C程序员,使用C写了大话设计模式的代码 详情见Github:https://github.com/liubamboo/BigTalkDesignPattern...
IT 领域中的主要自动化趋势
48%的IT自动化流程属于IT服务管理,过去一年中,IT运维自动化增长了272%。 IT部门从交付者转变为战略伙伴 今年的《工作自动化指数》数据显示,自动化正在蔓延到组织的各个部门,越来越多的部门采用自动化,并且IT以外的员工…...
使用Python解析CAN总线
缘起 在新能源车辆的开发和维护中,经常需要对CAN总线数据进行分析。CANOE等总线软件虽然方便,但功能有限,难以满足数据分析的要求。Matlab的Vehicle Network Toolbox可以方便的进行数据解析和分析,它是闭源且收费的。因此&#x…...
DevExpress中文教程 - 如何在macOS和Linux (CTP)上创建、修改报表(下)
DevExpress Reporting是.NET Framework下功能完善的报表平台,它附带了易于使用的Visual Studio报表设计器和丰富的报表控件集,包括数据透视表、图表,因此您可以构建无与伦比、信息清晰的报表。 DevExpress Reports — 跨平台报表组件&#x…...
RAID的应用场景以及优缺点
RAID 0(条带化): 工作原理: 数据被分成块,每个块写入不同的驱动器,以并行方式提高读写性能。 优势: 卓越的性能提升,特别是对于大型文件的读写操作。 劣势: 完全没有冗余,一个驱动器…...
java SpringCloud版本b2b2c鸿鹄云商平台全套解决方案 小程序商城免费搭建
使用技术: Spring CloudSpring BootMybatis微服务服务监控可视化运营 B2B2C平台: 平台管理端(包含自营) 商家平台端(多商户入驻) PC买家端、手机wap/公众号买家端 微服务(30个通用微服务如:商品、订单、购物车、个人中心、支…...
[Linux] shell脚本的函数和数组
一、函数 1.1 函数的定义 函数是脚本的别名 作用:函数可以避免代码重复,可读性强,可以简化脚本。 格式:函数名(){脚本} 1.2 如何使用函数 1.定义 2.调用 函数一定要先定义再使用 例子:…...
万宾科技智能井盖的效果怎么样?
日常出行过程中,人们最不想看到交通拥堵或者道路维修等现象,因为这代表出行受到影响甚至会导致不能按时赴约等。所以城市路面的安全和稳定,是市民朋友非常关心的话题。骑行在路上的时候,如果经过井盖时发出异常声响,骑…...
nvm切换版本之后npm用不了
原因是 nvm只给你安了对应的node没给你安装对应的node版本的npm 解决办法如下 1找到你安装的node版本号 然后去官网下载对应的版本包 这个网址就是node官网的版本列表 Index of /download/release/ 2下载后解压 把根目录这俩复制到自己的nvm安装目录下 还有那个node_modul…...
【elementui】el-popover在列表里循环使用,取消的doClose无效解决办法
目录 一、需求效果二、代码详情html方法接口 一、需求效果 在使用elementui的Popover 弹出框时,需求是在table列表里使用,循环出来,无法取消。 二、代码详情 html <el-table-column v-if"checkPermission([admin,user:resetPass…...
postgresql安装fdw扩展
最近有同一个服务器不同数据库、不同服务器数据库之间的数据同步需求,使用了fdw 下面举例的是同一个服务器两个不同数据库的同步情况 1、安装扩展 create extension postgres_fdw; 在需要使用fdw的数据库都加上该扩展 2、创建fdw服务器 mlhbase_prd库 CREATE…...
反爬虫机制与反爬虫技术(二)
反爬虫机制与反爬虫技术二 1、动态页面处理与验证码识别概述2、反爬虫案例:页面登录与滑块验证码处理2.1、用例简介2.2、库(模块)简介2.3、网页分析2.4、Selenium准备操作2.5、页面登录2.6、模糊移动滑块测试3、滑块验证码处理:精确移动滑块3.1、精确移动滑块的原理3.2、滑…...
Grails 启动
Grails系列 Grails项目启动 文章目录 Grails系列Grails一、项目创建二、可能的问题1.依赖下载2.项目导入到idea失败3.项目导入到idea后运行报错 Grails Grails是一款基于Groovy语言的Web应用程序框架,它使用了许多流行的开源技术,如Spring Framework、…...
2023年亚太地区数学建模大赛 问题A
采果机器人的图像识别技术 中国是世界上最大的苹果生产国,年产量约为3500万吨。与此同时,中国也是世界上最大的苹果出口国,全球每两个苹果中就有一个,全球超过六分之一的苹果出口自中国。中国提出了一带一路倡议(BRI&…...
基于springboot实现校园在线拍卖系统项目【项目源码】
基于springboot实现校园在线拍卖系统演示 Javar技术 JavaScript是一种网络脚本语言,广泛运用于web应用开发,可以用来添加网页的格式动态效果,该语言不用进行预编译就直接运行,可以直接嵌入HTML语言中,写成js语言&…...
详解ES6的Promise
ES6(ECMAScript 6)是JavaScript的一种标准,也被称为ES2015。它是在2015年发布的第六个ECMAScript标准版本,引入了许多新的语法和特性来增强JavaScript的功能和可读性。 文章目录 一、创建promise 二、处理Promise 三.Promise链…...
多语言快速排序算法
快速排序是一种高效的排序算法,使用分治法策略。它的基本思想是:选择一个元素作为“基准”(pivot),重新排序数列,所有比基准值小的元素摆放在基准前面,所有比基准值大的摆在基准的后面。在这个分…...
Sunshine游戏串流服务器:三步搭建你的跨平台游戏乐园
Sunshine游戏串流服务器:三步搭建你的跨平台游戏乐园 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 想要在任何设备上畅玩PC游戏吗?Sunshine作为一款免费开…...
从开发到部署:手把手教你用Qt Creator为Jetson Nano配置交叉编译套件(Qt5.14.2 + OpenGL)
从开发到部署:Qt Creator与Jetson Nano的OpenGL开发环境实战指南 在嵌入式开发领域,将Qt应用部署到ARM架构设备上一直是个既充满挑战又极具价值的技术课题。当开发者需要在x86主机上为Jetson Nano这样的嵌入式设备开发Qt应用时,交叉编译环境的…...
FanControl终极指南:Windows电脑风扇控制的完整解决方案
FanControl终极指南:Windows电脑风扇控制的完整解决方案 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/…...
windows在使用ping 127.0.0.1时出现一般故障的解决方案
大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…...
高效节能指南:如何用EnergyStarX轻松提升Windows 11笔记本续航能力
高效节能指南:如何用EnergyStarX轻松提升Windows 11笔记本续航能力 【免费下载链接】EnergyStarX 🔋 Improve your Windows 11 devices battery life. A WinUI 3 GUI for https://github.com/imbushuo/EnergyStar. 项目地址: https://gitcode.com/gh_m…...
WideSearch:评测LLM智能体广度信息搜集能力的基准测试集
1. 项目概述:当AI智能体遇上“大海捞针”式信息搜集大家好,我是Ryan,在字节跳动Seed团队负责大模型智能体相关的研究与工程落地。今天想和大家深入聊聊我们最近开源的一个新玩意儿——WideSearch。如果你正在研究或应用LLM智能体(…...
GnuPG 2.5.19 版本发布:新增功能、修复漏洞,旧版 2 个月后停维!
什么是 GnuPGGNU 隐私卫士(GnuPG,GPG)是 OpenPGP 和 S/MIME 标准的完整且免费的实现。它能对数据和通信进行加密和签名,有多功能的密钥管理系统,还有访问公钥目录的模块。GnuPG 本身是命令行工具,方便和其他…...
2025届毕业生推荐的降AI率神器实测分析
Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 想要把文本被人工智能检测工具识别的概率给降下来,就得要从词汇多元化以及句式复…...
除了花生壳,还有哪些免费/开源的内网穿透工具能帮你实现SSH远程办公?
5款开源内网穿透工具深度评测:SSH远程办公的替代方案 当我们需要在外网访问公司或家中的服务器时,商业内网穿透服务虽然方便,但往往存在费用高、隐私顾虑等问题。作为一名长期使用开源工具的开发者,我测试了市面上主流的几款开源…...
如何高效使用F3D三维查看器:现代3D预览的完整指南
如何高效使用F3D三维查看器:现代3D预览的完整指南 【免费下载链接】f3d Fast and minimalist 3D viewer. 项目地址: https://gitcode.com/GitHub_Trending/f3/f3d F3D三维查看器是一款革命性的开源3D模型预览工具,以其极致的速度和简约的设计理念…...
