AI“胡说八道”?怎么解?
原创 | 文 BFT机器人

01
引言
近年来,人工智能产业迅猛发展,大型语言模型GPT-4发展势头强劲,OpenAI推出ChatGPT、微软推出Bing、马斯克推出“最好的聊天机器人Grok”……科技巨头纷纷入局AI领域,引入人工智能作为办公工具的行业也越来越多。
人工智能的便利性,让人们越来越依赖它的帮助,正因如此,AI的各项危机也逐渐浮现。人们在寻求AI帮助的时候,往往抱着信任的态度,而AI却也可能会传递错误讯息。
02
什么是人工智能幻觉?
人工智能幻觉是指人工智能模型在处理数据或执行任务时产生的自我欺骗现象。
近日,剑桥词典公布2023年度词语:“Hallucinate”。这个词的释义原本为“似乎看到、听到、感觉到或闻到一些不存在的东西,通常是因为健康状况或因为你服用了某种药物而产生幻觉”。但在AI时代的背景下,“Hallucinate”新增了一个注解:“当AI制造幻觉,它会产生错误讯息”。
剑桥词典官方对选择“Hallucinate”为年度代表词做出了解释:新含义“触及了人们正在谈论的AI核心”。

图片来源:新浪网
“幻觉”的含义是:在没有相应的外部或躯体刺激的情况下的感觉知觉,并根据其发生的感觉域进行描述。无论是否了解幻觉的本质,幻觉都可能发生。人工智能幻觉隐喻性地借鉴了这个概念,将人工智能产生的不准确信息描述为“幻觉”。
举个例子:
1.图像识别领域:一张包含斑点的狗的照片可能被错误地识别为豹子,这种错误识别即是幻觉的一种表现。
2.自然语言处理:人工智能模型可能产生语法不通或语义混乱的句子,甚至是完全无意义的文字。这可能导致误解、信息错误传达或者根本无法理解的输出结果,称为语言领域的幻觉。
人工智能幻觉有很多种类型,但所有这些都归结为同一个问题:混合和匹配它们接受过训练的数据,以生成一些全新的错误的东西。这些幻觉现象可能会对人工智能应用的可靠性和准确性造成严重影响。

03
人工智能的答案可信吗?
生成式人工智能的诞生,推动了AI产业的发展,人们对于人工智能的评价多为肯定。人工智能聊天机器人擅长从不同来源收集信息,并将其以对话式、易于理解的格式合成。
但许多人在使用人工智能时,发现AI给出了不合理的结论,甚至是彻头彻尾的谎言。AI的许多回应都很滑稽。例如,ChatGPT收集了很多公众人物的出生和死亡日期,但无法明确表明他(她)已经死亡;它还声称有人徒步穿越英吉利海峡,金门大桥两次穿越埃及;谷歌的巴德声称詹姆斯·韦伯太空望远镜拍摄到了太阳系以外行星的第一张图像,而事实上,第一张此类图像是由另一台望远镜在2004年拍摄的。
这些例子引出了一个词:“人工智能幻觉”。大型语言模型(LLM)生成的信息与现实的关系很微妙。其中一些内容似乎完全是捏造的,而另一些似乎借鉴事实虚构的,对于空白内容,人工智能会引用不相关内容填充。
调查显示,这些不准确的回复内容在人工智能的应用中非常常见,而人类的反馈对于确保它们不会完全偏离轨道至关重要。

04
人工智能幻觉是怎么产生的?
目前,对于人工智能幻觉产生的原因众说纷纭。研究人员认为,人工智能环境的现象与设计和测试期间数据提供不足有关。人工智能技术在不断发展,但支持AI产品运转的数据不充分,这会导致人工智能给出的答案偏离轨道。
另外,人工智能没有情感,它们通过算法理解用户的诉求,而有些问题人工智能无法理解,它们就有可能给出无意义或不准确的答案。
05
为什么人工智能幻觉是一个问题?
人工智能幻觉的产生根植于模型的处理复杂性以及对输入数据的误解。模型可能在处理数据时过于注重某些特定特征,而忽略了其他重要的上下文信息。
如今有数百万人使用人工智能,有些人是出于好奇,有些人则把人工智能当做生活工作的工具,甚至有很多人非常依赖和信任人工智能。而人工智能平台已经多次出现提供错误信息的现象,使人们对失误的认知造成影响。

如果生活中的错误是小事,那么当人工智能用于关于生命的领域时,会直接影响到结果。例如:在医疗诊断中,人工智能模型的幻觉可能导致错误的疾病诊断,严重威胁患者的健康;在自动驾驶汽车领域,幻觉可能导致错误的环境感知,增加交通事故的风险。
人工智能幻觉也可能在社会层面引发问题。误导性的信息输出可能导致负面影响,例如在社交媒体传播虚假新闻,影响公共舆论。
人工智能幻觉的问题不仅仅是技术发展中的拦路虎,更是社会发展中的潜在风险。
06
人工智能幻觉问题怎么解决?
在迎接人工智能时代的挑战中,OpenAI提出的“过程监督”策略为解决“AI幻觉”问题提供了新的思路。通过奖励大模型每个正确的推理步骤,而非简单地奖励最终答案,这一方法为人工智能的发展注入了更多的透明度和可信度。

图片来源:新浪网
然而,我们作为使用者,同样有责任保持警惕,不能完全信赖人工智能平台给出的答案。要积极参与反馈,及时指出错误,让技术人员尽快修补人工智能的漏洞,确保其他人在问相类似问题时人工智能不再给出错误答案。
另外,开发者也需要投入更多的时间测试人工智能、寻找更多的数据支持,让模型尽可能多地熟悉数据,并不断更新支持模型运转的数据,确保模型数据来源的真实性。
注:部分图片来源网络
注:文章版权归原作者所有,如有不妥,请联系删除。
相关文章:
AI“胡说八道”?怎么解?
原创 | 文 BFT机器人 01 引言 近年来,人工智能产业迅猛发展,大型语言模型GPT-4发展势头强劲,OpenAI推出ChatGPT、微软推出Bing、马斯克推出“最好的聊天机器人Grok”……科技巨头纷纷入局AI领域,引入人工智能作为办公工具的行业…...
[SIGGRAPH-23] 3D Gaussian Splatting for Real-Time Radiance Field Rendering
pdf | proj | code 本文提出一种新的3D数据表达形式3D Gaussians。每个Gaussian由以下参数组成:中心点位置、协方差矩阵、可见性、颜色。通过世界坐标系到相机坐标系,再到图像坐标系的仿射关系,可将3D Gaussian映射到相机坐标系,通…...
大话设计模式C++实现
大话设计模式,讲得非常好,但是作者是用C#写的,为了方便C程序员,使用C写了大话设计模式的代码 详情见Github:https://github.com/liubamboo/BigTalkDesignPattern...
IT 领域中的主要自动化趋势
48%的IT自动化流程属于IT服务管理,过去一年中,IT运维自动化增长了272%。 IT部门从交付者转变为战略伙伴 今年的《工作自动化指数》数据显示,自动化正在蔓延到组织的各个部门,越来越多的部门采用自动化,并且IT以外的员工…...
使用Python解析CAN总线
缘起 在新能源车辆的开发和维护中,经常需要对CAN总线数据进行分析。CANOE等总线软件虽然方便,但功能有限,难以满足数据分析的要求。Matlab的Vehicle Network Toolbox可以方便的进行数据解析和分析,它是闭源且收费的。因此&#x…...
DevExpress中文教程 - 如何在macOS和Linux (CTP)上创建、修改报表(下)
DevExpress Reporting是.NET Framework下功能完善的报表平台,它附带了易于使用的Visual Studio报表设计器和丰富的报表控件集,包括数据透视表、图表,因此您可以构建无与伦比、信息清晰的报表。 DevExpress Reports — 跨平台报表组件&#x…...
RAID的应用场景以及优缺点
RAID 0(条带化): 工作原理: 数据被分成块,每个块写入不同的驱动器,以并行方式提高读写性能。 优势: 卓越的性能提升,特别是对于大型文件的读写操作。 劣势: 完全没有冗余,一个驱动器…...
java SpringCloud版本b2b2c鸿鹄云商平台全套解决方案 小程序商城免费搭建
使用技术: Spring CloudSpring BootMybatis微服务服务监控可视化运营 B2B2C平台: 平台管理端(包含自营) 商家平台端(多商户入驻) PC买家端、手机wap/公众号买家端 微服务(30个通用微服务如:商品、订单、购物车、个人中心、支…...
[Linux] shell脚本的函数和数组
一、函数 1.1 函数的定义 函数是脚本的别名 作用:函数可以避免代码重复,可读性强,可以简化脚本。 格式:函数名(){脚本} 1.2 如何使用函数 1.定义 2.调用 函数一定要先定义再使用 例子:…...
万宾科技智能井盖的效果怎么样?
日常出行过程中,人们最不想看到交通拥堵或者道路维修等现象,因为这代表出行受到影响甚至会导致不能按时赴约等。所以城市路面的安全和稳定,是市民朋友非常关心的话题。骑行在路上的时候,如果经过井盖时发出异常声响,骑…...
nvm切换版本之后npm用不了
原因是 nvm只给你安了对应的node没给你安装对应的node版本的npm 解决办法如下 1找到你安装的node版本号 然后去官网下载对应的版本包 这个网址就是node官网的版本列表 Index of /download/release/ 2下载后解压 把根目录这俩复制到自己的nvm安装目录下 还有那个node_modul…...
【elementui】el-popover在列表里循环使用,取消的doClose无效解决办法
目录 一、需求效果二、代码详情html方法接口 一、需求效果 在使用elementui的Popover 弹出框时,需求是在table列表里使用,循环出来,无法取消。 二、代码详情 html <el-table-column v-if"checkPermission([admin,user:resetPass…...
postgresql安装fdw扩展
最近有同一个服务器不同数据库、不同服务器数据库之间的数据同步需求,使用了fdw 下面举例的是同一个服务器两个不同数据库的同步情况 1、安装扩展 create extension postgres_fdw; 在需要使用fdw的数据库都加上该扩展 2、创建fdw服务器 mlhbase_prd库 CREATE…...
反爬虫机制与反爬虫技术(二)
反爬虫机制与反爬虫技术二 1、动态页面处理与验证码识别概述2、反爬虫案例:页面登录与滑块验证码处理2.1、用例简介2.2、库(模块)简介2.3、网页分析2.4、Selenium准备操作2.5、页面登录2.6、模糊移动滑块测试3、滑块验证码处理:精确移动滑块3.1、精确移动滑块的原理3.2、滑…...
Grails 启动
Grails系列 Grails项目启动 文章目录 Grails系列Grails一、项目创建二、可能的问题1.依赖下载2.项目导入到idea失败3.项目导入到idea后运行报错 Grails Grails是一款基于Groovy语言的Web应用程序框架,它使用了许多流行的开源技术,如Spring Framework、…...
2023年亚太地区数学建模大赛 问题A
采果机器人的图像识别技术 中国是世界上最大的苹果生产国,年产量约为3500万吨。与此同时,中国也是世界上最大的苹果出口国,全球每两个苹果中就有一个,全球超过六分之一的苹果出口自中国。中国提出了一带一路倡议(BRI&…...
基于springboot实现校园在线拍卖系统项目【项目源码】
基于springboot实现校园在线拍卖系统演示 Javar技术 JavaScript是一种网络脚本语言,广泛运用于web应用开发,可以用来添加网页的格式动态效果,该语言不用进行预编译就直接运行,可以直接嵌入HTML语言中,写成js语言&…...
详解ES6的Promise
ES6(ECMAScript 6)是JavaScript的一种标准,也被称为ES2015。它是在2015年发布的第六个ECMAScript标准版本,引入了许多新的语法和特性来增强JavaScript的功能和可读性。 文章目录 一、创建promise 二、处理Promise 三.Promise链…...
多语言快速排序算法
快速排序是一种高效的排序算法,使用分治法策略。它的基本思想是:选择一个元素作为“基准”(pivot),重新排序数列,所有比基准值小的元素摆放在基准前面,所有比基准值大的摆在基准的后面。在这个分…...
IDEA运行Tomcat出现乱码问题解决汇总
最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…...
利用最小二乘法找圆心和半径
#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …...
深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录
ASP.NET Core 是一个跨平台的开源框架,用于在 Windows、macOS 或 Linux 上生成基于云的新式 Web 应用。 ASP.NET Core 中的日志记录 .NET 通过 ILogger API 支持高性能结构化日志记录,以帮助监视应用程序行为和诊断问题。 可以通过配置不同的记录提供程…...
Ubuntu系统下交叉编译openssl
一、参考资料 OpenSSL&&libcurl库的交叉编译 - hesetone - 博客园 二、准备工作 1. 编译环境 宿主机:Ubuntu 20.04.6 LTSHost:ARM32位交叉编译器:arm-linux-gnueabihf-gcc-11.1.0 2. 设置交叉编译工具链 在交叉编译之前&#x…...
超短脉冲激光自聚焦效应
前言与目录 强激光引起自聚焦效应机理 超短脉冲激光在脆性材料内部加工时引起的自聚焦效应,这是一种非线性光学现象,主要涉及光学克尔效应和材料的非线性光学特性。 自聚焦效应可以产生局部的强光场,对材料产生非线性响应,可能…...
盘古信息PCB行业解决方案:以全域场景重构,激活智造新未来
一、破局:PCB行业的时代之问 在数字经济蓬勃发展的浪潮中,PCB(印制电路板)作为 “电子产品之母”,其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透,PCB行业面临着前所未有的挑战与机遇。产品迭代…...
Oracle查询表空间大小
1 查询数据库中所有的表空间以及表空间所占空间的大小 SELECTtablespace_name,sum( bytes ) / 1024 / 1024 FROMdba_data_files GROUP BYtablespace_name; 2 Oracle查询表空间大小及每个表所占空间的大小 SELECTtablespace_name,file_id,file_name,round( bytes / ( 1024 …...
如何在看板中体现优先级变化
在看板中有效体现优先级变化的关键措施包括:采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中,设置任务排序规则尤其重要,因为它让看板视觉上直观地体…...
基于数字孪生的水厂可视化平台建设:架构与实践
分享大纲: 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效 近几年,数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段,基于数字孪生的水厂可视化平台的…...
听写流程自动化实践,轻量级教育辅助
随着智能教育工具的发展,越来越多的传统学习方式正在被数字化、自动化所优化。听写作为语文、英语等学科中重要的基础训练形式,也迎来了更高效的解决方案。 这是一款轻量但功能强大的听写辅助工具。它是基于本地词库与可选在线语音引擎构建,…...
