当前位置: 首页 > news >正文

用感性的方式浅要了解什么是AI 与 大模型

什么是人工智能(AI)?

人工智能(Artificial Intelligence,简称 AI)是指由人制造出来的具有一定智能的系统,能够理解和学习人类的行为,并在某些任务上模仿人类的智能行为。这些任务包括学习、推理、问题解决、知识表示、规划、导航、自然语言处理、感知以及对环境的操控等。

AI的广义特性

将复杂的专业名词简单化,为我们所最知的,AI在扩展、翻译、查找、和总结方面具有多种特性和应用。这些特性使得 AI 能够处理大量的多语言文本数据,并提供高效、准确的翻译和总结服务。以下是 AI 在扩展翻译查找和总结方面的几个主要特性:

1、多语言支持

广泛的语种覆盖:现代 AI 翻译系统支持数百种语言,包括常用语言和一些小众语言。

跨语言理解:AI 能够理解和处理不同语言之间的细微差异,如语法结构、文化背景和表达方式。

2、高质量翻译

上下文感知:AI 翻译系统能够理解句子的上下文,从而提供更准确的翻译。例如,同一个词在不同的上下文中可能有不同的含义。

自然流畅:通过深度学习模型(如神经机器翻译),AI 能够生成更加自然流畅的翻译结果,减少机械感。

专业术语处理:AI 可以识别和处理特定领域的专业术语,确保翻译的专业性和准确性。

3、实时翻译

即时响应:AI 翻译系统可以实现实时翻译,适用于语音对话、在线聊天等多种场景。

低延迟:通过优化算法和计算资源,AI 翻译可以在极短的时间内完成翻译任务。

4、大规模数据处理

大数据处理能力:AI 系统可以处理和分析大量的文本数据,从中提取有用的信息。

并行处理:利用分布式计算和云计算技术,AI 可以并行处理多个翻译任务,提高效率。

5、自适应学习

持续改进:通过不断的学习和反馈,AI 翻译系统可以不断提高其翻译质量。

个性化定制:AI 可以根据用户的具体需求和偏好进行个性化调整,提供定制化的翻译服务。

下面举几个易懂的例子,AI的特性由浅入深,有具象到抽象都在生活中有着许多体现。

什么是大模型?

通过直接询问语言大模型,我们通常会得到以下答案。

亦或者这样

非人工智能专业的同学看到这样的东西恐怕很难理解。所以我们来对大模型进行一个感性一些的认知用更加朴实的方式认识它。

大模型在某种程度上,与人的大脑十分相似,这颗大脑由于多年在校学习的经验,理解了大量人类的通用知识,比如是基础的算数能力,基础的推理能力,了解基础的物理法则,知道人类的发展历史,甚至会说谎,而大模型在这些方面也一样。

 AI大模型本身是生成模型,其目标为根据输入来预测词元,本质上它并不关心你输入的是什么,它的目标只是为了让文本看起来更加完整。

这就导致了人们所说的大模型幻觉,例如说你问大模型,请描述一下我今天的早餐。尽管他并没有见过你,更不可能知道你的早餐吃了什么,但这不影响它可以清晰的描述出你的早餐。这是因为他读了大量的文档,人类的web网页,这些资料里描述早餐,就是这么说的。这就是大模型的幻觉。但我在自己尝试的时候,gpt并没有如期的展示预料种的大模型幻觉,可以通过减少生成随机性提高解码稳定性;使用强化学习等手段训练减少曝光误差;使用检索增强、模型参数修改或其他手段引入知识来避免一些大模型幻觉。

但这里跟我的大脑有哪里相似呢。换个说法,比如说你要上课了,但你没有交作业。老师问,你的作业呢?你会从自己的知识库里搜索,怎么回答比较合理。我忘记写了?昨天扶老奶奶过马路耽误写作业了?我的作业被狗吃了?还是我的作业发生了量子隧穿,消失了?然后根据概率来挑选一个答案回复老师。我的作业被狗吃了。对于你的老师来说,其实这也是一种幻觉,合理吗?理论上可能性是存在的,但通过人类基础认知来看,这大概率是假的。就像那个早餐描述,我自己看起来是假的,但从第三方的角度来看,他也有可能是真的。

众所周知呢,大模型一次支持的词元有上限的,超过了,大模型就会忽略。Chatgpt3.5目前最多一次支持的词元是4096,这个数据也是我直接问3.5的。而越来越卷的大模型行业也在将这个数值往上提。8k,32k,往后只会越来越多。

但他毕竟是有上限的,也就导致,你无法将一部144w字的莎士比亚全集全部录入进去。并让他直接给你总结中心思想。,这块看起来和人脑有些差别,毕竟一个一个正常大学生是可以在看完莎士比亚全集以后,和其他同学讲述的。

但这真的不一样吗,实际上我们在看书的时候,是一边看一边大脑在总结的。人物a,大概是什么形象,性格如何,他的关系网等等。当你看完一本书以后,你记住的是这本书的轮廓,和一些你感兴趣的部分。并做不到完全背诵。这涉及到短期长期记忆。

当你在看一个章节的时候,外部信息输入到大脑中,形成短期记忆,而短期记忆再由海马体进行有损压缩后进入长期记忆。而大模型的词元限制,就很像短期记忆方式,时间长了就会忘记,如果要分析较长的文本的时候,就可以选择每读取一段,分析一段。然后将这段内容的核心思想带入到下一段内容读取当中。甚至可以将这些内容存取到数据库中,下次启动这个任务的时候,再读取。

.接下来我们来讲一下AI agent,人工智能体。

ai agent是体现如何将大模型的推理能力进行充分的利用,组装成一个类人大脑,这里涉及到的主要有四个方面。

第一部分,planning,我们可以延申出Chain of thought、reflection、Chain of tree三块。这里的思维链和思维树,都是表达大模型通过某种思路步骤,可归纳为链状、或树状分支进行一系列线性解决问题的方式

第二部分memory,当大模型意识到输入的内容比较长,或者有长期价值的时候,就需要进行有意识的记忆存储以供后续的使用。

第三部分 tools 当大模型遇到自己不擅长的问题时,例如复杂计算、网络访问、等就需要使用工具库中的工具,这样可以极大的降低大模型出错概率。

第四部分 action 给这颗人造大脑装上四肢,让他可以真正的影响物理世界。

到这里对大模型应该就有了一定认识,当你不知道大模型能干嘛的时候,想想大脑可以干什么,就可以大概推测。

相关文章:

用感性的方式浅要了解什么是AI 与 大模型

什么是人工智能(AI)? 人工智能(Artificial Intelligence,简称 AI)是指由人制造出来的具有一定智能的系统,能够理解和学习人类的行为,并在某些任务上模仿人类的智能行为。这些任务包…...

Linux文件的查找和打包以及压缩

文件的查找 文件查找的用处,在我们需要文件但却又不知道文件在哪里的时候 文件查找存在着三种类型的查找 1、which或whereis:查找命令的程序文件位置 2、locate:也是一种文件查找,但是基于数据库的查找 3、find:针…...

专题十四_哈希表_算法专题详细解答

目录 哈希表简介 1. 两数之和(easy) 解析: 解法一:暴力: 解法二:哈希O(N) 总结: 2. 判断是否互为字符重排(easy) 解析: 哈希: 总结&…...

C++源码生成·序章

文章目录 C源码生成序章1 概述1.1 前言1.2 Python 易用性简介 2 使用 python 生成 c 源码2.1 运行脚本2.2 结果 3 项目启动3.1 项目概述3.2 环境准备3.3 克隆仓库3.4 查看标签(Tags)3.4 根据标签拉取代码3.5 后续步骤 C源码生成序章 1 概述 1.1 前言 …...

Android中的MVP模式

MVP(Model-View-Presenter)架构在 Android 开发中是一种流行的架构模式,它将业务逻辑和 UI 代码分离,通过 Presenter 来处理用户的操作和界面更新。MVP 提高了代码的可维护性和测试性,特别是 Presenter 中的逻辑可以单…...

kebuadm部署k8s集群

官方文档: Installing kubeadm | Kubernetes 切记要关闭防⽕墙、selinux、禁用交换空间, cpu核⼼数⾄少为2 内存4G kubeadm部署k8s⾼可用集群的官方文档: Creating Highly Available Clusters with kubeadm | Kubernetes 你需要在每台…...

Unity3D学习FPS游戏(2)简单场景、玩家移动控制

前言:上一篇的时候,我们已经导入了官方fps的素材,并且对三维模型有了一定了解。接下来我们要构建一个简单的场景让玩家能够有地方移动,然后写一个简单的玩家移动控制。 简单场景和玩家移动 简单场景玩家移动控制玩家模型视野-摄像…...

网上的 AQS 文章让我很失望

一、AQS 很多人都没有讲明白 🤔 翻看了网上的 AQS(AbstractQueuedSynchronizer)文章,质量参差不齐,大多数都是在关键处跳过、含糊其词,美其名曰 “传播知识” 。 大多数都是进行大段的源码粘贴和注释&…...

滑动窗口子串

文章目录 滑动窗口一、无重复字符的最长子串二、找到字符串中所有字母异位词 子串三、和为 K 的子数组四、滑动窗口最大值五、最小覆盖子串 滑动窗口 一、无重复字符的最长子串 题目链接 (方法一:暴力枚举) (方法二&#xff…...

【windows11 提示“Microsoft Visual C++ Runtime Library Runtime Error】

windows11 提示“Microsoft Visual C++ Runtime Library Runtime Error” 问题描述解决方法郑重声明:本人原创博文,都是实战,均经过实际项目验证出货的 转载请标明出处:攻城狮2015 Platform: windows OS:windows11 问题描述 解决方法 下载VisualCppRedist_AIO_x86_x64.exe 安…...

【leetcode|哈希表、动态规划】最长连续序列、最大子数组和

目录 最长连续序列 解法一:暴力枚举 复杂度 解法二:优化解法一省去二层循环中不必要的遍历 复杂度 最大子数组和 解法一:暴力枚举 复杂度 解法二:贪心 复杂度 解法三:动态规划 复杂度 最长连续序列 输入输…...

【人工智能】掌握深度学习中的时间序列预测:深入解析RNN与LSTM的工作原理与应用

深度学习中的循环神经网络(RNN)和长短时记忆网络(LSTM)在处理时间序列数据方面具有重要作用。它们能够通过记忆前序信息,捕捉序列数据中的长期依赖性,广泛应用于金融市场预测、自然语言处理、语音识别等领域…...

今日开放!24下软考机考「模拟练习平台」操作指南来啦!

2024年下半年软考机考模拟练习平台今日开放,考生可以下载模拟作答系统并登录后进行模拟练习,熟悉答题流程及操作方法。 一、模拟练习时间 2024年下半年软考机考模拟练习平台开放时间为2024年10月23日9:00至11月6日17:00,共15天。 考生可以在…...

合并.md文档

需求:将多个.md文档合并成一个.md文档。 方法一:通过 type 命令 参考内容:多个md文件合并 步骤: 把需要合并的 .md 文档放入到一个文件夹内。修改需要合并的 .md 文档名,可以在文档名前加上 1.2.3 来表明顺序&#x…...

10月18日笔记(基于系统服务的权限提升)

系统内核漏洞提权 当目标系统存在该漏洞且没有更新安全补丁时,利用已知的系统内核漏洞进行提权,测试人员往往可以获得系统级别的访问权限。 查找系统潜在漏洞 手动寻找可用漏洞 在目标主机上执行以下命令,查看已安装的系统补丁。 system…...

【STM32 Blue Pill编程实例】-控制步进电机(ULN2003+28BYJ-48)

控制步进电机(ULN2003+28BYJ-48) 文章目录 控制步进电机(ULN2003+28BYJ-48)1、步进电机介绍2、ULN2003步进电机驱动模块3、硬件准备及接线4、模块配置3.1 定时器配置3.2 ULN2003输入引脚配置4、代码实现在本文中,我们将介使用 STM32Cube IDE 使用 ULN2003 电机驱动器来控制28B…...

监督学习、无监督学习、半监督学习、强化学习、迁移学习、集成学习分别是什么对应什么应用场景

将对监督学习、无监督学习、半监督学习、强化学习、迁移学习和集成学习进行全面而详细的解释,包括定义、应用场景以及具体的算法/模型示例。 1. 监督学习 (Supervised Learning) 定义:监督学习是一种机器学习方法,其中模型通过已知的输入数…...

WSL2 Linux子系统调整存储位置

WSL2 默认不支持修改Linux 安装路径,官方提供的方式,只有通过导出、导入的方式实现Linux子系统的迁移。 修改注册表的方式官方不推荐,没有尝试过,仅提供操作方式(自行评估风险,建议备份好数据) 1. 打开 **注册表编辑器…...

Shiro授权

一、定义与作用 授权(Authorization),也称为访问控制,是确定是否允许用户/主体做某事的过程。在Shiro安全框架中,授权是核心组件之一,它负责控制用户对系统资源的访问权限,确保用户只能访问其被…...

算法题总结(十五)——贪心算法(下)

1005、K 次取反后最大化的数组和 给你一个整数数组 nums 和一个整数 k ,按以下方法修改该数组: 选择某个下标 i 并将 nums[i] 替换为 -nums[i] 。 重复这个过程恰好 k 次。可以多次选择同一个下标 i 。 以这种方式修改数组后,返回数组 可…...

Objective-C常用命名规范总结

【OC】常用命名规范总结 文章目录 【OC】常用命名规范总结1.类名(Class Name)2.协议名(Protocol Name)3.方法名(Method Name)4.属性名(Property Name)5.局部变量/实例变量(Local / Instance Variables&…...

蓝牙 BLE 扫描面试题大全(2):进阶面试题与实战演练

前文覆盖了 BLE 扫描的基础概念与经典问题蓝牙 BLE 扫描面试题大全(1):从基础到实战的深度解析-CSDN博客,但实际面试中,企业更关注候选人对复杂场景的应对能力(如多设备并发扫描、低功耗与高发现率的平衡)和前沿技术的…...

从零实现STL哈希容器:unordered_map/unordered_set封装详解

本篇文章是对C学习的STL哈希容器自主实现部分的学习分享 希望也能为你带来些帮助~ 那咱们废话不多说&#xff0c;直接开始吧&#xff01; 一、源码结构分析 1. SGISTL30实现剖析 // hash_set核心结构 template <class Value, class HashFcn, ...> class hash_set {ty…...

Spring Boot+Neo4j知识图谱实战:3步搭建智能关系网络!

一、引言 在数据驱动的背景下&#xff0c;知识图谱凭借其高效的信息组织能力&#xff0c;正逐步成为各行业应用的关键技术。本文聚焦 Spring Boot与Neo4j图数据库的技术结合&#xff0c;探讨知识图谱开发的实现细节&#xff0c;帮助读者掌握该技术栈在实际项目中的落地方法。 …...

关键领域软件测试的突围之路:如何破解安全与效率的平衡难题

在数字化浪潮席卷全球的今天&#xff0c;软件系统已成为国家关键领域的核心战斗力。不同于普通商业软件&#xff0c;这些承载着国家安全使命的软件系统面临着前所未有的质量挑战——如何在确保绝对安全的前提下&#xff0c;实现高效测试与快速迭代&#xff1f;这一命题正考验着…...

SAP学习笔记 - 开发26 - 前端Fiori开发 OData V2 和 V4 的差异 (Deepseek整理)

上一章用到了V2 的概念&#xff0c;其实 Fiori当中还有 V4&#xff0c;咱们这一章来总结一下 V2 和 V4。 SAP学习笔记 - 开发25 - 前端Fiori开发 Remote OData Service(使用远端Odata服务)&#xff0c;代理中间件&#xff08;ui5-middleware-simpleproxy&#xff09;-CSDN博客…...

【Go语言基础【13】】函数、闭包、方法

文章目录 零、概述一、函数基础1、函数基础概念2、参数传递机制3、返回值特性3.1. 多返回值3.2. 命名返回值3.3. 错误处理 二、函数类型与高阶函数1. 函数类型定义2. 高阶函数&#xff08;函数作为参数、返回值&#xff09; 三、匿名函数与闭包1. 匿名函数&#xff08;Lambda函…...

处理vxe-table 表尾数据是单独一个接口,表格tableData数据更新后,需要点击两下,表尾才是正确的

修改bug思路&#xff1a; 分别把 tabledata 和 表尾相关数据 console.log() 发现 更新数据先后顺序不对 settimeout延迟查询表格接口 ——测试可行 升级↑&#xff1a;async await 等接口返回后再开始下一个接口查询 ________________________________________________________…...

Kafka入门-生产者

生产者 生产者发送流程&#xff1a; 延迟时间为0ms时&#xff0c;也就意味着每当有数据就会直接发送 异步发送API 异步发送和同步发送的不同在于&#xff1a;异步发送不需要等待结果&#xff0c;同步发送必须等待结果才能进行下一步发送。 普通异步发送 首先导入所需的k…...

DingDing机器人群消息推送

文章目录 1 新建机器人2 API文档说明3 代码编写 1 新建机器人 点击群设置 下滑到群管理的机器人&#xff0c;点击进入 添加机器人 选择自定义Webhook服务 点击添加 设置安全设置&#xff0c;详见说明文档 成功后&#xff0c;记录Webhook 2 API文档说明 点击设置说明 查看自…...