当前位置: 首页 > news >正文

用感性的方式浅要了解什么是AI 与 大模型

什么是人工智能(AI)?

人工智能(Artificial Intelligence,简称 AI)是指由人制造出来的具有一定智能的系统,能够理解和学习人类的行为,并在某些任务上模仿人类的智能行为。这些任务包括学习、推理、问题解决、知识表示、规划、导航、自然语言处理、感知以及对环境的操控等。

AI的广义特性

将复杂的专业名词简单化,为我们所最知的,AI在扩展、翻译、查找、和总结方面具有多种特性和应用。这些特性使得 AI 能够处理大量的多语言文本数据,并提供高效、准确的翻译和总结服务。以下是 AI 在扩展翻译查找和总结方面的几个主要特性:

1、多语言支持

广泛的语种覆盖:现代 AI 翻译系统支持数百种语言,包括常用语言和一些小众语言。

跨语言理解:AI 能够理解和处理不同语言之间的细微差异,如语法结构、文化背景和表达方式。

2、高质量翻译

上下文感知:AI 翻译系统能够理解句子的上下文,从而提供更准确的翻译。例如,同一个词在不同的上下文中可能有不同的含义。

自然流畅:通过深度学习模型(如神经机器翻译),AI 能够生成更加自然流畅的翻译结果,减少机械感。

专业术语处理:AI 可以识别和处理特定领域的专业术语,确保翻译的专业性和准确性。

3、实时翻译

即时响应:AI 翻译系统可以实现实时翻译,适用于语音对话、在线聊天等多种场景。

低延迟:通过优化算法和计算资源,AI 翻译可以在极短的时间内完成翻译任务。

4、大规模数据处理

大数据处理能力:AI 系统可以处理和分析大量的文本数据,从中提取有用的信息。

并行处理:利用分布式计算和云计算技术,AI 可以并行处理多个翻译任务,提高效率。

5、自适应学习

持续改进:通过不断的学习和反馈,AI 翻译系统可以不断提高其翻译质量。

个性化定制:AI 可以根据用户的具体需求和偏好进行个性化调整,提供定制化的翻译服务。

下面举几个易懂的例子,AI的特性由浅入深,有具象到抽象都在生活中有着许多体现。

什么是大模型?

通过直接询问语言大模型,我们通常会得到以下答案。

亦或者这样

非人工智能专业的同学看到这样的东西恐怕很难理解。所以我们来对大模型进行一个感性一些的认知用更加朴实的方式认识它。

大模型在某种程度上,与人的大脑十分相似,这颗大脑由于多年在校学习的经验,理解了大量人类的通用知识,比如是基础的算数能力,基础的推理能力,了解基础的物理法则,知道人类的发展历史,甚至会说谎,而大模型在这些方面也一样。

 AI大模型本身是生成模型,其目标为根据输入来预测词元,本质上它并不关心你输入的是什么,它的目标只是为了让文本看起来更加完整。

这就导致了人们所说的大模型幻觉,例如说你问大模型,请描述一下我今天的早餐。尽管他并没有见过你,更不可能知道你的早餐吃了什么,但这不影响它可以清晰的描述出你的早餐。这是因为他读了大量的文档,人类的web网页,这些资料里描述早餐,就是这么说的。这就是大模型的幻觉。但我在自己尝试的时候,gpt并没有如期的展示预料种的大模型幻觉,可以通过减少生成随机性提高解码稳定性;使用强化学习等手段训练减少曝光误差;使用检索增强、模型参数修改或其他手段引入知识来避免一些大模型幻觉。

但这里跟我的大脑有哪里相似呢。换个说法,比如说你要上课了,但你没有交作业。老师问,你的作业呢?你会从自己的知识库里搜索,怎么回答比较合理。我忘记写了?昨天扶老奶奶过马路耽误写作业了?我的作业被狗吃了?还是我的作业发生了量子隧穿,消失了?然后根据概率来挑选一个答案回复老师。我的作业被狗吃了。对于你的老师来说,其实这也是一种幻觉,合理吗?理论上可能性是存在的,但通过人类基础认知来看,这大概率是假的。就像那个早餐描述,我自己看起来是假的,但从第三方的角度来看,他也有可能是真的。

众所周知呢,大模型一次支持的词元有上限的,超过了,大模型就会忽略。Chatgpt3.5目前最多一次支持的词元是4096,这个数据也是我直接问3.5的。而越来越卷的大模型行业也在将这个数值往上提。8k,32k,往后只会越来越多。

但他毕竟是有上限的,也就导致,你无法将一部144w字的莎士比亚全集全部录入进去。并让他直接给你总结中心思想。,这块看起来和人脑有些差别,毕竟一个一个正常大学生是可以在看完莎士比亚全集以后,和其他同学讲述的。

但这真的不一样吗,实际上我们在看书的时候,是一边看一边大脑在总结的。人物a,大概是什么形象,性格如何,他的关系网等等。当你看完一本书以后,你记住的是这本书的轮廓,和一些你感兴趣的部分。并做不到完全背诵。这涉及到短期长期记忆。

当你在看一个章节的时候,外部信息输入到大脑中,形成短期记忆,而短期记忆再由海马体进行有损压缩后进入长期记忆。而大模型的词元限制,就很像短期记忆方式,时间长了就会忘记,如果要分析较长的文本的时候,就可以选择每读取一段,分析一段。然后将这段内容的核心思想带入到下一段内容读取当中。甚至可以将这些内容存取到数据库中,下次启动这个任务的时候,再读取。

.接下来我们来讲一下AI agent,人工智能体。

ai agent是体现如何将大模型的推理能力进行充分的利用,组装成一个类人大脑,这里涉及到的主要有四个方面。

第一部分,planning,我们可以延申出Chain of thought、reflection、Chain of tree三块。这里的思维链和思维树,都是表达大模型通过某种思路步骤,可归纳为链状、或树状分支进行一系列线性解决问题的方式

第二部分memory,当大模型意识到输入的内容比较长,或者有长期价值的时候,就需要进行有意识的记忆存储以供后续的使用。

第三部分 tools 当大模型遇到自己不擅长的问题时,例如复杂计算、网络访问、等就需要使用工具库中的工具,这样可以极大的降低大模型出错概率。

第四部分 action 给这颗人造大脑装上四肢,让他可以真正的影响物理世界。

到这里对大模型应该就有了一定认识,当你不知道大模型能干嘛的时候,想想大脑可以干什么,就可以大概推测。

相关文章:

用感性的方式浅要了解什么是AI 与 大模型

什么是人工智能(AI)? 人工智能(Artificial Intelligence,简称 AI)是指由人制造出来的具有一定智能的系统,能够理解和学习人类的行为,并在某些任务上模仿人类的智能行为。这些任务包…...

Linux文件的查找和打包以及压缩

文件的查找 文件查找的用处,在我们需要文件但却又不知道文件在哪里的时候 文件查找存在着三种类型的查找 1、which或whereis:查找命令的程序文件位置 2、locate:也是一种文件查找,但是基于数据库的查找 3、find:针…...

专题十四_哈希表_算法专题详细解答

目录 哈希表简介 1. 两数之和(easy) 解析: 解法一:暴力: 解法二:哈希O(N) 总结: 2. 判断是否互为字符重排(easy) 解析: 哈希: 总结&…...

C++源码生成·序章

文章目录 C源码生成序章1 概述1.1 前言1.2 Python 易用性简介 2 使用 python 生成 c 源码2.1 运行脚本2.2 结果 3 项目启动3.1 项目概述3.2 环境准备3.3 克隆仓库3.4 查看标签(Tags)3.4 根据标签拉取代码3.5 后续步骤 C源码生成序章 1 概述 1.1 前言 …...

Android中的MVP模式

MVP(Model-View-Presenter)架构在 Android 开发中是一种流行的架构模式,它将业务逻辑和 UI 代码分离,通过 Presenter 来处理用户的操作和界面更新。MVP 提高了代码的可维护性和测试性,特别是 Presenter 中的逻辑可以单…...

kebuadm部署k8s集群

官方文档: Installing kubeadm | Kubernetes 切记要关闭防⽕墙、selinux、禁用交换空间, cpu核⼼数⾄少为2 内存4G kubeadm部署k8s⾼可用集群的官方文档: Creating Highly Available Clusters with kubeadm | Kubernetes 你需要在每台…...

Unity3D学习FPS游戏(2)简单场景、玩家移动控制

前言:上一篇的时候,我们已经导入了官方fps的素材,并且对三维模型有了一定了解。接下来我们要构建一个简单的场景让玩家能够有地方移动,然后写一个简单的玩家移动控制。 简单场景和玩家移动 简单场景玩家移动控制玩家模型视野-摄像…...

网上的 AQS 文章让我很失望

一、AQS 很多人都没有讲明白 🤔 翻看了网上的 AQS(AbstractQueuedSynchronizer)文章,质量参差不齐,大多数都是在关键处跳过、含糊其词,美其名曰 “传播知识” 。 大多数都是进行大段的源码粘贴和注释&…...

滑动窗口子串

文章目录 滑动窗口一、无重复字符的最长子串二、找到字符串中所有字母异位词 子串三、和为 K 的子数组四、滑动窗口最大值五、最小覆盖子串 滑动窗口 一、无重复字符的最长子串 题目链接 (方法一:暴力枚举) (方法二&#xff…...

【windows11 提示“Microsoft Visual C++ Runtime Library Runtime Error】

windows11 提示“Microsoft Visual C++ Runtime Library Runtime Error” 问题描述解决方法郑重声明:本人原创博文,都是实战,均经过实际项目验证出货的 转载请标明出处:攻城狮2015 Platform: windows OS:windows11 问题描述 解决方法 下载VisualCppRedist_AIO_x86_x64.exe 安…...

【leetcode|哈希表、动态规划】最长连续序列、最大子数组和

目录 最长连续序列 解法一:暴力枚举 复杂度 解法二:优化解法一省去二层循环中不必要的遍历 复杂度 最大子数组和 解法一:暴力枚举 复杂度 解法二:贪心 复杂度 解法三:动态规划 复杂度 最长连续序列 输入输…...

【人工智能】掌握深度学习中的时间序列预测:深入解析RNN与LSTM的工作原理与应用

深度学习中的循环神经网络(RNN)和长短时记忆网络(LSTM)在处理时间序列数据方面具有重要作用。它们能够通过记忆前序信息,捕捉序列数据中的长期依赖性,广泛应用于金融市场预测、自然语言处理、语音识别等领域…...

今日开放!24下软考机考「模拟练习平台」操作指南来啦!

2024年下半年软考机考模拟练习平台今日开放,考生可以下载模拟作答系统并登录后进行模拟练习,熟悉答题流程及操作方法。 一、模拟练习时间 2024年下半年软考机考模拟练习平台开放时间为2024年10月23日9:00至11月6日17:00,共15天。 考生可以在…...

合并.md文档

需求:将多个.md文档合并成一个.md文档。 方法一:通过 type 命令 参考内容:多个md文件合并 步骤: 把需要合并的 .md 文档放入到一个文件夹内。修改需要合并的 .md 文档名,可以在文档名前加上 1.2.3 来表明顺序&#x…...

10月18日笔记(基于系统服务的权限提升)

系统内核漏洞提权 当目标系统存在该漏洞且没有更新安全补丁时,利用已知的系统内核漏洞进行提权,测试人员往往可以获得系统级别的访问权限。 查找系统潜在漏洞 手动寻找可用漏洞 在目标主机上执行以下命令,查看已安装的系统补丁。 system…...

【STM32 Blue Pill编程实例】-控制步进电机(ULN2003+28BYJ-48)

控制步进电机(ULN2003+28BYJ-48) 文章目录 控制步进电机(ULN2003+28BYJ-48)1、步进电机介绍2、ULN2003步进电机驱动模块3、硬件准备及接线4、模块配置3.1 定时器配置3.2 ULN2003输入引脚配置4、代码实现在本文中,我们将介使用 STM32Cube IDE 使用 ULN2003 电机驱动器来控制28B…...

监督学习、无监督学习、半监督学习、强化学习、迁移学习、集成学习分别是什么对应什么应用场景

将对监督学习、无监督学习、半监督学习、强化学习、迁移学习和集成学习进行全面而详细的解释,包括定义、应用场景以及具体的算法/模型示例。 1. 监督学习 (Supervised Learning) 定义:监督学习是一种机器学习方法,其中模型通过已知的输入数…...

WSL2 Linux子系统调整存储位置

WSL2 默认不支持修改Linux 安装路径,官方提供的方式,只有通过导出、导入的方式实现Linux子系统的迁移。 修改注册表的方式官方不推荐,没有尝试过,仅提供操作方式(自行评估风险,建议备份好数据) 1. 打开 **注册表编辑器…...

Shiro授权

一、定义与作用 授权(Authorization),也称为访问控制,是确定是否允许用户/主体做某事的过程。在Shiro安全框架中,授权是核心组件之一,它负责控制用户对系统资源的访问权限,确保用户只能访问其被…...

算法题总结(十五)——贪心算法(下)

1005、K 次取反后最大化的数组和 给你一个整数数组 nums 和一个整数 k ,按以下方法修改该数组: 选择某个下标 i 并将 nums[i] 替换为 -nums[i] 。 重复这个过程恰好 k 次。可以多次选择同一个下标 i 。 以这种方式修改数组后,返回数组 可…...

【kafka】Golang实现分布式Masscan任务调度系统

要求: 输出两个程序,一个命令行程序(命令行参数用flag)和一个服务端程序。 命令行程序支持通过命令行参数配置下发IP或IP段、端口、扫描带宽,然后将消息推送到kafka里面。 服务端程序: 从kafka消费者接收…...

遍历 Map 类型集合的方法汇总

1 方法一 先用方法 keySet() 获取集合中的所有键。再通过 gey(key) 方法用对应键获取值 import java.util.HashMap; import java.util.Set;public class Test {public static void main(String[] args) {HashMap hashMap new HashMap();hashMap.put("语文",99);has…...

如何将联系人从 iPhone 转移到 Android

从 iPhone 换到 Android 手机时,你可能需要保留重要的数据,例如通讯录。好在,将通讯录从 iPhone 转移到 Android 手机非常简单,你可以从本文中学习 6 种可靠的方法,确保随时保持连接,不错过任何信息。 第 1…...

PL0语法,分析器实现!

简介 PL/0 是一种简单的编程语言,通常用于教学编译原理。它的语法结构清晰,功能包括常量定义、变量声明、过程(子程序)定义以及基本的控制结构(如条件语句和循环语句)。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言,由 Niklaus Wirth 设计,用于展示编译原理的核…...

Java入门学习详细版(一)

大家好,Java 学习是一个系统学习的过程,核心原则就是“理论 实践 坚持”,并且需循序渐进,不可过于着急,本篇文章推出的这份详细入门学习资料将带大家从零基础开始,逐步掌握 Java 的核心概念和编程技能。 …...

是否存在路径(FIFOBB算法)

题目描述 一个具有 n 个顶点e条边的无向图,该图顶点的编号依次为0到n-1且不存在顶点与自身相连的边。请使用FIFOBB算法编写程序,确定是否存在从顶点 source到顶点 destination的路径。 输入 第一行两个整数,分别表示n 和 e 的值(1…...

html css js网页制作成品——HTML+CSS榴莲商城网页设计(4页)附源码

目录 一、👨‍🎓网站题目 二、✍️网站描述 三、📚网站介绍 四、🌐网站效果 五、🪓 代码实现 🧱HTML 六、🥇 如何让学习不再盲目 七、🎁更多干货 一、👨‍&#x1f…...

Bean 作用域有哪些?如何答出技术深度?

导语: Spring 面试绕不开 Bean 的作用域问题,这是面试官考察候选人对 Spring 框架理解深度的常见方式。本文将围绕“Spring 中的 Bean 作用域”展开,结合典型面试题及实战场景,帮你厘清重点,打破模板式回答&#xff0c…...

【前端异常】JavaScript错误处理:分析 Uncaught (in promise) error

在前端开发中,JavaScript 异常是不可避免的。随着现代前端应用越来越多地使用异步操作(如 Promise、async/await 等),开发者常常会遇到 Uncaught (in promise) error 错误。这个错误是由于未正确处理 Promise 的拒绝(r…...

GraphQL 实战篇:Apollo Client 配置与缓存

GraphQL 实战篇:Apollo Client 配置与缓存 上一篇:GraphQL 入门篇:基础查询语法 依旧和上一篇的笔记一样,主实操,没啥过多的细节讲解,代码具体在: https://github.com/GoldenaArcher/graphql…...