当前位置：首页 > news >正文

用感性的方式浅要了解什么是AI 与大模型

news 2026/2/9 5:09:45

什么是人工智能（AI）？

人工智能（Artificial Intelligence，简称 AI）是指由人制造出来的具有一定智能的系统，能够理解和学习人类的行为，并在某些任务上模仿人类的智能行为。这些任务包括学习、推理、问题解决、知识表示、规划、导航、自然语言处理、感知以及对环境的操控等。

AI的广义特性

将复杂的专业名词简单化，为我们所最知的，AI在扩展、翻译、查找、和总结方面具有多种特性和应用。这些特性使得 AI 能够处理大量的多语言文本数据，并提供高效、准确的翻译和总结服务。以下是 AI 在扩展翻译查找和总结方面的几个主要特性：

1、多语言支持

广泛的语种覆盖：现代 AI 翻译系统支持数百种语言，包括常用语言和一些小众语言。

跨语言理解：AI 能够理解和处理不同语言之间的细微差异，如语法结构、文化背景和表达方式。

2、高质量翻译

上下文感知：AI 翻译系统能够理解句子的上下文，从而提供更准确的翻译。例如，同一个词在不同的上下文中可能有不同的含义。

自然流畅：通过深度学习模型（如神经机器翻译），AI 能够生成更加自然流畅的翻译结果，减少机械感。

专业术语处理：AI 可以识别和处理特定领域的专业术语，确保翻译的专业性和准确性。

3、实时翻译

即时响应：AI 翻译系统可以实现实时翻译，适用于语音对话、在线聊天等多种场景。

低延迟：通过优化算法和计算资源，AI 翻译可以在极短的时间内完成翻译任务。

4、大规模数据处理

大数据处理能力：AI 系统可以处理和分析大量的文本数据，从中提取有用的信息。

并行处理：利用分布式计算和云计算技术，AI 可以并行处理多个翻译任务，提高效率。

5、自适应学习

持续改进：通过不断的学习和反馈，AI 翻译系统可以不断提高其翻译质量。

个性化定制：AI 可以根据用户的具体需求和偏好进行个性化调整，提供定制化的翻译服务。

下面举几个易懂的例子，AI的特性由浅入深，有具象到抽象都在生活中有着许多体现。

什么是大模型？

通过直接询问语言大模型，我们通常会得到以下答案。

亦或者这样

非人工智能专业的同学看到这样的东西恐怕很难理解。所以我们来对大模型进行一个感性一些的认知用更加朴实的方式认识它。

大模型在某种程度上，与人的大脑十分相似，这颗大脑由于多年在校学习的经验，理解了大量人类的通用知识，比如是基础的算数能力，基础的推理能力，了解基础的物理法则，知道人类的发展历史，甚至会说谎，而大模型在这些方面也一样。

AI大模型本身是生成模型，其目标为根据输入来预测词元，本质上它并不关心你输入的是什么，它的目标只是为了让文本看起来更加完整。

这就导致了人们所说的大模型幻觉，例如说你问大模型，请描述一下我今天的早餐。尽管他并没有见过你，更不可能知道你的早餐吃了什么，但这不影响它可以清晰的描述出你的早餐。这是因为他读了大量的文档，人类的web网页，这些资料里描述早餐，就是这么说的。这就是大模型的幻觉。但我在自己尝试的时候，gpt并没有如期的展示预料种的大模型幻觉，可以通过减少生成随机性提高解码稳定性；使用强化学习等手段训练减少曝光误差；使用检索增强、模型参数修改或其他手段引入知识来避免一些大模型幻觉。

但这里跟我的大脑有哪里相似呢。换个说法，比如说你要上课了，但你没有交作业。老师问，你的作业呢？你会从自己的知识库里搜索，怎么回答比较合理。我忘记写了？昨天扶老奶奶过马路耽误写作业了？我的作业被狗吃了？还是我的作业发生了量子隧穿，消失了？然后根据概率来挑选一个答案回复老师。我的作业被狗吃了。对于你的老师来说，其实这也是一种幻觉，合理吗？理论上可能性是存在的，但通过人类基础认知来看，这大概率是假的。就像那个早餐描述，我自己看起来是假的，但从第三方的角度来看，他也有可能是真的。

众所周知呢，大模型一次支持的词元有上限的，超过了，大模型就会忽略。Chatgpt3.5目前最多一次支持的词元是4096，这个数据也是我直接问3.5的。而越来越卷的大模型行业也在将这个数值往上提。8k,32k,往后只会越来越多。

但他毕竟是有上限的，也就导致，你无法将一部144w字的莎士比亚全集全部录入进去。并让他直接给你总结中心思想。，这块看起来和人脑有些差别，毕竟一个一个正常大学生是可以在看完莎士比亚全集以后，和其他同学讲述的。

但这真的不一样吗，实际上我们在看书的时候，是一边看一边大脑在总结的。人物a，大概是什么形象，性格如何，他的关系网等等。当你看完一本书以后，你记住的是这本书的轮廓，和一些你感兴趣的部分。并做不到完全背诵。这涉及到短期长期记忆。

当你在看一个章节的时候，外部信息输入到大脑中，形成短期记忆，而短期记忆再由海马体进行有损压缩后进入长期记忆。而大模型的词元限制，就很像短期记忆方式，时间长了就会忘记，如果要分析较长的文本的时候，就可以选择每读取一段，分析一段。然后将这段内容的核心思想带入到下一段内容读取当中。甚至可以将这些内容存取到数据库中，下次启动这个任务的时候，再读取。

.接下来我们来讲一下AI agent，人工智能体。

ai agent是体现如何将大模型的推理能力进行充分的利用，组装成一个类人大脑，这里涉及到的主要有四个方面。

第一部分，planning，我们可以延申出Chain of thought、reflection、Chain of tree三块。这里的思维链和思维树，都是表达大模型通过某种思路步骤，可归纳为链状、或树状分支进行一系列线性解决问题的方式

第二部分memory，当大模型意识到输入的内容比较长，或者有长期价值的时候，就需要进行有意识的记忆存储以供后续的使用。

第三部分 tools 当大模型遇到自己不擅长的问题时，例如复杂计算、网络访问、等就需要使用工具库中的工具，这样可以极大的降低大模型出错概率。

第四部分 action 给这颗人造大脑装上四肢，让他可以真正的影响物理世界。

到这里对大模型应该就有了一定认识，当你不知道大模型能干嘛的时候，想想大脑可以干什么，就可以大概推测。

用感性的方式浅要了解什么是AI 与大模型

什么是人工智能（AI）？

什么是大模型？

相关文章：

用感性的方式浅要了解什么是AI 与大模型

Linux文件的查找和打包以及压缩

专题十四_哈希表_算法专题详细解答

C++源码生成·序章

Android中的MVP模式

kebuadm部署k8s集群

Unity3D学习FPS游戏（2）简单场景、玩家移动控制

网上的 AQS 文章让我很失望

滑动窗口子串

【windows11 提示“Microsoft Visual C++ Runtime Library Runtime Error】

【leetcode|哈希表、动态规划】最长连续序列、最大子数组和

【人工智能】掌握深度学习中的时间序列预测：深入解析RNN与LSTM的工作原理与应用

今日开放！24下软考机考「模拟练习平台」操作指南来啦！

合并.md文档

10月18日笔记(基于系统服务的权限提升)

【STM32 Blue Pill编程实例】-控制步进电机(ULN2003+28BYJ-48)

监督学习、无监督学习、半监督学习、强化学习、迁移学习、集成学习分别是什么对应什么应用场景

WSL2 Linux子系统调整存储位置

Shiro授权

算法题总结（十五）——贪心算法（下）

基于大模型的 UI 自动化系统

【力扣数据库知识手册笔记】索引

中南大学无人机智能体的全面评估！BEDI：用于评估无人机上具身智能体的综合性基准测试

大数据零基础学习day1之环境准备和大数据初步理解

Linux简单的操作

STM32F4基本定时器使用和原理详解

在四层代理中还原真实客户端ngx_stream_realip_module

1.3 VSCode安装与环境配置

NFT模式：数字资产确权与链游经济系统构建

Docker 本地安装 mysql 数据库