用感性的方式浅要了解什么是AI 与 大模型
什么是人工智能(AI)?
人工智能(Artificial Intelligence,简称 AI)是指由人制造出来的具有一定智能的系统,能够理解和学习人类的行为,并在某些任务上模仿人类的智能行为。这些任务包括学习、推理、问题解决、知识表示、规划、导航、自然语言处理、感知以及对环境的操控等。
AI的广义特性
将复杂的专业名词简单化,为我们所最知的,AI在扩展、翻译、查找、和总结方面具有多种特性和应用。这些特性使得 AI 能够处理大量的多语言文本数据,并提供高效、准确的翻译和总结服务。以下是 AI 在扩展翻译查找和总结方面的几个主要特性:
1、多语言支持
广泛的语种覆盖:现代 AI 翻译系统支持数百种语言,包括常用语言和一些小众语言。
跨语言理解:AI 能够理解和处理不同语言之间的细微差异,如语法结构、文化背景和表达方式。
2、高质量翻译
上下文感知:AI 翻译系统能够理解句子的上下文,从而提供更准确的翻译。例如,同一个词在不同的上下文中可能有不同的含义。
自然流畅:通过深度学习模型(如神经机器翻译),AI 能够生成更加自然流畅的翻译结果,减少机械感。
专业术语处理:AI 可以识别和处理特定领域的专业术语,确保翻译的专业性和准确性。
3、实时翻译
即时响应:AI 翻译系统可以实现实时翻译,适用于语音对话、在线聊天等多种场景。
低延迟:通过优化算法和计算资源,AI 翻译可以在极短的时间内完成翻译任务。
4、大规模数据处理
大数据处理能力:AI 系统可以处理和分析大量的文本数据,从中提取有用的信息。
并行处理:利用分布式计算和云计算技术,AI 可以并行处理多个翻译任务,提高效率。
5、自适应学习
持续改进:通过不断的学习和反馈,AI 翻译系统可以不断提高其翻译质量。
个性化定制:AI 可以根据用户的具体需求和偏好进行个性化调整,提供定制化的翻译服务。
下面举几个易懂的例子,AI的特性由浅入深,有具象到抽象都在生活中有着许多体现。




什么是大模型?
通过直接询问语言大模型,我们通常会得到以下答案。

亦或者这样

非人工智能专业的同学看到这样的东西恐怕很难理解。所以我们来对大模型进行一个感性一些的认知用更加朴实的方式认识它。
大模型在某种程度上,与人的大脑十分相似,这颗大脑由于多年在校学习的经验,理解了大量人类的通用知识,比如是基础的算数能力,基础的推理能力,了解基础的物理法则,知道人类的发展历史,甚至会说谎,而大模型在这些方面也一样。

AI大模型本身是生成模型,其目标为根据输入来预测词元,本质上它并不关心你输入的是什么,它的目标只是为了让文本看起来更加完整。

这就导致了人们所说的大模型幻觉,例如说你问大模型,请描述一下我今天的早餐。尽管他并没有见过你,更不可能知道你的早餐吃了什么,但这不影响它可以清晰的描述出你的早餐。这是因为他读了大量的文档,人类的web网页,这些资料里描述早餐,就是这么说的。这就是大模型的幻觉。但我在自己尝试的时候,gpt并没有如期的展示预料种的大模型幻觉,可以通过减少生成随机性提高解码稳定性;使用强化学习等手段训练减少曝光误差;使用检索增强、模型参数修改或其他手段引入知识来避免一些大模型幻觉。

但这里跟我的大脑有哪里相似呢。换个说法,比如说你要上课了,但你没有交作业。老师问,你的作业呢?你会从自己的知识库里搜索,怎么回答比较合理。我忘记写了?昨天扶老奶奶过马路耽误写作业了?我的作业被狗吃了?还是我的作业发生了量子隧穿,消失了?然后根据概率来挑选一个答案回复老师。我的作业被狗吃了。对于你的老师来说,其实这也是一种幻觉,合理吗?理论上可能性是存在的,但通过人类基础认知来看,这大概率是假的。就像那个早餐描述,我自己看起来是假的,但从第三方的角度来看,他也有可能是真的。

众所周知呢,大模型一次支持的词元有上限的,超过了,大模型就会忽略。Chatgpt3.5目前最多一次支持的词元是4096,这个数据也是我直接问3.5的。而越来越卷的大模型行业也在将这个数值往上提。8k,32k,往后只会越来越多。

但他毕竟是有上限的,也就导致,你无法将一部144w字的莎士比亚全集全部录入进去。并让他直接给你总结中心思想。,这块看起来和人脑有些差别,毕竟一个一个正常大学生是可以在看完莎士比亚全集以后,和其他同学讲述的。

但这真的不一样吗,实际上我们在看书的时候,是一边看一边大脑在总结的。人物a,大概是什么形象,性格如何,他的关系网等等。当你看完一本书以后,你记住的是这本书的轮廓,和一些你感兴趣的部分。并做不到完全背诵。这涉及到短期长期记忆。

当你在看一个章节的时候,外部信息输入到大脑中,形成短期记忆,而短期记忆再由海马体进行有损压缩后进入长期记忆。而大模型的词元限制,就很像短期记忆方式,时间长了就会忘记,如果要分析较长的文本的时候,就可以选择每读取一段,分析一段。然后将这段内容的核心思想带入到下一段内容读取当中。甚至可以将这些内容存取到数据库中,下次启动这个任务的时候,再读取。
.接下来我们来讲一下AI agent,人工智能体。

ai agent是体现如何将大模型的推理能力进行充分的利用,组装成一个类人大脑,这里涉及到的主要有四个方面。
第一部分,planning,我们可以延申出Chain of thought、reflection、Chain of tree三块。这里的思维链和思维树,都是表达大模型通过某种思路步骤,可归纳为链状、或树状分支进行一系列线性解决问题的方式

第二部分memory,当大模型意识到输入的内容比较长,或者有长期价值的时候,就需要进行有意识的记忆存储以供后续的使用。

第三部分 tools 当大模型遇到自己不擅长的问题时,例如复杂计算、网络访问、等就需要使用工具库中的工具,这样可以极大的降低大模型出错概率。

第四部分 action 给这颗人造大脑装上四肢,让他可以真正的影响物理世界。

到这里对大模型应该就有了一定认识,当你不知道大模型能干嘛的时候,想想大脑可以干什么,就可以大概推测。
相关文章:
用感性的方式浅要了解什么是AI 与 大模型
什么是人工智能(AI)? 人工智能(Artificial Intelligence,简称 AI)是指由人制造出来的具有一定智能的系统,能够理解和学习人类的行为,并在某些任务上模仿人类的智能行为。这些任务包…...
Linux文件的查找和打包以及压缩
文件的查找 文件查找的用处,在我们需要文件但却又不知道文件在哪里的时候 文件查找存在着三种类型的查找 1、which或whereis:查找命令的程序文件位置 2、locate:也是一种文件查找,但是基于数据库的查找 3、find:针…...
专题十四_哈希表_算法专题详细解答
目录 哈希表简介 1. 两数之和(easy) 解析: 解法一:暴力: 解法二:哈希O(N) 总结: 2. 判断是否互为字符重排(easy) 解析: 哈希: 总结&…...
C++源码生成·序章
文章目录 C源码生成序章1 概述1.1 前言1.2 Python 易用性简介 2 使用 python 生成 c 源码2.1 运行脚本2.2 结果 3 项目启动3.1 项目概述3.2 环境准备3.3 克隆仓库3.4 查看标签(Tags)3.4 根据标签拉取代码3.5 后续步骤 C源码生成序章 1 概述 1.1 前言 …...
Android中的MVP模式
MVP(Model-View-Presenter)架构在 Android 开发中是一种流行的架构模式,它将业务逻辑和 UI 代码分离,通过 Presenter 来处理用户的操作和界面更新。MVP 提高了代码的可维护性和测试性,特别是 Presenter 中的逻辑可以单…...
kebuadm部署k8s集群
官方文档: Installing kubeadm | Kubernetes 切记要关闭防⽕墙、selinux、禁用交换空间, cpu核⼼数⾄少为2 内存4G kubeadm部署k8s⾼可用集群的官方文档: Creating Highly Available Clusters with kubeadm | Kubernetes 你需要在每台…...
Unity3D学习FPS游戏(2)简单场景、玩家移动控制
前言:上一篇的时候,我们已经导入了官方fps的素材,并且对三维模型有了一定了解。接下来我们要构建一个简单的场景让玩家能够有地方移动,然后写一个简单的玩家移动控制。 简单场景和玩家移动 简单场景玩家移动控制玩家模型视野-摄像…...
网上的 AQS 文章让我很失望
一、AQS 很多人都没有讲明白 🤔 翻看了网上的 AQS(AbstractQueuedSynchronizer)文章,质量参差不齐,大多数都是在关键处跳过、含糊其词,美其名曰 “传播知识” 。 大多数都是进行大段的源码粘贴和注释&…...
滑动窗口子串
文章目录 滑动窗口一、无重复字符的最长子串二、找到字符串中所有字母异位词 子串三、和为 K 的子数组四、滑动窗口最大值五、最小覆盖子串 滑动窗口 一、无重复字符的最长子串 题目链接 (方法一:暴力枚举) (方法二ÿ…...
【windows11 提示“Microsoft Visual C++ Runtime Library Runtime Error】
windows11 提示“Microsoft Visual C++ Runtime Library Runtime Error” 问题描述解决方法郑重声明:本人原创博文,都是实战,均经过实际项目验证出货的 转载请标明出处:攻城狮2015 Platform: windows OS:windows11 问题描述 解决方法 下载VisualCppRedist_AIO_x86_x64.exe 安…...
【leetcode|哈希表、动态规划】最长连续序列、最大子数组和
目录 最长连续序列 解法一:暴力枚举 复杂度 解法二:优化解法一省去二层循环中不必要的遍历 复杂度 最大子数组和 解法一:暴力枚举 复杂度 解法二:贪心 复杂度 解法三:动态规划 复杂度 最长连续序列 输入输…...
【人工智能】掌握深度学习中的时间序列预测:深入解析RNN与LSTM的工作原理与应用
深度学习中的循环神经网络(RNN)和长短时记忆网络(LSTM)在处理时间序列数据方面具有重要作用。它们能够通过记忆前序信息,捕捉序列数据中的长期依赖性,广泛应用于金融市场预测、自然语言处理、语音识别等领域…...
今日开放!24下软考机考「模拟练习平台」操作指南来啦!
2024年下半年软考机考模拟练习平台今日开放,考生可以下载模拟作答系统并登录后进行模拟练习,熟悉答题流程及操作方法。 一、模拟练习时间 2024年下半年软考机考模拟练习平台开放时间为2024年10月23日9:00至11月6日17:00,共15天。 考生可以在…...
合并.md文档
需求:将多个.md文档合并成一个.md文档。 方法一:通过 type 命令 参考内容:多个md文件合并 步骤: 把需要合并的 .md 文档放入到一个文件夹内。修改需要合并的 .md 文档名,可以在文档名前加上 1.2.3 来表明顺序&#x…...
10月18日笔记(基于系统服务的权限提升)
系统内核漏洞提权 当目标系统存在该漏洞且没有更新安全补丁时,利用已知的系统内核漏洞进行提权,测试人员往往可以获得系统级别的访问权限。 查找系统潜在漏洞 手动寻找可用漏洞 在目标主机上执行以下命令,查看已安装的系统补丁。 system…...
【STM32 Blue Pill编程实例】-控制步进电机(ULN2003+28BYJ-48)
控制步进电机(ULN2003+28BYJ-48) 文章目录 控制步进电机(ULN2003+28BYJ-48)1、步进电机介绍2、ULN2003步进电机驱动模块3、硬件准备及接线4、模块配置3.1 定时器配置3.2 ULN2003输入引脚配置4、代码实现在本文中,我们将介使用 STM32Cube IDE 使用 ULN2003 电机驱动器来控制28B…...
监督学习、无监督学习、半监督学习、强化学习、迁移学习、集成学习分别是什么对应什么应用场景
将对监督学习、无监督学习、半监督学习、强化学习、迁移学习和集成学习进行全面而详细的解释,包括定义、应用场景以及具体的算法/模型示例。 1. 监督学习 (Supervised Learning) 定义:监督学习是一种机器学习方法,其中模型通过已知的输入数…...
WSL2 Linux子系统调整存储位置
WSL2 默认不支持修改Linux 安装路径,官方提供的方式,只有通过导出、导入的方式实现Linux子系统的迁移。 修改注册表的方式官方不推荐,没有尝试过,仅提供操作方式(自行评估风险,建议备份好数据) 1. 打开 **注册表编辑器…...
Shiro授权
一、定义与作用 授权(Authorization),也称为访问控制,是确定是否允许用户/主体做某事的过程。在Shiro安全框架中,授权是核心组件之一,它负责控制用户对系统资源的访问权限,确保用户只能访问其被…...
算法题总结(十五)——贪心算法(下)
1005、K 次取反后最大化的数组和 给你一个整数数组 nums 和一个整数 k ,按以下方法修改该数组: 选择某个下标 i 并将 nums[i] 替换为 -nums[i] 。 重复这个过程恰好 k 次。可以多次选择同一个下标 i 。 以这种方式修改数组后,返回数组 可…...
HTML 语义化
目录 HTML 语义化HTML5 新特性HTML 语义化的好处语义化标签的使用场景最佳实践 HTML 语义化 HTML5 新特性 标准答案: 语义化标签: <header>:页头<nav>:导航<main>:主要内容<article>&#x…...
Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动
一、前言说明 在2011版本的gb28181协议中,拉取视频流只要求udp方式,从2016开始要求新增支持tcp被动和tcp主动两种方式,udp理论上会丢包的,所以实际使用过程可能会出现画面花屏的情况,而tcp肯定不丢包,起码…...
SciencePlots——绘制论文中的图片
文章目录 安装一、风格二、1 资源 安装 # 安装最新版 pip install githttps://github.com/garrettj403/SciencePlots.git# 安装稳定版 pip install SciencePlots一、风格 简单好用的深度学习论文绘图专用工具包–Science Plot 二、 1 资源 论文绘图神器来了:一行…...
安宝特方案丨XRSOP人员作业标准化管理平台:AR智慧点检验收套件
在选煤厂、化工厂、钢铁厂等过程生产型企业,其生产设备的运行效率和非计划停机对工业制造效益有较大影响。 随着企业自动化和智能化建设的推进,需提前预防假检、错检、漏检,推动智慧生产运维系统数据的流动和现场赋能应用。同时,…...
蓝牙 BLE 扫描面试题大全(2):进阶面试题与实战演练
前文覆盖了 BLE 扫描的基础概念与经典问题蓝牙 BLE 扫描面试题大全(1):从基础到实战的深度解析-CSDN博客,但实际面试中,企业更关注候选人对复杂场景的应对能力(如多设备并发扫描、低功耗与高发现率的平衡)和前沿技术的…...
服务器硬防的应用场景都有哪些?
服务器硬防是指一种通过硬件设备层面的安全措施来防御服务器系统受到网络攻击的方式,避免服务器受到各种恶意攻击和网络威胁,那么,服务器硬防通常都会应用在哪些场景当中呢? 硬防服务器中一般会配备入侵检测系统和预防系统&#x…...
基础测试工具使用经验
背景 vtune,perf, nsight system等基础测试工具,都是用过的,但是没有记录,都逐渐忘了。所以写这篇博客总结记录一下,只要以后发现新的用法,就记得来编辑补充一下 perf 比较基础的用法: 先改这…...
从零开始打造 OpenSTLinux 6.6 Yocto 系统(基于STM32CubeMX)(九)
设备树移植 和uboot设备树修改的内容同步到kernel将设备树stm32mp157d-stm32mp157daa1-mx.dts复制到内核源码目录下 源码修改及编译 修改arch/arm/boot/dts/st/Makefile,新增设备树编译 stm32mp157f-ev1-m4-examples.dtb \stm32mp157d-stm32mp157daa1-mx.dtb修改…...
JS设计模式(4):观察者模式
JS设计模式(4):观察者模式 一、引入 在开发中,我们经常会遇到这样的场景:一个对象的状态变化需要自动通知其他对象,比如: 电商平台中,商品库存变化时需要通知所有订阅该商品的用户;新闻网站中࿰…...
CRMEB 中 PHP 短信扩展开发:涵盖一号通、阿里云、腾讯云、创蓝
目前已有一号通短信、阿里云短信、腾讯云短信扩展 扩展入口文件 文件目录 crmeb\services\sms\Sms.php 默认驱动类型为:一号通 namespace crmeb\services\sms;use crmeb\basic\BaseManager; use crmeb\services\AccessTokenServeService; use crmeb\services\sms\…...
