当前位置: 首页 > article >正文

Ai通识与基础-认识人工智能

认识人工智能智能产生的要素影响大模型智能的核心要素有三点模型算法。首先是模型算法现在的AI都是采用神经网络架构你可以把它看做是AI的大脑是决定AI是否”聪明”的基础。海量数据。AI也是一样要想让AI产生智慧就必须用海量的数据来训练它。上个世纪互联网不够发达可以用来训练的数据也比较少。超级算力。大模型训练的数据规模庞大神经网络架构复杂因此训练时的计算量都是天文数字。需要成千上万的顶级GPU一起不间断的工作数周甚至数月才行这背后是巨大的电力消耗和硬件成本。大模型原理前面我们说过AI的神经网络模型就是在模仿人类的神经元神经网络结构深度神经网络分为很多层Layer是神经网络基本的计算单元分为输入层入口接收数据隐藏层信息处理与学习。可以有很多层。输出层出口产生结果。整个神经元的工程流程是可以用一个公式去表达的。括号里面有个wi*xiw是权重x是输入它俩相乘是在对输入参数进行加权从1到n表示从第一个参数到第n个参数进行求和所以先加权在求和-b被成为“偏置量”有的时候我们加权求和完得到这个结果我期望它必须得达到一定的阈值超过这个阈值以后它的作用才会生效。所以在这里-b其实就是减去阈值把得到的结果再去交给激活函数进行处理所以这个括号外边的g其实就是激活函数最终就能得到结果。反向传播教这个复杂神经网络学习的高效方法。基本流程如下前向传播数据逐层加工直到输出层产出结果。计算误差计算产出结果与正确结果的误差。反向追责倒退计算每一层的每个连接对误差的贡献。调整权重根据每个连接的误差贡献比例调整其权重参数使误差变小。大语言模型在2003年图灵奖得主约书亚·本吉奥Yoshua Bengio的一篇名为《A neural probabilistic language model》的论文开创了神经网络语言模型Neural Network Language ModelNNLM的先河。这篇文章中首次提到了词向量Word Embedding的概念雏形这为神经网络训练学习自然语言打下了坚实的基础。词向量就是把词转为多为空间向量的一种技术、首先将人类自然语言文字拆分为一个个片段称为Token词。每个Token都经过模型计算转为一个浮点数数组称为向量坐标、我们现在看到的这个例子它在拆分时把一个个单词拆分成一个的Token但是在真实中它不一定是这个样子真实中拆分的Token可以是单词汉字标点符号还可以是一个很长单词的一部分这里是为了方便理解就当成一个个的单词或汉字了。假如我们有一个数组里面有3个浮点数我们就可以把这3个浮点数分别作为一个三维空间的x,y和z轴上的一个坐标这样就得到了一个三维空间的向量由此可见数组里面有几个数字就能转为几维空间的向量坐标。那么我们的词向量它里面有几个浮点数呢如果它转化成一个向量的话那就是12288维空间的向量在数学中理论上是可以有任意维度的空间的因此这个12288个数组就可以表示12288维空间中的向量。最后我们人类中的所有词汇都可以转成这个一万多维空间的一个向量而且我们最终要通过训练模型就是要不断的去调整这些词在向量空间中的坐标位置最终使这个词向量在多维空间中不同方向能够去表达不同的语义。每个词语都可以经过模型运算转化为一个多维向量也就是一个浮点数数组GPT3采用12288维向量通过训练使模型计算出的多维向量与文字语义产生关联使多维空间中的不同方向表示不同语义自注意力机制使模型能更高效的根据上下文信息处理token理解token含义。比如说我现在有一句话“有一个知名男艺人___”,如果只给你这一句话这个艺人是谁你肯定不知道所以此时模型去处理的话那么它生成出来的向量肯定在向量空间中仅仅表示的是艺人本身现在如果我们进一步的去提供上下文比如说我告诉它“有一个知名男艺人擅长唱歌___”这个时候自注意机制就会根据上下文来对当前的这个向量进行调整在向量的不同方向上表达不同的含义那就看一下这个向量空间中哪个方向表示的是唱歌这个含义然后它就把艺人这个方向朝着唱歌这个方向调整。词向量只是第一步接下来它还有很多步骤需要去做接着我们就需要有一个Attention层负责基于上下文来对这个里面的向量进行进一步的调整接下来MLP层也叫多层感知机它负责基于前面的分析在进一步做深度的推理分析来去进一步调整向量值。再往后就是不断的去重复前面的过程再跟上Attention层MLP层等等...直到得到最终的结果也就是向量坐标值。最终还需要把计算出的向量再转成Token也就是反向量化这个工作是叫做softmax来完成的。大模型应用什么是大模型应用大模型应用是基于大模型的推理分析生成能力结合传统编程精确计算控制能力开发出的各种应用。对话机器人ChatBot是指可以与用户聊天答疑而且具有记忆的大模型应用。例如:ChatGpt通义千问。GPT是大模型而ChatGpt则是基于大模型的一种对话的产品。怎么把一个大模型变成一个对话机器人大模型应用的结构一个对话的机器人由大模型和传统应用去结合的。大模型负责对话思考传统编程负责实现一些传统的图形界面用户登录和身份校验和一些数据的存储记忆这些功能。所以ChatPgt就是一种把传统应用和大模型结合的一种应用也就是大模型应用模型部署大模型API

相关文章:

Ai通识与基础-认识人工智能

认识人工智能智能产生的要素影响大模型智能的核心要素有三点:模型算法。首先是模型算法,现在的AI都是采用神经网络架构,你可以把它看做是AI的大脑,是决定AI是否”聪明”的基础。海量数据。AI也是一样,要想让AI产生智慧…...

IBM与联想服务器ServerGuide:一站式下载与版本兼容性全解析

1. ServerGuide工具到底是什么? 第一次接触IBM和联想服务器的朋友,可能会被各种安装配置步骤搞得头大。这时候ServerGuide就像个贴心的装机助手,它能自动识别你的服务器型号,帮你把操作系统、驱动程序和必要组件一次性装好。我十年…...

Windows和Office激活难题?3个简单步骤让你告别烦恼

Windows和Office激活难题?3个简单步骤让你告别烦恼 【免费下载链接】KMS_VL_ALL_AIO Smart Activation Script 项目地址: https://gitcode.com/gh_mirrors/km/KMS_VL_ALL_AIO 还在为Windows系统弹出的激活提醒而头疼吗?Office突然变成只读模式&am…...

谁将赢得2026年菲尔兹奖获?

目录前言热门人选什么是菲尔兹奖?参考文献前言 2026年国际数学家大会(ICM)将于今年夏天在美国费城举办,备受瞩目的菲尔兹奖也将在大会期间会颁发,届时将会有2至4名年龄不超过40岁的有卓越贡献的数学家奖分享该奖项&am…...

PyTorch加载.pth文件报错?别慌!教你区分‘整个模型’和‘仅参数’的两种加载方式

PyTorch模型加载实战:从.pth文件解析到迁移学习避坑指南 当你从GitHub下载了一个PyTorch预训练模型,满心欢喜地准备在自己的项目中使用时,突然遇到KeyError: missing_keys或RuntimeError: Error(s) in loading state_dict这类错误——这种场景…...

终极指南:如何免费解锁Cursor Pro功能,无限使用AI编程助手

终极指南:如何免费解锁Cursor Pro功能,无限使用AI编程助手 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve r…...

Python脚本控制Windows窗口实战:从自动登录软件到游戏辅助,win32gui的几种骚操作

Python窗口控制实战:从自动化登录到游戏辅助的5种高阶玩法 Windows桌面自动化一直是开发者热衷探索的领域。想象一下:每天打开电脑后,所有工作软件自动登录并排列就绪;老旧ERP系统通过脚本自动填写表单;甚至在某些单机…...

Rockchip RK3588 - Recovery模式下的updateEngine与rkupdate升级机制深度解析

1. RK3588 Recovery模式概述 对于嵌入式Linux开发者来说,系统升级是个绕不开的话题。Rockchip RK3588芯片提供了两种主流的启动升级方案:Recovery模式和A/B分区模式。这两种方案我都实际部署过,今天重点聊聊Recovery模式这个"老将"…...

R语言实战:用mice包搞定数据缺失多重插补,让你的模型结果更稳健(附完整代码与结果解读)

R语言实战:用mice包实现数据缺失多重插补的完整指南 临床研究和调查数据分析中,数据缺失几乎是不可避免的挑战。传统方法如均值填充或简单删除可能导致结果偏差,而多重插补技术能更科学地处理这一问题。本文将带你深入掌握R语言中mice包的多…...

Zabbix 之外,网络运维团队为什么还需要统一告警入口

Zabbix 之外,网络运维团队为什么还需要统一告警入口 文章类型:对比评测型 目标人群:运维主管、平台负责人、技术经理 绑定资料包:CSDN资料包-网络运维告警治理清单.md 评论区关键词:告警清单 很多团队谈告警治理&#…...

深度解密AI工具破解技术:系统指纹绕过与逆向工程完整指南

深度解密AI工具破解技术:系统指纹绕过与逆向工程完整指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your …...

如何快速掌握AI分层工具:插画师必备的LayerDivider完全指南

如何快速掌握AI分层工具:插画师必备的LayerDivider完全指南 【免费下载链接】layerdivider A tool to divide a single illustration into a layered structure. 项目地址: https://gitcode.com/gh_mirrors/la/layerdivider LayerDivider是一款智能的AI辅助工…...

安卓系统稳定性深度优化实战指南

第一章 系统稳定性问题分类与诊断 1.1 常见系统崩溃类型解析 在Android/Linux系统开发中,稳定性问题主要分为三类: $$ NE(NullPointerException) = \begin{cases} \text{Java层空指针} \ \text{JNI层引用错误} \ \text{Framework资源未初始化} \end{cases} $$ $$ KE(Kern…...

Android应用开发工程师技术深度解析与实践指南

引言 在移动互联网时代,Android平台凭借其开放性和庞大的用户基础,成为应用开发的核心领域。作为Android应用开发工程师,其角色不仅限于编写代码,更需掌控从需求分析到上线的全生命周期管理,确保应用的高质量交付。本指南基于行业标准职位描述,系统探讨Android开发的各个…...

实战:基于Scrapy与MongoDB的拉勾网招聘数据采集与可视化分析

1. 项目背景与工具选型 最近在帮朋友分析互联网行业招聘趋势时,发现拉勾网的数据特别有价值。但手动复制粘贴几百条招聘信息实在太低效,于是决定用Python搭建自动化采集分析系统。这个项目特别适合想转行数据分析的朋友练手,既能学习爬虫技术…...

实训日志DAY2

接上集,虚拟机的一些设置操作首先,安装 Linux 命令自动补全工具,让你按 Tab 就能自动补齐命令:yum install -y bash-completionbash-completion Linux 命令「自动补全神器」 就是你按 Tab 键 时: 自动补全命令 自动补…...

从LeetCode入门位运算:常见技巧与实战题目全解析

位运算详解1. 基础位运算运算符名称规则(真值表)通俗理解&按位与0&00 0&10 1&00 1&11有0就是0|按位或0|11 1|11 0|00有1就是1^按位异或0^00 0^11 1^01 1^10相同为0,不…...

Windows 10下绕过WDigest限制:手把手教你用Mimikatz新版抓取明文密码(附注册表修改详解)

Windows 10安全机制演进与WDigest认证深度解析 在网络安全领域,理解操作系统认证机制的演变对于防御和渗透测试都至关重要。Windows 10作为目前广泛使用的操作系统,其安全机制经历了多次重大更新,其中对WDigest认证协议的修改尤为关键。本文将…...

AI 应用开发全景图:从模型到 Agent,完整技术链路深度解析

核心观点:AI 应用开发不是堆砌技术名词,而是构建一条从模型选择到 Agent 智能体的完整价值交付链路。 一、引言:为什么你需要这张"全景图" 很多 AI 学习者都有这样的困惑: “学了很多 AI 名词,还是做不出项目;会调用模型接口,还是搭不起业务闭环;做了几个 D…...

生成式AI性能基准测试必须回答的7个问题:从Prompt工程影响因子到GPU显存碎片率归因分析

第一章:生成式AI应用性能基准测试 2026奇点智能技术大会(https://ml-summit.org) 生成式AI应用的性能表现不仅取决于模型参数量与推理框架优化,更受实际部署场景中延迟、吞吐量、内存驻留及长尾请求响应稳定性等多维指标制约。脱离真实负载模式的合成基…...

3分钟快速上手:GetQzonehistory一键备份你的QQ空间全部历史记录

3分钟快速上手:GetQzonehistory一键备份你的QQ空间全部历史记录 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 你是否担心QQ空间里的珍贵回忆会随着时间流逝而消失&#xf…...

【AI法律咨询合规生死线】:2026奇点大会独家披露——3类自动回复触发行政处罚,第2类90%律所已中招

第一章:2026奇点智能技术大会:AI法律咨询 2026奇点智能技术大会(https://ml-summit.org) 本届大会首次设立“AI法律咨询”专项分论坛,聚焦大模型在司法辅助、合同审查、合规推理与法律知识图谱构建中的前沿实践。来自全球12个国家的37家机构…...

【研报314】Robotaxi行业报告:中美领跑,单车盈利转正,市场规模迎爆发式增长

本报告提供限时下载,请查看文后提示以下仅为报告部分内容:摘要:2026年Robotaxi行业进入规模化商业化关键期,政策放开、技术成熟、成本下降、单位经济模型转正四大催化共振。行业呈现中美主导、多强竞技格局,Waymo、特斯…...

翻拍识别-翻拍检测-图片翻拍识别-图像翻拍检测-图片造假检测API接口介绍

前言 翻拍识别能够识别出通过手机翻拍出的照片,比如商品货架陈列图片和地堆商品陈列图片,可降低人工审核人力,高效审核零售业务中通过翻拍原有图片来造假的图片。 翻拍识别核心是通过算法模型,精准识别对屏幕进行翻拍的造假照片&…...

Llama-3.2V-11B-cot生产环境:高并发视觉推理API的负载均衡与容错部署

Llama-3.2V-11B-cot生产环境:高并发视觉推理API的负载均衡与容错部署 1. 引言:从单机到集群的必经之路 你刚刚在本地跑通了Llama-3.2V-11B-cot,看着它准确分析图片、一步步推理出结论,感觉很不错。但当你兴奋地把这个服务分享给…...

联想小新潮7000-13黑苹果安装全记录:无需无线网卡+双系统共存(附EFI文件)

联想小新潮7000-13黑苹果实战指南:无网卡方案与双系统精调 最近两年,黑苹果社区的技术方案越来越成熟,特别是对于联想小新潮7000-13这类热门机型,已经形成了相对稳定的解决方案。作为一名从2018年开始折腾黑苹果的老玩家&#xf…...

CATIA二次开发实战:BOM表智能生成与数据联动优化

1. 为什么需要BOM表智能生成工具 在机械设计领域,BOM表(物料清单)就像是一份产品的"身份证",记录着所有零件的关键信息。我做过一个统计,在常规的汽车零部件开发项目中,工程师平均要花费15%的工作…...

Ltspice-压控电压源E(VCVS)

在电子电路仿真软件LTspice中,压控电压源(Voltage-Controlled Voltage Source, VCVS)是一个极其强大且基础的元件。它不仅是模拟电路理论中的核心概念,也是我们在仿真中构建理想放大器、缓冲器和复杂数学模型的重要工具。一、什么…...

等保测评踩坑实录:CentOS 7.6三权分立配置后,为什么我的sudo命令失效了?

等保测评实战:CentOS三权分立后sudo失效的深度排查指南 最近在帮客户做三级等保整改时,遇到一个典型问题:按照标准流程配置完三权分立(系统管理员、审计管理员、安全管理员)后,新创建的管理员账号执行sudo命…...

TranslucentTB安装终极指南:3步让Windows任务栏变透明

TranslucentTB安装终极指南:3步让Windows任务栏变透明 【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB TranslucentTB是一款轻…...