AI入门指南(二):算法、训练、模型、大模型是什么?
文章目录
- 一、前言
- 二、算法是什么?
- 概念
- 实际应用
- 三、训练是什么?
- 概念
- 实际应用
- 四、模型是什么?
- 概念
- 实际应用
- 小结
- 五、大模型是什么?
- 概念
- 大模型和小模型有什么区别?
- 大模型分类
- 实际应用
- 六、总结
- 七、参考资料
一、前言
人工智能(AI)已经成为现代科技的热门话题,但对于刚接触这个领域的人来说,其中的一些基本概念可能会感到困惑。本文将带你了解AI的几个关键概念:算法、模型、训练和大模型,并通过生活中的例子和实际应用来深入浅出地解释这些概念。
二、算法是什么?
概念
算法是一系列解决问题的步骤和规则,用于特定问题的解决或任务的完成。它类似于烹饪食谱,提供了从原材料到成品的详细步骤。
例如,程序员初学时接触的‘冒泡排序’、‘快速排序’、‘二分查找法’都是算法的典型例子。
而在AI领域,算法更为复杂和高级,如决策树、线性回归、朴素贝叶斯等。
总的来说,算法是处理数据并找出规律的工具。
实际应用
我们可以通过一个银行客户经理的贷款操作例子来说明算法的实际应用。假设你是一名A银行的客户经理,以下是你总结的贷款申请结果:
姓名 | 拥有工作 | 拥有房产 | 信誉 | 贷款结果 |
---|---|---|---|---|
张三 | 否 | 否 | 一般 | 拒绝 |
李四 | 否 | 否 | 一般 | 拒绝 |
王五 | 是 | 否 | 好 | 批准 |
赵六 | 是 | 是 | 好 | 批准 |
钱七 | 否 | 是 | 一般 | 批准 |
孙八 | 否 | 否 | 一般 | 拒绝 |
周九 | 是 | 否 | 好 | 批准 |
吴十 | 是 | 是 | 好 | 批准 |
郑十一 | 否 | 否 | 非常好 | 批准 |
王十二 | 是 | 是 | 非常好 | 批准 |
冯十三 | 是 | 是 | 非常好 | 批准 |
陈十四 | 是 | 否 | 好 | 批准 |
褚十五 | 是 | 是 | 好 | 批准 |
卫十六 | 否 | 否 | 一般 | 拒绝 |
蒋十七 | 否 | 否 | 一般 | 拒绝 |
可以看出我们通过工作、房产、信誉三个维度来人工决策是否放贷。那么,能否通过算法自动分析并得出贷款决策呢?当然可以,我们可以使用决策树-基尼系数算法:
基尼系数算法用于计算出不同维度的决策权重,数值越小越重要。为了便于理解,我们不展示基尼系数的推导公式,只展示最终结果:
维度 | 基尼系数(数值越小越重要) |
---|---|
拥有工作 | 0.1 |
拥有房产 | 0.19875 |
信誉 | 0.21875 |
根据以上决策占比可以看出工作权重最大,信誉权重最低,我们得到如下决策树结构:
以上便是对算法的讲解部分
三、训练是什么?
概念
训练是将模型和算法结合起来的过程,指使用训练数据反复应用算法进行优化,从而生成最终的模型。
实际应用
我们仍以决策树算法为例,之前我们提供了贷款申请结果表格(15条训练数据)。通过这些数据,我们使用决策树-基尼系数算法,最终生成了一个适用于A银行的贷款决策树。这就是训练的过程。在训练过程中,决策树会不断优化和改进。
例如,如果我们仅用5条数据来训练,如下:
姓名 | 拥有工作 | 拥有房产 | 信誉 | 贷款结果 |
---|---|---|---|---|
张三 | 否 | 否 | 一般 | 拒绝 |
李四 | 否 | 否 | 一般 | 拒绝 |
王五 | 是 | 否 | 好 | 批准 |
赵六 | 是 | 是 | 好 | 批准 |
钱七 | 否 | 是 | 一般 | 批准 |
基于有限的数据,计算出的决策树模型可能如下:拥有房产是最重要的决定因素,其次是信誉和工作。
但通过大量的训练数据不断优化,最终得出了一个更符合实际情况的决策树模型:拥有工作是最重要的决定因素,其次是房产和信誉。
以上便是训练的过程,可以看出,只有基于大量的真实数据,才能得出较好的结果。
四、模型是什么?
概念
模型是由算法在处理大量数据后“学习”到的结果。可以把模型看作是算法在实际数据中的具体应用。
模型是算法在特定场景中的具体实现,是解决特定问题的方法。
实际应用
在前面,我们通过决策树算法和15条数据训练得到了一个可以解决A银行贷款问题的决策树模型,用来决定是否批准贷款。这就是模型在实际场景中的应用。
但是请注意:这个模型只能解决A银行贷款的具体场景。如果换成B银行或C银行,情况就不同了,因为每个银行的贷款审核标准各异。因此,A银行生成的贷款模型不适用于B银行。这体现了模型的特点:模型是算法在特定场景中的具体实现。同一个算法可以根据不同的场景生成不同的模型,但这些模型之间不能互换使用。
再举一个例子:电商推荐。假设电商A平台在推广母婴产品,训练数据如下:
用户ID | 性别 | 拥有子女 | 购买频率 | 推荐结果 |
---|---|---|---|---|
001 | 女 | 是 | 高 | 推荐 |
002 | 男 | 是 | 中 | 推荐 |
003 | 女 | 否 | 低 | 不推荐 |
004 | 女 | 是 | 高 | 推荐 |
005 | 男 | 否 | 中 | 推荐 |
006 | 男 | 否 | 低 | 不推荐 |
007 | 男 | 是 | 高 | 推荐 |
008 | 女 | 是 | 中 | 推荐 |
009 | 女 | 是 | 高 | 推荐 |
010 | 男 | 是 | 低 | 推荐 |
使用基尼系数算法计算各个维度的权重占比,得到如下结果:
维度 | 基尼系数(数值越小越重要) |
---|---|
购买频率 | 0.000 |
拥有子女 | 0.246 |
性别 | 0.445 |
根据这些权重,我们推导出如下的决策树模型:
至此,我们得到了一个电商A平台在推广母婴产品的决策树模型。通过输入用户的特征数据,可以确定是否推荐产品。
以上母婴产品推荐模型和A银行贷款决策模型均只适用于特定场景,不能互换使用,但它们都用到了决策树-基尼系数算法。 这就是模型的特点。
模型是算法落地到实际生活某一个场景的方法论。
小结
算法解为解决某一问题的一系列步骤和规则。
训练是一个过程,通过应用算法来优化模型,使其能够从数据中学习。
模型是训练的结果,它是经过训练过程优化过的,用于进行实际预测或分类的工具。
五、大模型是什么?
概念
上面我们介绍了如何使用决策树算法和数据训练来构建模型。而大模型则通常基于神经网络算法,如卷积神经网络(CNN)、循环神经网络(RNN)和Transformer等。这些模型通过处理极其庞大的数据集,并且需要调整数十亿个参数来优化模型。最终,这些基于神经网络的复杂模型被称为“大模型”。
大模型的设计旨在提升表达能力和预测性能,使其能够处理更复杂的任务和数据。
大模型在许多领域具有广泛应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。它们通过对海量数据进行训练,学习复杂的模式和特征,从而能够更好地适应新数据,做出准确的预测。
大模型和小模型有什么区别?
小模型通常指参数较少、层数较浅的模型,它们具有轻量级、高效率、易于部署等优点,适用于数据量较小、计算资源有限的场景,例如移动端应用、嵌入式设备、物联网等。
而当模型的训练数据和参数不断扩大,直到达到一定的临界规模后,其表现出了一些未能预测的、更复杂的能力和特性,模型能够从原始训练数据中自动学习并发现新的、更高层次的特征和模式,这种能力被称为“涌现能力”。而具备涌现能力的机器学习模型就被认为是独立意义上的大模型,这也是其和小模型最大意义上的区别。
相比小模型,大模型通常参数较多、层数较深,具有更强的表达能力和更高的准确度,但也需要更多的计算资源和时间来训练和推理,适用于数据量较大、计算资源充足的场景,例如云端计算、高性能计算、人工智能等。
大模型分类
语言大模型(NLP): 是指在自然语言处理(NaturalLanguage Processing,NLP)领域中的一类大模型,通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练,以学习自然语言的各种语法、语义和语境规则。例如:GPT系列 (OpenAl) 、Bard (Google) 、文心一言 (百度)
视觉大模型(CV): 是指在计算机视觉(Computer Vision,CV)领中使用的大模型,通常用于图像外理和分析。这类模型通过在大规模图像数据上进行训练,可以实现各种视觉任务,如图像分类、目标检测、图像分割、姿态估计、人脸识别等。例如: VIT系列(Google) 、文心UFO、华为盘古CV、INTERN (商汤)。
多模态大模型: 是指能够处理多种不同类型数据的大模型,例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力,以实现对多模态信息的综合理解和分析,从而能够更全面地理解和处理复杂的数据。例如: DingoDB多模向量数据库(九章云极DataCanvas)、DALL-E(OpenAl)、悟空画画(华为) 、midjourney。
实际应用
OpenAI的GPT-3模型就是一个典型的语言大模型。它拥有1750亿个参数,可以生成高质量的文本,完成语言翻译、问答、写作等任务。GPT-3在客服系统、内容创作、代码生成等多个领域都展现出了强大的能力。
六、总结
本文通过详细的解释和实际例子,帮助初学者理解了人工智能中的四个关键概念:算法、训练、模型和大模型。
算法是解决特定问题的一系列步骤和规则,就像烹饪食谱一样。在AI领域,算法的复杂性和高级性远超其他领域。我们以银行贷款审批为例,展示了决策树算法如何通过分析数据进行决策。
训练是将算法与数据结合的过程,通过反复优化算法,生成最终的模型。在我们的例子中,通过训练决策树算法,我们展示了如何从初始数据到最终模型的优化过程。训练过程中的关键在于使用大量真实数据,这样才能得到一个性能优越的模型。
模型是算法在处理大量数据后“学习”到的结果,是算法应用于特定场景的方法论。模型是为了解决特定问题而设计的,不同场景下需要不同的模型。例如,我们展示了电商平台的商品推荐和银行贷款审批中模型的应用,强调了模型在特定场景中的重要性和独特性。
大模型基于复杂的神经网络算法,如卷积神经网络(CNN)、循环神经网络(RNN)和Transformer等。这些大模型通过处理极其庞大的数据集,并调整数十亿个参数来优化模型,具备更强的表达能力和预测性能。我们提到了语言大模型(如GPT-3)和视觉大模型在实际应用中的广泛应用,展示了它们在自然语言处理、计算机视觉等领域的强大能力。
通过这些概念和实际应用的讲解,本文希望能够为读者提供一个全面的AI基础知识体系,帮助他们理解并掌握AI的基本原理和应用场景。
七、参考资料
- AI入门指南(一):什么是人工智能、机器学习、神经网络、深度学习? - CSDN
- 决策树算法介绍 - Wikipedia
- 机器学习中的训练和测试数据 - Machine Learning Mastery
- OpenAI GPT-3 模型介绍 - OpenAI
- 多模态大模型应用 - ScienceDirect
- 人工智能中的算法和模型 - IBM Cloud Learning
- 神经网络和深度学习 - Deep Learning Book by Ian Goodfellow, Yoshua Bengio, and Aaron Courville
相关文章:

AI入门指南(二):算法、训练、模型、大模型是什么?
文章目录 一、前言二、算法是什么?概念实际应用 三、训练是什么?概念实际应用 四、模型是什么?概念实际应用小结 五、大模型是什么?概念大模型和小模型有什么区别?大模型分类实际应用 六、总结七、参考资料 一、前言 …...
CSS已访问链接的隐私保护
摘抄自:《CSS权威指南 第四版》 有超过十年的时间,已访问的链接可以使用任何可用的CSS属性装饰,与未访问链接没有差别。 然而,大约在2005年,有几个人通过示例揭露,通过视觉样式和简单的DOM脚本就可以判断用…...

代码练习12-排序链表
给你链表的头结点 head ,请将其按 升序 排列并返回 排序后的链表 。 归并排序算法核心步骤 归并排序核心步骤如下: 把长度为n的要排序的序列,分成两个长度为n/2的子序列;对这两个子序列,分别采用归并排序;…...

Linux 内核源码分析---套接字
套接字通信 ISO 设计一种参考模型,定义组成网络的各个层,该模型由7层组成,称为OSI(开放 系统互连)模型如下: 应用层:网络服务与最终用户的接口; 表示层:数据的表示、安…...

vscode配置xdebug断点调试详细教程
注:环境为本地windows开发环境,编辑器为vscode,PHP集成环境工具为EServer vscode安装扩展并配置 安装PHP Debug 扩展中搜索 PHP Debug 并安装: 配置PHP Debug 1、点击扩展设置 2、在设置中,点击 setting.json 3、编…...

【人工智能】Transformers之Pipeline(八):文生图/图生图(text-to-image/image-to-image)
目录 一、引言 二、文生图/图生图(text-to-image/image-to-image) 2.1 文生图 2.2 图生图 2.3 技术原理 2.3.1 Diffusion扩散模型原理 2.3.2 Stable Diffusion扩散模型原理 2.4 文生图实战 2.4.1 SDXL 1.0 2.4.2 SD 2.0 2.5 模型排名 三、总…...

AI Agent 工程师认证-学习笔记(1)——【单Agent】ModelScope-Agent
学习链接: 【单Agent】ModelScope-Agent学习指南https://datawhaler.feishu.cn/wiki/GhOLwvAPkiSWmokjUgqc1eGonDf 手把手Agent开发开源教程(觉得不错的话可以star一下)https://github.com/datawhalechina/agent-tutorial 动手学Agent应用…...
【Python机器学习】树回归——将CART算法用于回归
要对数据的复杂关系建模,可以借用树结构来帮助切分数据,如何实现数据的切分?怎样才能知道是否已经充分切分?这些问题的答案取决于叶节点的建模方式。回归树假设叶节点是常数值,这种策略认为数据中的复杂关系可以用树结…...

前端(HTML + CSS)小兔鲜儿项目(仿)
前言 这是一个简单的商城网站,代码部分为HTML CSS 和少量JS代码 项目总览 一、头部区域 头部的 购物车 和 手机 用的是 文字图标,所以效果可以和文字一样 购物车右上角用的是绝对定位 logo用的是 h1 标签,用来提高网站搜索排名 二、banne…...
【Rust光年纪】构建高效终端用户界面:Rust库全面解析
构建优雅终端应用:深度评析六大Rust库 前言 随着Rust语言的流行和应用场景的不断扩大,对于终端操作和用户界面构建的需求也日益增长。本文将介绍一些在Rust语言中常用的终端操作库和用户界面构建库,以及它们的核心功能、使用场景、安装与配…...
鼠标滑动选中表格部分数据列(vue指令)
文章目录 代码指令代码使用代码 代码 指令代码 // 获得鼠标移动的范围 function getMoveRange(startClientX, endClientX, startClientY, endClientY) {const _startClientX Math.min(startClientX, endClientX);const _endClientX Math.max(startClientX, endClientX);con…...

“5G+Windows”推动全场景数字化升级:美格智能5G智能模组SRM930成功运行Windows 11系统
操作系统作为连接用户与数字世界的桥梁,在数字化迅速发展的时代扮演着至关重要的角色,智能设备与操作系统的协同工作,成为推动现代生活和商业效率的关键力量。其中,Windows系统以其广泛的应用基础和强大的兼容性成为全球最广泛使用…...

c语言学习,isupper()函数分析
1:isupper() 函数说明: 检查参数c,是否为大写英文字母。 2:函数原型: int isupper(int c) 3:函数参数: 参数c,为检测整数 4:返回值: 参数c是大写英文字母&…...

Adnroid 数据存储:SharedPreferences详解【SharedPreferencesUtils,SharedPreferences的ANR】
目录 1)SP是什么、如何使用,SPUtils 2)SP的流程 3)comit和apply 一、SP是什么,如何使用,SPUtils 1.1 SP是什么? SharedPreferences是Android平台提供的一种轻量级的数据存储方式,…...

Sentinel 规则持久化到 Nacos 实战
前言: 前面系列文章我们对 Sentinel 的作用及工作流程源码进行了分析,我们知道 Sentinel 的众多功能都是通过规则配置完成的,但是我们前面在演示的时候,发现 Sentinel 一重启,配置的规则就没有了,这是因为…...

服务器CPU天梯图2024年8月,含EYPC/至强及E3/E5
原文地址(高清无水印原图/持续更新/含榜单出处链接): >>>服务器CPU天梯图<<< 本文提供的服务器CPU天梯图数据均采集自各大专业网站,榜单图片末尾会标准其来源(挂太多链接有概率会被ban,…...

SpringBoot加载dll文件示例
1、将动态库放在resource文件目录下 2、编写相关加载逻辑 import lombok.extern.slf4j.Slf4j; import java.io.File; import java.io.IOException; import java.lang.reflect.Field; import java.util.HashMap;/*** Description: 加载动态库 .dll文件* author: Be.insighted* c…...

9.C基础_指针与数组
数组指针(一维数组) 数组指针就是" 数组的指针 ",它是一个指向数组首地址的指针变量。 1、数组名的含义 对于一维数组,数组名就是一个指针,指向数组的首地址。 基于如下代码进行分析: int a…...

C语言——结构体与共用体
C语言——结构体与共用体 结构体共用体 结构体 如果将复杂的复杂的数据类型组织成一个组合项,在一个组合项中包含若干个类型不同(当然也可以相同)的数据项。 C语言允许用户自己指定这样一种数据结构,它称为结构体。 结构体的语法…...

vs+qt项目转qt creator
1、转换方法 打开vs工程,右键项目,Qt->Create Base .pro File 后面默认OK 如果工程有include和lib路径需要配置,则转换后的工程,需要修改pro文件 2.修改pro文件 例如转换后的工程如下: 修改后 # ------------…...

日语AI面试高效通关秘籍:专业解读与青柚面试智能助攻
在如今就业市场竞争日益激烈的背景下,越来越多的求职者将目光投向了日本及中日双语岗位。但是,一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧?面对生疏的日语交流环境,即便提前恶补了…...
云计算——弹性云计算器(ECS)
弹性云服务器:ECS 概述 云计算重构了ICT系统,云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台,包含如下主要概念。 ECS(Elastic Cloud Server):即弹性云服务器,是云计算…...

无法与IP建立连接,未能下载VSCode服务器
如题,在远程连接服务器的时候突然遇到了这个提示。 查阅了一圈,发现是VSCode版本自动更新惹的祸!!! 在VSCode的帮助->关于这里发现前几天VSCode自动更新了,我的版本号变成了1.100.3 才导致了远程连接出…...

Nuxt.js 中的路由配置详解
Nuxt.js 通过其内置的路由系统简化了应用的路由配置,使得开发者可以轻松地管理页面导航和 URL 结构。路由配置主要涉及页面组件的组织、动态路由的设置以及路由元信息的配置。 自动路由生成 Nuxt.js 会根据 pages 目录下的文件结构自动生成路由配置。每个文件都会对…...
【android bluetooth 框架分析 04】【bt-framework 层详解 1】【BluetoothProperties介绍】
1. BluetoothProperties介绍 libsysprop/srcs/android/sysprop/BluetoothProperties.sysprop BluetoothProperties.sysprop 是 Android AOSP 中的一种 系统属性定义文件(System Property Definition File),用于声明和管理 Bluetooth 模块相…...

Python爬虫(一):爬虫伪装
一、网站防爬机制概述 在当今互联网环境中,具有一定规模或盈利性质的网站几乎都实施了各种防爬措施。这些措施主要分为两大类: 身份验证机制:直接将未经授权的爬虫阻挡在外反爬技术体系:通过各种技术手段增加爬虫获取数据的难度…...

tree 树组件大数据卡顿问题优化
问题背景 项目中有用到树组件用来做文件目录,但是由于这个树组件的节点越来越多,导致页面在滚动这个树组件的时候浏览器就很容易卡死。这种问题基本上都是因为dom节点太多,导致的浏览器卡顿,这里很明显就需要用到虚拟列表的技术&…...
AGain DB和倍数增益的关系
我在设置一款索尼CMOS芯片时,Again增益0db变化为6DB,画面的变化只有2倍DN的增益,比如10变为20。 这与dB和线性增益的关系以及传感器处理流程有关。以下是具体原因分析: 1. dB与线性增益的换算关系 6dB对应的理论线性增益应为&…...
腾讯云V3签名
想要接入腾讯云的Api,必然先按其文档计算出所要求的签名。 之前也调用过腾讯云的接口,但总是卡在签名这一步,最后放弃选择SDK,这次终于自己代码实现。 可能腾讯云翻新了接口文档,现在阅读起来,清晰了很多&…...

计算机基础知识解析:从应用到架构的全面拆解
目录 前言 1、 计算机的应用领域:无处不在的数字助手 2、 计算机的进化史:从算盘到量子计算 3、计算机的分类:不止 “台式机和笔记本” 4、计算机的组件:硬件与软件的协同 4.1 硬件:五大核心部件 4.2 软件&#…...