AI入门指南(二):算法、训练、模型、大模型是什么?
文章目录
- 一、前言
- 二、算法是什么?
- 概念
- 实际应用
- 三、训练是什么?
- 概念
- 实际应用
- 四、模型是什么?
- 概念
- 实际应用
- 小结
- 五、大模型是什么?
- 概念
- 大模型和小模型有什么区别?
- 大模型分类
- 实际应用
- 六、总结
- 七、参考资料
一、前言
人工智能(AI)已经成为现代科技的热门话题,但对于刚接触这个领域的人来说,其中的一些基本概念可能会感到困惑。本文将带你了解AI的几个关键概念:算法、模型、训练和大模型,并通过生活中的例子和实际应用来深入浅出地解释这些概念。
二、算法是什么?
概念
算法是一系列解决问题的步骤和规则,用于特定问题的解决或任务的完成。它类似于烹饪食谱,提供了从原材料到成品的详细步骤。
例如,程序员初学时接触的‘冒泡排序’、‘快速排序’、‘二分查找法’都是算法的典型例子。
而在AI领域,算法更为复杂和高级,如决策树、线性回归、朴素贝叶斯等。
总的来说,算法是处理数据并找出规律的工具。
实际应用
我们可以通过一个银行客户经理的贷款操作例子来说明算法的实际应用。假设你是一名A银行的客户经理,以下是你总结的贷款申请结果:
| 姓名 | 拥有工作 | 拥有房产 | 信誉 | 贷款结果 |
|---|---|---|---|---|
| 张三 | 否 | 否 | 一般 | 拒绝 |
| 李四 | 否 | 否 | 一般 | 拒绝 |
| 王五 | 是 | 否 | 好 | 批准 |
| 赵六 | 是 | 是 | 好 | 批准 |
| 钱七 | 否 | 是 | 一般 | 批准 |
| 孙八 | 否 | 否 | 一般 | 拒绝 |
| 周九 | 是 | 否 | 好 | 批准 |
| 吴十 | 是 | 是 | 好 | 批准 |
| 郑十一 | 否 | 否 | 非常好 | 批准 |
| 王十二 | 是 | 是 | 非常好 | 批准 |
| 冯十三 | 是 | 是 | 非常好 | 批准 |
| 陈十四 | 是 | 否 | 好 | 批准 |
| 褚十五 | 是 | 是 | 好 | 批准 |
| 卫十六 | 否 | 否 | 一般 | 拒绝 |
| 蒋十七 | 否 | 否 | 一般 | 拒绝 |
可以看出我们通过工作、房产、信誉三个维度来人工决策是否放贷。那么,能否通过算法自动分析并得出贷款决策呢?当然可以,我们可以使用决策树-基尼系数算法:

基尼系数算法用于计算出不同维度的决策权重,数值越小越重要。为了便于理解,我们不展示基尼系数的推导公式,只展示最终结果:
| 维度 | 基尼系数(数值越小越重要) |
|---|---|
| 拥有工作 | 0.1 |
| 拥有房产 | 0.19875 |
| 信誉 | 0.21875 |
根据以上决策占比可以看出工作权重最大,信誉权重最低,我们得到如下决策树结构:

以上便是对算法的讲解部分
三、训练是什么?
概念
训练是将模型和算法结合起来的过程,指使用训练数据反复应用算法进行优化,从而生成最终的模型。
实际应用
我们仍以决策树算法为例,之前我们提供了贷款申请结果表格(15条训练数据)。通过这些数据,我们使用决策树-基尼系数算法,最终生成了一个适用于A银行的贷款决策树。这就是训练的过程。在训练过程中,决策树会不断优化和改进。
例如,如果我们仅用5条数据来训练,如下:
| 姓名 | 拥有工作 | 拥有房产 | 信誉 | 贷款结果 |
|---|---|---|---|---|
| 张三 | 否 | 否 | 一般 | 拒绝 |
| 李四 | 否 | 否 | 一般 | 拒绝 |
| 王五 | 是 | 否 | 好 | 批准 |
| 赵六 | 是 | 是 | 好 | 批准 |
| 钱七 | 否 | 是 | 一般 | 批准 |
基于有限的数据,计算出的决策树模型可能如下:拥有房产是最重要的决定因素,其次是信誉和工作。

但通过大量的训练数据不断优化,最终得出了一个更符合实际情况的决策树模型:拥有工作是最重要的决定因素,其次是房产和信誉。

以上便是训练的过程,可以看出,只有基于大量的真实数据,才能得出较好的结果。
四、模型是什么?
概念
模型是由算法在处理大量数据后“学习”到的结果。可以把模型看作是算法在实际数据中的具体应用。
模型是算法在特定场景中的具体实现,是解决特定问题的方法。
实际应用
在前面,我们通过决策树算法和15条数据训练得到了一个可以解决A银行贷款问题的决策树模型,用来决定是否批准贷款。这就是模型在实际场景中的应用。
但是请注意:这个模型只能解决A银行贷款的具体场景。如果换成B银行或C银行,情况就不同了,因为每个银行的贷款审核标准各异。因此,A银行生成的贷款模型不适用于B银行。这体现了模型的特点:模型是算法在特定场景中的具体实现。同一个算法可以根据不同的场景生成不同的模型,但这些模型之间不能互换使用。
再举一个例子:电商推荐。假设电商A平台在推广母婴产品,训练数据如下:
| 用户ID | 性别 | 拥有子女 | 购买频率 | 推荐结果 |
|---|---|---|---|---|
| 001 | 女 | 是 | 高 | 推荐 |
| 002 | 男 | 是 | 中 | 推荐 |
| 003 | 女 | 否 | 低 | 不推荐 |
| 004 | 女 | 是 | 高 | 推荐 |
| 005 | 男 | 否 | 中 | 推荐 |
| 006 | 男 | 否 | 低 | 不推荐 |
| 007 | 男 | 是 | 高 | 推荐 |
| 008 | 女 | 是 | 中 | 推荐 |
| 009 | 女 | 是 | 高 | 推荐 |
| 010 | 男 | 是 | 低 | 推荐 |
使用基尼系数算法计算各个维度的权重占比,得到如下结果:
| 维度 | 基尼系数(数值越小越重要) |
|---|---|
| 购买频率 | 0.000 |
| 拥有子女 | 0.246 |
| 性别 | 0.445 |
根据这些权重,我们推导出如下的决策树模型:

至此,我们得到了一个电商A平台在推广母婴产品的决策树模型。通过输入用户的特征数据,可以确定是否推荐产品。
以上母婴产品推荐模型和A银行贷款决策模型均只适用于特定场景,不能互换使用,但它们都用到了决策树-基尼系数算法。 这就是模型的特点。
模型是算法落地到实际生活某一个场景的方法论。
小结
算法解为解决某一问题的一系列步骤和规则。
训练是一个过程,通过应用算法来优化模型,使其能够从数据中学习。
模型是训练的结果,它是经过训练过程优化过的,用于进行实际预测或分类的工具。
五、大模型是什么?
概念
上面我们介绍了如何使用决策树算法和数据训练来构建模型。而大模型则通常基于神经网络算法,如卷积神经网络(CNN)、循环神经网络(RNN)和Transformer等。这些模型通过处理极其庞大的数据集,并且需要调整数十亿个参数来优化模型。最终,这些基于神经网络的复杂模型被称为“大模型”。
大模型的设计旨在提升表达能力和预测性能,使其能够处理更复杂的任务和数据。
大模型在许多领域具有广泛应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。它们通过对海量数据进行训练,学习复杂的模式和特征,从而能够更好地适应新数据,做出准确的预测。
大模型和小模型有什么区别?
小模型通常指参数较少、层数较浅的模型,它们具有轻量级、高效率、易于部署等优点,适用于数据量较小、计算资源有限的场景,例如移动端应用、嵌入式设备、物联网等。
而当模型的训练数据和参数不断扩大,直到达到一定的临界规模后,其表现出了一些未能预测的、更复杂的能力和特性,模型能够从原始训练数据中自动学习并发现新的、更高层次的特征和模式,这种能力被称为“涌现能力”。而具备涌现能力的机器学习模型就被认为是独立意义上的大模型,这也是其和小模型最大意义上的区别。
相比小模型,大模型通常参数较多、层数较深,具有更强的表达能力和更高的准确度,但也需要更多的计算资源和时间来训练和推理,适用于数据量较大、计算资源充足的场景,例如云端计算、高性能计算、人工智能等。
大模型分类
语言大模型(NLP): 是指在自然语言处理(NaturalLanguage Processing,NLP)领域中的一类大模型,通常用于处理文本数据和理解自然语言。这类大模型的主要特点是它们在大规模语料库上进行了训练,以学习自然语言的各种语法、语义和语境规则。例如:GPT系列 (OpenAl) 、Bard (Google) 、文心一言 (百度)
视觉大模型(CV): 是指在计算机视觉(Computer Vision,CV)领中使用的大模型,通常用于图像外理和分析。这类模型通过在大规模图像数据上进行训练,可以实现各种视觉任务,如图像分类、目标检测、图像分割、姿态估计、人脸识别等。例如: VIT系列(Google) 、文心UFO、华为盘古CV、INTERN (商汤)。
多模态大模型: 是指能够处理多种不同类型数据的大模型,例如文本、图像、音频等多模态数据。这类模型结合了NLP和CV的能力,以实现对多模态信息的综合理解和分析,从而能够更全面地理解和处理复杂的数据。例如: DingoDB多模向量数据库(九章云极DataCanvas)、DALL-E(OpenAl)、悟空画画(华为) 、midjourney。
实际应用
OpenAI的GPT-3模型就是一个典型的语言大模型。它拥有1750亿个参数,可以生成高质量的文本,完成语言翻译、问答、写作等任务。GPT-3在客服系统、内容创作、代码生成等多个领域都展现出了强大的能力。

六、总结
本文通过详细的解释和实际例子,帮助初学者理解了人工智能中的四个关键概念:算法、训练、模型和大模型。
算法是解决特定问题的一系列步骤和规则,就像烹饪食谱一样。在AI领域,算法的复杂性和高级性远超其他领域。我们以银行贷款审批为例,展示了决策树算法如何通过分析数据进行决策。
训练是将算法与数据结合的过程,通过反复优化算法,生成最终的模型。在我们的例子中,通过训练决策树算法,我们展示了如何从初始数据到最终模型的优化过程。训练过程中的关键在于使用大量真实数据,这样才能得到一个性能优越的模型。
模型是算法在处理大量数据后“学习”到的结果,是算法应用于特定场景的方法论。模型是为了解决特定问题而设计的,不同场景下需要不同的模型。例如,我们展示了电商平台的商品推荐和银行贷款审批中模型的应用,强调了模型在特定场景中的重要性和独特性。
大模型基于复杂的神经网络算法,如卷积神经网络(CNN)、循环神经网络(RNN)和Transformer等。这些大模型通过处理极其庞大的数据集,并调整数十亿个参数来优化模型,具备更强的表达能力和预测性能。我们提到了语言大模型(如GPT-3)和视觉大模型在实际应用中的广泛应用,展示了它们在自然语言处理、计算机视觉等领域的强大能力。
通过这些概念和实际应用的讲解,本文希望能够为读者提供一个全面的AI基础知识体系,帮助他们理解并掌握AI的基本原理和应用场景。
七、参考资料
- AI入门指南(一):什么是人工智能、机器学习、神经网络、深度学习? - CSDN
- 决策树算法介绍 - Wikipedia
- 机器学习中的训练和测试数据 - Machine Learning Mastery
- OpenAI GPT-3 模型介绍 - OpenAI
- 多模态大模型应用 - ScienceDirect
- 人工智能中的算法和模型 - IBM Cloud Learning
- 神经网络和深度学习 - Deep Learning Book by Ian Goodfellow, Yoshua Bengio, and Aaron Courville
相关文章:
AI入门指南(二):算法、训练、模型、大模型是什么?
文章目录 一、前言二、算法是什么?概念实际应用 三、训练是什么?概念实际应用 四、模型是什么?概念实际应用小结 五、大模型是什么?概念大模型和小模型有什么区别?大模型分类实际应用 六、总结七、参考资料 一、前言 …...
CSS已访问链接的隐私保护
摘抄自:《CSS权威指南 第四版》 有超过十年的时间,已访问的链接可以使用任何可用的CSS属性装饰,与未访问链接没有差别。 然而,大约在2005年,有几个人通过示例揭露,通过视觉样式和简单的DOM脚本就可以判断用…...
代码练习12-排序链表
给你链表的头结点 head ,请将其按 升序 排列并返回 排序后的链表 。 归并排序算法核心步骤 归并排序核心步骤如下: 把长度为n的要排序的序列,分成两个长度为n/2的子序列;对这两个子序列,分别采用归并排序;…...
Linux 内核源码分析---套接字
套接字通信 ISO 设计一种参考模型,定义组成网络的各个层,该模型由7层组成,称为OSI(开放 系统互连)模型如下: 应用层:网络服务与最终用户的接口; 表示层:数据的表示、安…...
vscode配置xdebug断点调试详细教程
注:环境为本地windows开发环境,编辑器为vscode,PHP集成环境工具为EServer vscode安装扩展并配置 安装PHP Debug 扩展中搜索 PHP Debug 并安装: 配置PHP Debug 1、点击扩展设置 2、在设置中,点击 setting.json 3、编…...
【人工智能】Transformers之Pipeline(八):文生图/图生图(text-to-image/image-to-image)
目录 一、引言 二、文生图/图生图(text-to-image/image-to-image) 2.1 文生图 2.2 图生图 2.3 技术原理 2.3.1 Diffusion扩散模型原理 2.3.2 Stable Diffusion扩散模型原理 2.4 文生图实战 2.4.1 SDXL 1.0 2.4.2 SD 2.0 2.5 模型排名 三、总…...
AI Agent 工程师认证-学习笔记(1)——【单Agent】ModelScope-Agent
学习链接: 【单Agent】ModelScope-Agent学习指南https://datawhaler.feishu.cn/wiki/GhOLwvAPkiSWmokjUgqc1eGonDf 手把手Agent开发开源教程(觉得不错的话可以star一下)https://github.com/datawhalechina/agent-tutorial 动手学Agent应用…...
【Python机器学习】树回归——将CART算法用于回归
要对数据的复杂关系建模,可以借用树结构来帮助切分数据,如何实现数据的切分?怎样才能知道是否已经充分切分?这些问题的答案取决于叶节点的建模方式。回归树假设叶节点是常数值,这种策略认为数据中的复杂关系可以用树结…...
前端(HTML + CSS)小兔鲜儿项目(仿)
前言 这是一个简单的商城网站,代码部分为HTML CSS 和少量JS代码 项目总览 一、头部区域 头部的 购物车 和 手机 用的是 文字图标,所以效果可以和文字一样 购物车右上角用的是绝对定位 logo用的是 h1 标签,用来提高网站搜索排名 二、banne…...
【Rust光年纪】构建高效终端用户界面:Rust库全面解析
构建优雅终端应用:深度评析六大Rust库 前言 随着Rust语言的流行和应用场景的不断扩大,对于终端操作和用户界面构建的需求也日益增长。本文将介绍一些在Rust语言中常用的终端操作库和用户界面构建库,以及它们的核心功能、使用场景、安装与配…...
鼠标滑动选中表格部分数据列(vue指令)
文章目录 代码指令代码使用代码 代码 指令代码 // 获得鼠标移动的范围 function getMoveRange(startClientX, endClientX, startClientY, endClientY) {const _startClientX Math.min(startClientX, endClientX);const _endClientX Math.max(startClientX, endClientX);con…...
“5G+Windows”推动全场景数字化升级:美格智能5G智能模组SRM930成功运行Windows 11系统
操作系统作为连接用户与数字世界的桥梁,在数字化迅速发展的时代扮演着至关重要的角色,智能设备与操作系统的协同工作,成为推动现代生活和商业效率的关键力量。其中,Windows系统以其广泛的应用基础和强大的兼容性成为全球最广泛使用…...
c语言学习,isupper()函数分析
1:isupper() 函数说明: 检查参数c,是否为大写英文字母。 2:函数原型: int isupper(int c) 3:函数参数: 参数c,为检测整数 4:返回值: 参数c是大写英文字母&…...
Adnroid 数据存储:SharedPreferences详解【SharedPreferencesUtils,SharedPreferences的ANR】
目录 1)SP是什么、如何使用,SPUtils 2)SP的流程 3)comit和apply 一、SP是什么,如何使用,SPUtils 1.1 SP是什么? SharedPreferences是Android平台提供的一种轻量级的数据存储方式,…...
Sentinel 规则持久化到 Nacos 实战
前言: 前面系列文章我们对 Sentinel 的作用及工作流程源码进行了分析,我们知道 Sentinel 的众多功能都是通过规则配置完成的,但是我们前面在演示的时候,发现 Sentinel 一重启,配置的规则就没有了,这是因为…...
服务器CPU天梯图2024年8月,含EYPC/至强及E3/E5
原文地址(高清无水印原图/持续更新/含榜单出处链接): >>>服务器CPU天梯图<<< 本文提供的服务器CPU天梯图数据均采集自各大专业网站,榜单图片末尾会标准其来源(挂太多链接有概率会被ban,…...
SpringBoot加载dll文件示例
1、将动态库放在resource文件目录下 2、编写相关加载逻辑 import lombok.extern.slf4j.Slf4j; import java.io.File; import java.io.IOException; import java.lang.reflect.Field; import java.util.HashMap;/*** Description: 加载动态库 .dll文件* author: Be.insighted* c…...
9.C基础_指针与数组
数组指针(一维数组) 数组指针就是" 数组的指针 ",它是一个指向数组首地址的指针变量。 1、数组名的含义 对于一维数组,数组名就是一个指针,指向数组的首地址。 基于如下代码进行分析: int a…...
C语言——结构体与共用体
C语言——结构体与共用体 结构体共用体 结构体 如果将复杂的复杂的数据类型组织成一个组合项,在一个组合项中包含若干个类型不同(当然也可以相同)的数据项。 C语言允许用户自己指定这样一种数据结构,它称为结构体。 结构体的语法…...
vs+qt项目转qt creator
1、转换方法 打开vs工程,右键项目,Qt->Create Base .pro File 后面默认OK 如果工程有include和lib路径需要配置,则转换后的工程,需要修改pro文件 2.修改pro文件 例如转换后的工程如下: 修改后 # ------------…...
TDengine 快速体验(Docker 镜像方式)
简介 TDengine 可以通过安装包、Docker 镜像 及云服务快速体验 TDengine 的功能,本节首先介绍如何通过 Docker 快速体验 TDengine,然后介绍如何在 Docker 环境下体验 TDengine 的写入和查询功能。如果你不熟悉 Docker,请使用 安装包的方式快…...
Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例
使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...
电脑插入多块移动硬盘后经常出现卡顿和蓝屏
当电脑在插入多块移动硬盘后频繁出现卡顿和蓝屏问题时,可能涉及硬件资源冲突、驱动兼容性、供电不足或系统设置等多方面原因。以下是逐步排查和解决方案: 1. 检查电源供电问题 问题原因:多块移动硬盘同时运行可能导致USB接口供电不足&#x…...
Cloudflare 从 Nginx 到 Pingora:性能、效率与安全的全面升级
在互联网的快速发展中,高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司,近期做出了一个重大技术决策:弃用长期使用的 Nginx,转而采用其内部开发…...
学校时钟系统,标准考场时钟系统,AI亮相2025高考,赛思时钟系统为教育公平筑起“精准防线”
2025年#高考 将在近日拉开帷幕,#AI 监考一度冲上热搜。当AI深度融入高考,#时间同步 不再是辅助功能,而是决定AI监考系统成败的“生命线”。 AI亮相2025高考,40种异常行为0.5秒精准识别 2025年高考即将拉开帷幕,江西、…...
【JVM面试篇】高频八股汇总——类加载和类加载器
目录 1. 讲一下类加载过程? 2. Java创建对象的过程? 3. 对象的生命周期? 4. 类加载器有哪些? 5. 双亲委派模型的作用(好处)? 6. 讲一下类的加载和双亲委派原则? 7. 双亲委派模…...
TSN交换机正在重构工业网络,PROFINET和EtherCAT会被取代吗?
在工业自动化持续演进的今天,通信网络的角色正变得愈发关键。 2025年6月6日,为期三天的华南国际工业博览会在深圳国际会展中心(宝安)圆满落幕。作为国内工业通信领域的技术型企业,光路科技(Fiberroad&…...
Qt 事件处理中 return 的深入解析
Qt 事件处理中 return 的深入解析 在 Qt 事件处理中,return 语句的使用是另一个关键概念,它与 event->accept()/event->ignore() 密切相关但作用不同。让我们详细分析一下它们之间的关系和工作原理。 核心区别:不同层级的事件处理 方…...
什么是VR全景技术
VR全景技术,全称为虚拟现实全景技术,是通过计算机图像模拟生成三维空间中的虚拟世界,使用户能够在该虚拟世界中进行全方位、无死角的观察和交互的技术。VR全景技术模拟人在真实空间中的视觉体验,结合图文、3D、音视频等多媒体元素…...
springboot 日志类切面,接口成功记录日志,失败不记录
springboot 日志类切面,接口成功记录日志,失败不记录 自定义一个注解方法 import java.lang.annotation.ElementType; import java.lang.annotation.Retention; import java.lang.annotation.RetentionPolicy; import java.lang.annotation.Target;/***…...
