人工智能(AI)的不同维度分类
人工智能(AI)的分类
对机器学习进行分类的方式多种多样,可以根据算法的特性、学习方式、任务类型等不同维度进行分类这些分类都不是互斥的:
1、按数据模态不同:图像,文本,语音,多态等
2、按目标函数不同:判别式模型,生成式模型等.
3、按学习方式不同:监督、无监督、半监督、强化学习等。
4、按任务类型不同:回归、分类、聚类、降维、生成等,
一、按数据模态分类
1. 图像模态
特点:处理二维/三维像素矩阵数据
-
示例:
-
图像分类(ResNet识别ImageNet千类物体)
-
目标检测(YOLO实时检测交通信号灯)
-
医学影像分析(UNet分割肿瘤区域)
-

自动驾驶
2. 文本模态
特点:处理字符序列或词嵌入向量
-
示例:
-
机器翻译(Transformer实现中英互译)
-
情感分析(BERT判断评论情感极性)
-
文本摘要(GPT-4生成新闻要点)
-
3. 语音模态
特点:处理时频域声学特征
-
示例:
-
语音识别(Whisper转写会议录音)
-
声纹识别(X-Vector验证用户身份)
-
语音合成(VITS生成拟人化语音)
-

智能客服
4. 多模态
特点:融合多种数据模态
-
示例:
-
视觉问答(CLIP+VQA解析"图中多少人戴口罩")
-
视频描述生成(Flamingo生成足球比赛解说)
-
跨模态检索(图文匹配搜索相似风格画作)
-
二、按目标函数分类
1. 判别式模型
特点:学习条件概率P(Y|X)
-
示例:
-
逻辑回归(预测用户点击概率)
-
SVM(高维空间划分邮件是否为垃圾邮件)
-
目标检测模型(输出边界框坐标和类别)
-
2. 生成式模型
特点:学习联合概率P(X,Y)
-
示例:
-
GAN(生成逼真人脸图像)
-
VAE(重构分子结构并生成新化合物)
-
扩散模型(Stable Diffusion生成艺术画作)
-
特殊类型:
-
能量模型(EBM建模复杂分布)
-
流模型(Glow实现可逆图像生成)
三、按学习方式分类
1. 监督学习
特点:使用标注数据
-
示例:
-
图像分类(ImageNet标注数据集训练ResNet)
-
时序预测(LSTM基于历史销量预测未来需求)
-
2. 无监督学习
特点:挖掘数据内在结构
-
示例:
-
聚类分析(K-means对用户消费行为分组)
-
异常检测(Isolation Forest识别信用卡欺诈)
-
3. 半监督学习
特点:少量标注+大量未标注数据
-
示例:
-
自训练(用10%标注医疗影像迭代优化模型)
-
一致性正则化(FixMatch提升图像分类效果)
-
4. 强化学习
特点:通过奖励机制学习策略
-
示例:
-
游戏AI(AlphaGo自我对弈提升棋力)
-
机器人控制(DDPG算法实现机械臂抓取)
-
资源调度(Q-learning优化数据中心能耗)
-
四、按任务类型分类
1. 回归任务
特点:预测连续值
-
示例:
-
房价预测(基于面积/地段预测数值)
-
股票趋势预测(输出未来3日价格曲线)
-
2. 分类任务
特点:预测离散类别
-
示例:
-
垃圾邮件识别(二分类:正常/垃圾)
-
新闻主题分类(多分类:政治/经济/体育)
-
3. 聚类任务
特点:无监督数据分组
-
示例:
-
客户细分(DBSCAN发现高价值用户群体)
-
基因序列分析(层次聚类识别相似基因型)
-
4. 降维任务
特点:压缩数据维度
-
示例:
-
可视化(t-SNE将高维数据投影到2D平面)
-
特征工程(PCA提取人脸主要特征成分)
-
5. 生成任务
特点:创造新数据
-
示例:
-
文本续写(GPT-4完成故事创作)
-
分子设计(GFlowNet生成潜在药物分子)
-
风格迁移(CycleGAN将照片转为梵高画风)
-
关键差异对比表
| 分类维度 | 典型差异点 | 技术代表案例对比 |
|---|---|---|
| 数据模态 | 输入数据结构差异 | CNN处理图像 vs LSTM处理文本 |
| 目标函数 | 建模概率分布方向不同 | SVM分类 vs GAN生成 |
| 学习方式 | 数据标注要求程度不同 | 监督学习需要100%标注 vs 强化学习仅需奖励信号 |
| 任务类型 | 输出形式本质差异 | 回归输出连续值 vs 分类输出离散标签 |
典型混合型案例
-
多模态+生成任务:DALL-E 3根据文本生成图像
-
强化学习+分类任务:DeepMind AlphaFold预测蛋白质结构
-
半监督+降维任务:SimCLR利用对比学习实现图像表征压缩
这种分类体系为理解AI技术提供了多维视角,实际应用中常出现跨类别组合,如"基于强化学习的多模态视频生成系统"即融合了四种分类维度。
相关文章:
人工智能(AI)的不同维度分类
人工智能(AI)的分类 对机器学习进行分类的方式多种多样,可以根据算法的特性、学习方式、任务类型等不同维度进行分类这些分类都不是互斥的: 1、按数据模态不同:图像,文本,语音,多态等 2、按目标函数不同:判别式模型…...
三、linux字符驱动详解
在上一节完成NFS开发环境的搭建后,本节将探讨Linux字符设备驱动的开发。字符设备驱动作为Linux内核的重要组成部分,主要负责管理与字符设备(如串口、键盘等)的交互,并为用户空间程序提供统一的读写操作接口。 驱动代码…...
谈谈 ES 6.8 到 7.10 的功能变迁(1)- 性能优化篇
前言 ES 7.10 可能是现在比较常见的 ES 版本。但是对于一些相迭代比较慢的早期业务系统来说,ES 6.8 是一个名副其实的“钉子户”。 借着工作内升级调研的任务东风,我整理从 ES 6.8 到 ES 7.10 ELastic 重点列出的新增功能和优化内容。将分为 6 个篇幅给…...
我用Ai学Android Jetpack Compose之LinearProgressIndicator
本篇,我们来学习LinearProgressIndicator,答案来自 通义千问 Q:我想学习LinearProgressIndicator,麻烦你介绍一下 当然可以!LinearProgressIndicator 是 Jetpack Compose 中的一个组件,用于显示线性进度条。它非常适…...
代码随想录算法训练营day40(补0208)
买卖股票专栏 1.买卖股票最佳时机 贪心法,好想 题目 121. 买卖股票的最佳时机 给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票,并选择在 未来的某一个不同的日子 卖…...
在群晖上使用Docker安装思源笔记
最近一段时间,docker的镜像地址都失效了,在群晖系统中,无论是早期版本的docker,还是最新版本中的Container Manager,注册表中都无法链接到docker的镜像,于是,就花了点时间查找资料&#x…...
【废物研究生刷算法】字符串
文章目录 1. 反转字符串2. 替换数字3. 反转字符串中的单词4. 右旋字符串总结1、字符串处理函数2、字符串切片 如果使用python处理字符串,有很多py内置的函数可以使用,主要还是记住这些处理方法。 1. 反转字符串 class Solution:def reverseStr(self, s, …...
断开ssh连接程序继续运行
在使用 SSH 远程连接服务器时,我们常希望在断开连接后仍然让程序继续运行,以下是几种常见的方法: 1. 使用 screen 或 tmux screen 和 tmux 是两款非常强大的终端复用工具,它们允许你在后台运行会话,即使断开 SSH 连接…...
Kafka客户端连接服务端异常 Can‘t resolve address: VM-12-16-centos:9092
前置条件: 已在CentOs上搭建好kafka节点服务器,已启动kafka服务已在Springboot项目中引入kafka客户端配置,kafka.bootstrap-serverip:port,并启动客户端服务 异常过程: 在客户端Springboot服务启动过程,控…...
视频mp4垂直拼接 水平拼接
视频mp4垂直拼接 水平拼接 pinjie_v.py import imageio import numpy as np import os import cv2def pinjie_v(dir1,dir2,out_dir):os.makedirs(out_dir, exist_okTrue)# 获取目录下的所有视频文件video_files_1 [f for f in os.listdir(dir1) if f.endswith(.mp4)]video_fi…...
idea-代码补全快捷键
文章目录 前言idea-代码补全快捷键1. 基本补全2. 类型匹配补全3. 后缀补全4. 代码补全 前言 如果您觉得有用的话,记得给博主点个赞,评论,收藏一键三连啊,写作不易啊^ _ ^。 而且听说点赞的人每天的运气都不会太差,…...
Transformer为什么需要多头注意力(Multi-Head Attention)?如果没有多头会怎么样?
直接回答 关键点: Transformer 中的多头注意力(Multi-Head Attention)允许模型同时关注输入数据的不同方面,提升性能。 如果没有多头,模型可能无法捕捉复杂关系,表现会下降。 什么是多头注意力ÿ…...
我们来学人工智能 -- DeepSeek客户端
DeepSeek客户端 题记使用后记系列文章 题记 我选择了 Cherry Studio是国内产品由CherryHQ团队开源是一个平台在这里,有豆包、kimi、通义千问的入口当然,最主要是作为大模型的UI正如标题,这里,作为DeepSeep的客户端 使用 下载本…...
LeetCode 热题 100_在排序数组中查找元素的第一个和最后一个位置(65_34_中等_C++)(二分查找)(一次二分查找+挨个搜索;两次二分查找)
LeetCode 热题 100_在排序数组中查找元素的第一个和最后一个位置(65_34) 题目描述:输入输出样例:题解:解题思路:思路一(一次二分查找挨个搜索):思路二(两次二…...
洛谷 P1102 A-B 数对(详解)c++
题目链接:P1102 A-B 数对 - 洛谷 1.题目分析 2.算法原理 解法一:暴力 - 两层for循环 因为这道题需要你在数组中找出来两个数,让这两个数的差等于定值C就可以了,一层for循环枚举A第二层for循环枚举B,求一下看是否等于…...
计算机视觉:主流数据集整理
第一章:计算机视觉中图像的基础认知 第二章:计算机视觉:卷积神经网络(CNN)基本概念(一) 第三章:计算机视觉:卷积神经网络(CNN)基本概念(二) 第四章:搭建一个经典的LeNet5神经网络(附代码) 第五章࿱…...
2025软件测试面试常问的题(详细解析)
🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 测试技术面试题 1、什么是兼容性测试?兼容性测试侧重哪些方面? 参考答案: 兼容测试主要是检查软件在不同的硬件平台、软件平…...
项目POC的作用是什么
在项目管理和开发中,POC(Proof of Concept,概念验证)作为一个关键的步骤,扮演着非常重要的角色。POC的作用主要是验证某个概念、技术或方案的可行性,通过小规模实验或原型验证项目的关键假设,帮…...
初探动态规划--记忆化搜索
记忆化搜索 暴力dfs 记录答案 记忆化搜索是一种优化技术,结合了暴力深度优先搜索 (dfs) 和记录答案的方式。 在动态规划的学习过程中,我们可以将问题划分为以下阶段:dfs暴力搜索,记忆化搜索,以及最终的递推。 动态规…...
java开发——为什么要使用动态代理?
举个例子:假如有一个杀手专杀男的,不杀女的。代码如下: public interface Killer {void kill(String name, String sex);void watch(String name); }public class ManKiller implements Killer {Overridepublic void kill(String name, Stri…...
集合 数据结构 泛型
文章目录 1.Collection集合1.1数组和集合的区别【理解】1.2集合类体系结构【理解】1.3Collection 集合概述和使用【应用】内部类匿名内部类Lambda表达式 1.4Collection集合的遍历【应用】1.5增强for循环【应用】 2.List集合2.1List集合的概述和特点【记忆】2.2List集合的特有方…...
特征提取:如何从不同模态中获取有效信息?
在多模态学习中,特征提取是一个至关重要的过程。它是将原始数据(如文本、图像、视频和语音等)转化为机器能够理解和处理的特征的核心步骤。不同于传统的单一模态任务,在多模态学习中,如何有效地从每种模态中提取出有意…...
vue-treeselect显示unknown的问题及解决
问题 解决办法 去node-modules包里面找到这个组件的源码,在它dist文件里面找到这个文件,然后搜索unknown,把它删掉就可以解决了。...
代码随想录-训练营-day35
309. 买卖股票的最佳时机含冷冻期 - 力扣(LeetCode) 这个题比起我们的买卖股票二来说多了一个冷冻期的说法,也就是我们卖出股票的第二天无法买入股票。 这样对我们而言,dp数组的含义,或者说dp数组中的状态显然就不能是…...
AI汽车新风向:「死磕」AI底盘,引爆线控底盘新增长拐点
2025开年,DeepSeek火爆出圈,包括吉利、东风汽车、上汽、广汽、长城、长安、比亚迪等车企相继官宣接入,掀起了“AI定义汽车”浪潮。 而这股最火的AI汽车热潮,除了深度赋能智能座舱、智能驾驶等AI竞争更白热化的细分场景࿰…...
【Blender】二、建模篇--06,曲线建模/父子级和蒙皮修改器
00:00:03,620 --> 00:00:09,500 前几节可能我们已经做了很多种类型的模型了 但是有一种类型 我们一直避开就是这种管道 1 00:00:10,050 --> 00:00:19,370 藤条头发啊 衣服架子啊这种弯弯绕绕的 需要一定柔软度的模型 那么这节课呢我们都来集中看一下曲线的模型 我们应该…...
【服务器与本地互传文件】远端服务器的Linux系统 和 本地Windows系统 互传文件
rz 命令:本地上传到远端 rz 命令:用于从本地主机上传文件到远程服务器 rz 是一个用于在 Linux 系统中通过 串口 或 SSH 上传文件的命令,它实际上是 lrzsz 工具包中的一个命令。rz 命令可以调用一个图形化的上传窗口,方便用户从本…...
被裁20240927 --- WSL-Ubuntu20.04安装cuda、cuDNN、tensorRT
cuda、cuDNN、tensorRT的使用场景 1. CUDA(Compute Unified Device Architecture) 作用: GPU 通用计算:CUDA 是 NVIDIA 的并行计算平台和编程模型,允许开发者直接利用 GPU 的并行计算能力,加速通用计算任…...
【架构】微内核架构(Microkernel Architecture)
微内核架构(Microkernel Architecture) 核心思想 微内核架构(又称插件式架构)通过最小化核心系统,将可扩展功能以插件模块形式动态加载,实现高内聚低耦合。其核心设计原则: 核心最小化:仅封装基础通用能力(如插件管理、通信机制、安全校验)功能插件化:所有业务功能…...
公务员行测之类比推理-新手小白
类比推理 前言学习类比推理1 语义关系1.1 近义1.2 反义1.3 象征、比喻 2 逻辑关系2.1 全同2.2 并列(1)矛盾并列(2)反对并列2.3 包容(1)种属(2)组成部分2.4 交叉2.5 对应关系…...
