AI 概念大杂烩
目录
介绍
数据挖掘 / 机器学习 / 深度学习
一、数据挖掘(Data Mining)
1. 定义
2. 目标
3. 常用算法
二、机器学习(Machine Learning)
1. 定义
2. 目标
3. 常用算法
三、深度学习(Deep Learning)
1. 定义
2. 目标
3. 常用算法
总结
AI / AIGC
一、AI(人工智能)
二、AIGC(AI生成内容)
主要区别
各种神经网络
1. 前馈神经网络(Feedforward Neural Network, FNN)
2. 卷积神经网络(Convolutional Neural Network, CNN)
3. 循环神经网络(Recurrent Neural Network, RNN)
4. 长短期记忆网络(Long Short-Term Memory, LSTM)
5. 生成对抗网络(Generative Adversarial Network, GAN)
6. 自编码器(Autoencoder)
7. 变分自编码器(Variational Autoencoder, VAE)
8. Transformer
总结
介绍
ai 小白自学过程中碰到的概念问题,包括(但不限于,碰到新的会回来更新):
数据挖掘/机器学习/深度学习;AI/AIGC;各种神经网络
数据挖掘 / 机器学习 / 深度学习
一、数据挖掘(Data Mining)
1. 定义
数据挖掘是一种从大规模数据集中提取有价值信息的过程。它涉及数据的预处理、分析和解释,旨在发现数据中的隐藏模式或关系。
2. 目标
数据挖掘主要用于帮助理解和揭示数据中的模式,提供洞察以支持决策。其重点是从历史数据中发现有用的知识。
3. 常用算法
- 关联规则挖掘:
- 算法:Apriori、FP-growth
- 应用:购物篮分析、市场营销分析
- 功能:从数据集中发现项目之间的关联关系。
- 聚类算法:
- 算法:K-means、DBSCAN、层次聚类
- 应用:客户细分、图像压缩
- 功能:将数据划分为不同的组,组内数据相似,组间差异大。
- 分类算法:
- 算法:决策树、Naive Bayes(朴素贝叶斯)
- 应用:垃圾邮件检测、信用评分
- 功能:将数据分为不同的类别或组。
- 回归分析:
- 算法:线性回归、逻辑回归
- 应用:销售预测、市场趋势分析
- 功能:用于预测连续值(回归)或二元/多元分类。
二、机器学习(Machine Learning)
1. 定义
机器学习是一种基于数据的算法,让计算机自动学习并改进任务的性能。通过数据训练模型,以实现自动化预测、分类或其他任务。
2. 目标
机器学习的目标是通过数据来学习模式,并根据这些模式进行预测或决策,不依赖于明确的编程规则。
3. 常用算法
- 监督学习:
- 线性回归:
- 应用:房价预测、销售预测
- 功能:找到输入特征与目标值之间的线性关系。
- 决策树:
- 应用:客户分类、信用评分
- 功能:通过构建树形结构进行分类或回归。
- 支持向量机(SVM):
- 应用:文本分类、人脸识别
- 功能:找到最佳分割超平面来分类数据。
- 线性回归:
- 无监督学习:
- K-means聚类:
- 应用:客户细分、图像分割
- 功能:将数据划分为K个簇。
- 主成分分析(PCA):
- 应用:降维、特征提取
- 功能:减少数据维度,提取最重要的特征。
- K-means聚类:
- 强化学习:
- Q-learning:
- 应用:机器人控制、游戏AI
- 功能:通过试错法进行决策,最大化奖励。
- 深度Q网络(DQN):
- 应用:复杂策略优化(如围棋AI)
- 功能:结合深度学习的强化学习算法。
- Q-learning:
三、深度学习(Deep Learning)
1. 定义
深度学习是机器学习的一个子领域,基于多层神经网络来处理复杂的任务。通过大量数据训练深层神经网络,自动提取特征和学习模式。
2. 目标
深度学习旨在通过大量数据和复杂模型来解决更复杂的任务,如图像识别、语音识别、自然语言处理等。它能自动从数据中学习高级特征,不需要人工设计特征。
3. 常用算法
- 前馈神经网络(FNN):
- 应用:回归、分类任务
- 功能:最基础的神经网络结构,单向流动,解决简单分类和回归问题。
- 卷积神经网络(CNN):
- 应用:图像分类、物体检测
- 功能:用于处理图像和视频数据,通过卷积层提取局部特征。
- 循环神经网络(RNN):
- 应用:自然语言处理、时间序列预测
- 功能:处理序列数据,能够利用时间步之间的信息。
- 长短期记忆网络(LSTM):
- 应用:语音识别、机器翻译
- 功能:RNN的改进版,能有效处理长序列依赖问题。
- 生成对抗网络(GAN):
- 应用:图像生成、视频生成
- 功能:通过生成器和判别器相互对抗生成高质量的图像或数据。
- 变分自编码器(VAE):
- 应用:图像生成、数据压缩
- 功能:生成模型的一种,用于生成与输入数据相似的样本。
总结
领域 | 定义 | 目标 | 常用算法 |
---|---|---|---|
数据挖掘 | 从数据中提取有价值的模式和关系。 | 发现数据中的隐藏信息,支持决策和洞察。 | 关联规则挖掘(Apriori)、聚类(K-means)、决策树、回归分析 |
机器学习 | 通过算法从数据中学习,进行自动化预测和决策。 | 基于数据进行预测和分类,实现自动化决策。 | 线性回归、决策树、SVM、K-means、PCA、Q-learning |
深度学习 | 机器学习的子领域,基于神经网络处理复杂任务。 | 自动提取特征,解决复杂任务(如图像和语音处理)。 | FNN、CNN、RNN、LSTM、GAN、VAE |
数据挖掘主要用于揭示数据模式,机器学习用于模型训练和预测,深度学习则通过深层神经网络解决复杂的任务。各自的算法根据具体需求和数据类型进行选择。
AI / AIGC
AI(人工智能,Artificial Intelligence)和AIGC(AI生成内容,AI-Generated Content)有着不同的应用范围和侧重点:
一、AI(人工智能)
- 定义:人工智能是一门研究如何让机器模拟人类智能的学科。AI的目标是让计算机能够执行需要智能的任务,比如识别模式、处理语言、解决问题、学习和推理等。
- 应用领域:
- 机器学习(如监督学习、无监督学习)
- 计算机视觉(图像识别、视频分析)
- 自然语言处理(翻译、语音识别、文本生成)
- 强化学习(自动驾驶、游戏AI)
- 核心技术:AI的核心在于让机器具备学习、理解和决策能力,通过算法和数据驱动实现智能化。
二、AIGC(AI生成内容)
- 定义:AIGC是AI技术的一种具体应用,指的是利用人工智能自动生成内容,包括文字、图片、音频、视频等。AIGC是生成式AI的一种形式,通过大规模训练的模型,根据输入生成新的内容。
- 应用领域:
- 文本生成(新闻、故事、对话生成)
- 图片生成(AI绘画、艺术创作)
- 音频生成(AI作曲、声音合成)
- 视频生成(短视频自动生成、动画制作)
- 核心技术:AIGC依赖于生成模型(如GAN、Transformer等),其重点在于生成和创作。大规模语言模型(如GPT)、扩散模型和生成对抗网络(GAN)是AIGC的主要推动力量。
主要区别
-
范围:
- AI:广泛涵盖了从智能决策、模式识别到自动化任务的各种技术和应用。
- AIGC:AI的一个子领域,专注于通过AI技术来生成新的内容。
-
目的:
- AI:通常用来解决复杂的决策问题、识别和预测。
- AIGC:目标是生成创造性的内容,比如文字、图像和视频,主要用于内容创作领域。
-
使用的AI模型:
- AI:可以是分类模型、回归模型、优化算法等。
- AIGC:通常使用生成模型(如Transformer、GAN等)来创建内容。
总的来说,AIGC是AI技术的具体应用之一,专门用于生成内容,而AI涵盖的领域更广,涉及各种智能任务。
各种神经网络
深度学习常用的神经网络类型有很多,每种网络结构都有特定的功能和应用场景。下面列出几种常用的神经网络及其对应的功能与目的,并为每个网络设计相应的练习。
1. 前馈神经网络(Feedforward Neural Network, FNN)
- 功能:最基础的神经网络结构,输入数据在网络中单向流动,不形成环路。用于解决回归和分类问题。
- 目的:用于简单的模式识别任务,比如手写数字识别。
- 应用场景:二分类问题、多分类问题、回归问题。
2. 卷积神经网络(Convolutional Neural Network, CNN)
- 功能:特别适合处理图像和视频数据,利用卷积层提取局部特征,池化层降低特征维度。
- 目的:用于图像分类、目标检测、图像分割等任务。
- 应用场景:图像识别(如物体识别、面部识别)、医学图像分析、自动驾驶。
3. 循环神经网络(Recurrent Neural Network, RNN)
- 功能:能够处理序列数据,网络结构中包含环路,允许信息在时间步之间传递,适合处理时间序列数据和文本数据。
- 目的:用于时间序列预测、自然语言处理。
- 应用场景:语言模型、文本生成、股票价格预测、语音识别。
4. 长短期记忆网络(Long Short-Term Memory, LSTM)
- 功能:RNN的一种改进版本,能够有效处理长期依赖问题,适合处理长序列数据。
- 目的:用于处理需要记忆长时间依赖关系的任务。
- 应用场景:机器翻译、情感分析、语音识别。
5. 生成对抗网络(Generative Adversarial Network, GAN)
- 功能:由两个网络组成——生成器和判别器,生成器生成数据,判别器判断数据的真假。两者相互对抗,通过训练生成高质量的图像、音频等数据。
- 目的:用于数据生成,生成虚拟图像、音频,甚至3D模型。
- 应用场景:图像生成(如DeepFake)、图像超分辨率、图像修复、艺术创作。
6. 自编码器(Autoencoder)
- 功能:是一种无监督学习的神经网络,用于学习数据的低维表示。通常用于降噪或数据压缩。
- 目的:数据降维、特征提取、数据去噪。
- 应用场景:图像去噪、异常检测、特征学习。
7. 变分自编码器(Variational Autoencoder, VAE)
- 功能:自编码器的扩展版本,能够生成新的数据样本,适合生成式建模任务。
- 目的:生成与输入数据相似的样本,同时学习数据的概率分布。
- 应用场景:图像生成、图像重建、异常检测。
8. Transformer
- 功能:不依赖于循环的序列模型,通过注意力机制处理序列数据,擅长处理长序列。
- 目的:在自然语言处理任务中取得了非常好的效果,尤其在机器翻译、文本生成中。
- 应用场景:机器翻译、文本生成、总结、问答系统。
总结
这些神经网络都用于特定的深度学习任务,每种网络都有其独特的优势。通过这些网络的学习和实践,你可以掌握深度学习中的主要方法,并将其应用到实际的项目中。
相关文章:
AI 概念大杂烩
目录 介绍 数据挖掘 / 机器学习 / 深度学习 一、数据挖掘(Data Mining) 1. 定义 2. 目标 3. 常用算法 二、机器学习(Machine Learning) 1. 定义 2. 目标 3. 常用算法 三、深度学习(Deep Learning࿰…...
Composer和PHP有什么关系
Composer是PHP的一个依赖管理工具,以下是对Composer及其与PHP关系的详细解释: Composer简介 核心功能:Composer的核心思想是“依赖管理”,它能够自动下载和安装项目所依赖的库、框架或插件等。这些依赖项可以是PHP本身的库文件&…...

【PGCCC】在 Postgres 上构建图像搜索引擎
我最近看到的最有趣的电子商务功能之一是能够搜索与我手机上的图片相似的产品。例如,我可以拍一双鞋或其他产品的照片,然后搜索产品目录以查找类似商品。使用这样的功能可以是一个相当简单的项目,只要有合适的工具。如果我们可以将问题定义为…...

性能测试之性能问题分析
开始性能测试前需要了解的内容: 1、项目具体需求。 2、指标:响应时间在多少以内,并发数多少,tps多少,总tps多少,稳定性交易总量多少,事务成功率,交易波动范围,稳定运行…...

错过了A股,别再错过AI表情包!N款变现攻略,你选哪个?
本文背景 据 Swyft Media 统计,全世界每天各类聊天 app 发送的表情符号有 60 多亿,我们国家每天表情包发送量大概 6 亿次。 表情包简直就是个大淘金池,最近用 AI 做表情包也挺火。所以今天给大家讲讲一个用 AI 做表情包变现的项目。 以前没…...
SpringBoot驱动的美发沙龙管理系统:优雅地管理您的业务
1系统概述 1.1 研究背景 随着计算机技术的发展以及计算机网络的逐渐普及,互联网成为人们查找信息的重要场所,二十一世纪是信息的时代,所以信息的管理显得特别重要。因此,使用计算机来管理美发门店管理系统的相关信息成为必然。开发…...
prometheus + alertmanager 搭建告警通知
prometheus 下载prometheus-2.53.2 prometheus.yml文件修改 global:scrape_interval: 15sevaluation_interval: 15salerting:alertmanagers:- static_configs:- targets:- 127.0.0.1:9093rule_files:- "rules/rule-*.yml"scrape_configs:- job_name: "promet…...

爬虫案例——爬取腾讯社招
案例需求: 1.爬取腾讯社招的数据(搜索 | 腾讯招聘)包括岗位名称链接时间公司名称 2.爬取所有页(翻页) 3.利用jsonpath进行数据解析 4.保存数据:txt文本形式和excel文件两种形式 解析: 1.分…...
VAS1800Q奇力科技线性芯片电荷泵热处理
高效恒流LED驱动器——VAS1800Q在汽车应用中的卓越表现 VAS1800Q是一款专为汽车应用设计的高效恒流LED驱动器。它具备多个显著特点,不仅提升了LED驱动效率,还大大减少了热量的产生,使其在汽车照明领域中具有极高的应用价值。本文将详细介绍VA…...

SQL Inject-基于报错的信息获取
常用的用来报错的函数 updatexml() : 函数是MYSQL对XML文档数据进行查询和修改的XPATH函数。 extractvalue(): 函数也是MYSQL对XML文档数据进行查询的XPATH函数。 floor(): MYSQL中用来取整的函数。 思路: 在MySQL中使用一些指定的函数来制造报错&am…...
redistemplate宇jedis区别
redistemplate是Spring Data Redis提供的一个模板类,用于简化Redis操作的代码编写。它提供了常见的操作方法,如存储、读取、删除等,可以更方便地操作Redis数据库。 而Jedis是Redis官方推荐的Java客户端库之一。它提供了丰富的功能和灵活的接…...

JavaWeb--09Servlet深入:JavaWeb三层架构---注册系统
一套完整的网页到Java到数据库的创建: html:进行数据收集以及呈现 第一层:根据servlet处理前台html的响应和请求,对数据进行接收,封装和验证 第二层:业务,验证是否存在调用创建的dao查&#x…...

教育技术革新:SpringBoot在线教育系统开发指南
6系统测试 6.1概念和意义 测试的定义:程序测试是为了发现错误而执行程序的过程。测试(Testing)的任务与目的可以描述为: 目的:发现程序的错误; 任务:通过在计算机上执行程序,暴露程序中潜在的错误。 另一个…...

EasyAnimate
https://github.com/aigc-apps/EasyAnimate/blob/main/README_zh-CN.mdhttps://github.com/aigc-apps/EasyAnimate/blob/main/README_zh-CN.md EasyAnimate v4是一个用于生成高分辨率和长视频的端到端解决方案。我们可以训练基于转换器的扩散生成器,训练用于处理长视频的VAE,…...

Unity实现自定义图集(五)
以下内容是根据Unity 2020.1.0f1版本进行编写的 在Unity编辑器上的自定义图集已经完成了,但是如何将自定义图集文件打包,以及在移动平台将自定义图集和对应的纹理图(Texture)加载出来是个问题,本篇就来解决这些问题 1、思路 首先是自定义图集的打包。 自定义图集实际…...

2024年最佳平替电容笔对比:西圣、摩米士、倍思,哪款更适合你?
作为一位专注于数码产品的博主,我深知近年来平替电容笔在消费者中的热度不断攀升。这种电容笔以其亲民的价格和卓越的书写体验引起了广泛关注,尤其适合那些需要用iPad学习和办公的无纸化爱好者。 西圣这款自带充电仓的电容笔备受关注,尤其因…...
关系型数据库索引操作
前言:关系型数据库索引总结-作用,类型,适用场景,缺点简介 在MySQL、SQL Server、Oracle中,建立、修改、删除索引的操作有很多相似之处,但由于每个数据库系统的语法和特性不同,具体操作有一些差异。以下是三种数据库中关于索引操作…...

深度学习基础—卷积神经网络示例
1.卷积神经网络的结构 在之前的博客《深度学习—简单的卷积神经网络》,仅由卷积层构成网络的全部,这还不是标准的网络结构,本文将继续介绍标准的卷积神经网络结构有哪些? 深度学习基础—简单的卷积神经网络https://blog.csdn.net…...

vite学习教程03、vite+vue2打包配置
文章目录 前言一、修改vite.config.js二、配置文件资源/路径提示三、测试打包参考文章资料获取 前言 博主介绍:✌目前全网粉丝3W,csdn博客专家、Java领域优质创作者,博客之星、阿里云平台优质作者、专注于Java后端技术领域。 涵盖技术内容&…...

Java | Leetcode Java题解之第461题汉明距离
题目: 题解: class Solution {public int hammingDistance(int x, int y) {int s x ^ y, ret 0;while (s ! 0) {s & s - 1;ret;}return ret;} }...
SciencePlots——绘制论文中的图片
文章目录 安装一、风格二、1 资源 安装 # 安装最新版 pip install githttps://github.com/garrettj403/SciencePlots.git# 安装稳定版 pip install SciencePlots一、风格 简单好用的深度学习论文绘图专用工具包–Science Plot 二、 1 资源 论文绘图神器来了:一行…...
QMC5883L的驱动
简介 本篇文章的代码已经上传到了github上面,开源代码 作为一个电子罗盘模块,我们可以通过I2C从中获取偏航角yaw,相对于六轴陀螺仪的yaw,qmc5883l几乎不会零飘并且成本较低。 参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...

视频字幕质量评估的大规模细粒度基准
大家读完觉得有帮助记得关注和点赞!!! 摘要 视频字幕在文本到视频生成任务中起着至关重要的作用,因为它们的质量直接影响所生成视频的语义连贯性和视觉保真度。尽管大型视觉-语言模型(VLMs)在字幕生成方面…...
Robots.txt 文件
什么是robots.txt? robots.txt 是一个位于网站根目录下的文本文件(如:https://example.com/robots.txt),它用于指导网络爬虫(如搜索引擎的蜘蛛程序)如何抓取该网站的内容。这个文件遵循 Robots…...

(转)什么是DockerCompose?它有什么作用?
一、什么是DockerCompose? DockerCompose可以基于Compose文件帮我们快速的部署分布式应用,而无需手动一个个创建和运行容器。 Compose文件是一个文本文件,通过指令定义集群中的每个容器如何运行。 DockerCompose就是把DockerFile转换成指令去运行。 …...

pikachu靶场通关笔记22-1 SQL注入05-1-insert注入(报错法)
目录 一、SQL注入 二、insert注入 三、报错型注入 四、updatexml函数 五、源码审计 六、insert渗透实战 1、渗透准备 2、获取数据库名database 3、获取表名table 4、获取列名column 5、获取字段 本系列为通过《pikachu靶场通关笔记》的SQL注入关卡(共10关࿰…...

让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比
在机器学习的回归分析中,损失函数的选择对模型性能具有决定性影响。均方误差(MSE)作为经典的损失函数,在处理干净数据时表现优异,但在面对包含异常值的噪声数据时,其对大误差的二次惩罚机制往往导致模型参数…...

论文阅读笔记——Muffin: Testing Deep Learning Libraries via Neural Architecture Fuzzing
Muffin 论文 现有方法 CRADLE 和 LEMON,依赖模型推理阶段输出进行差分测试,但在训练阶段是不可行的,因为训练阶段直到最后才有固定输出,中间过程是不断变化的。API 库覆盖低,因为各个 API 都是在各种具体场景下使用。…...

Linux-进程间的通信
1、IPC: Inter Process Communication(进程间通信): 由于每个进程在操作系统中有独立的地址空间,它们不能像线程那样直接访问彼此的内存,所以必须通过某种方式进行通信。 常见的 IPC 方式包括&#…...
【题解-洛谷】P10480 可达性统计
题目:P10480 可达性统计 题目描述 给定一张 N N N 个点 M M M 条边的有向无环图,分别统计从每个点出发能够到达的点的数量。 输入格式 第一行两个整数 N , M N,M N,M,接下来 M M M 行每行两个整数 x , y x,y x,y,表示从 …...