6.人工智能与机器学习
一、人工智能基本原理
1. 人工智能(AI)定义与范畴
- 核心目标:模拟人类智能行为(如推理、学习、决策)
- 分类:
- 弱人工智能(Narrow AI):专精单一任务(如AlphaGo、语音助手)
- 强人工智能(General AI):具备人类全面认知能力(尚未实现)
- 超级智能(Superintelligence):超越人类所有领域的智能(理论阶段)
2. AI技术体系
-
知识表示:
- 逻辑表示:通过一阶谓词逻辑(FOL)描述事实与规则,例如“若P则Q”的确定性推理。
- 语义网络:以节点(概念)和边(关系)表示知识,支持非结构化数据的灵活关联,如“中南大学→位于→长沙市”。
- 框架与本体:通过预定义模板(框架)或层级化概念体系(本体)组织领域知识,增强知识复用与推理效率。
-
推理机制:
- 确定性推理:
- 演绎推理:从一般规则推导出具体结论(如三段论),应用于专家系统与定理证明。
- 归结推理:通过子句集化简解决逻辑问题,如数学定理求解。
- 不确定性推理:
- 贝叶斯网络:基于概率图模型处理不确定信息,如医疗诊断中的概率推断。
- 模糊逻辑:通过模糊集合与模糊推理处理模糊性知识,如模糊控制系统。
- 确定性推理:
-
搜索与优化:
- 启发式搜索:
- A*算法:结合启发函数(如欧几里得距离)优化路径规划,广泛应用于游戏AI与机器人导航。
- 双向搜索:同时从初始状态与目标状态进行搜索,减少搜索空间。
- 进化算法:
- 遗传算法:模拟自然选择与遗传机制,通过交叉、变异操作优化复杂问题(如函数优化)。
- 粒子群优化:基于群体智能调整搜索方向,适用于连续空间优化问题。
- 启发式搜索:
-
支撑技术:
- 机器学习:包括监督学习(如线性回归)、无监督学习(如聚类)和强化学习(如AlphaGo策略优化)。
- 深度学习:基于神经网络(CNN、RNN)自动提取特征,突破传统算法的局限性。
- 计算资源:GPU/TPU加速并行计算,分布式架构支持大规模数据处理。
3. 应用与挑战
- 应用领域:
- 计算机视觉:图像识别(CNN)、目标检测(YOLO)。
- 自然语言处理:机器翻译(Transformer)、情感分析(BERT)。
- 智能决策:博弈论(如AlphaGo)、强化学习(自动驾驶)。
- 核心挑战:
- 数据依赖:高质量数据获取与偏见治理。
- 可解释性:深度学习“黑箱”问题。
- 伦理与安全:AI决策的公平性与隐私保护。
二、机器学习算法与应用
1. 机器学习基础
- 定义:通过数据训练模型,使系统具备预测或决策能力
- 学习范式:
- 监督学习(带标签数据):分类(邮件垃圾过滤)、回归(房价预测)
- 无监督学习(无标签数据):聚类(客户分群)、降维(PCA)
- 半监督学习:少量标注数据 + 大量未标注数据(如医学影像中结合少量标注与大量未标注数据)
- 强化学习:智能体与环境交互(如AlphaGo自我对弈、机器人路径规划)
2. 经典算法
- 线性回归:
- 模型: y = β 0 + β 1 x 1 + ⋯ + β n x n y = \beta_0 + \beta_1x_1 + \cdots + \beta_nx_n y=β0+β1x1+⋯+βnxn
- 损失函数:均方误差(MSE)
- 优化方法:梯度下降(批量梯度下降、随机梯度下降)
- 应用:房价预测、股票价格趋势分析
- 决策树与随机森林:
- 分裂标准:信息增益(ID3)、基尼系数(CART)
- 随机森林:多棵树投票,抗过拟合(如客户信用评分模型)
- 改进:通过特征随机选择和样本Bootstrap抽样提升泛化能力
- 支持向量机(SVM):
- 核思想:最大化分类间隔(如人脸识别、文本分类)
- 核技巧:将低维数据映射到高维(RBF核、多项式核)
- 改进:引入软间隔处理噪声数据,支持多分类任务
- K均值聚类:
- 步骤:初始化中心点 → 分配簇 → 更新中心 → 迭代至收敛
- 优化:K-means++初始化、轮廓系数评估聚类效果
- 应用:客户分群、图像分割
3. 应用场景
- 金融风控:
- 逻辑回归预测贷款违约概率(如银行信用评分系统)
- SVM识别信用卡欺诈交易(实时检测异常模式)
- 医疗诊断:
- 随机森林辅助癌症分类(基于基因表达数据)
- 深度学习分析医学影像(如X光片肺结节检测)
- 推荐系统:
- 协同过滤(用户-物品矩阵分解,如Netflix电影推荐)
- 矩阵分解结合深度学习(如YouTube视频推荐)
三、深度学习与前沿技术
1. 深度学习基础
- 神经网络架构:
- 前馈神经网络(FNN):由输入层、隐藏层和输出层构成,通过全连接实现非线性映射,适用于分类和回归任务。
- 反向传播算法:基于链式法则计算梯度,通过梯度下降更新权重,学习率控制参数调整步长。
- 激活函数:
- ReLU(Rectified Linear Unit):通过
f(x)=max(0,x)解决梯度消失问题,加速收敛。 - Softmax:将输出转换为概率分布,常用于多分类任务的最终层。
- ReLU(Rectified Linear Unit):通过
- 正则化技术:
- Dropout:训练时随机屏蔽部分神经元,防止过拟合。
- L1/L2正则化:通过约束权重大小(L1为绝对值和,L2为平方和)抑制模型复杂度。
2. 核心模型与技术
- 卷积神经网络(CNN):
- 结构:卷积层(提取局部特征)→ 池化层(降维)→ 全连接层(分类),通过权值共享减少参数量。
- 应用:ImageNet图像分类(ResNet、VGG)、目标检测(YOLO)、医学影像分析(UNet)。
- 循环神经网络(RNN):
- 特点:通过循环连接处理序列数据,捕捉时序依赖关系,但存在梯度消失问题。
- 变种:
- LSTM(长短期记忆):引入门控机制缓解梯度消失,适用于长序列。
- GRU(门控循环单元):简化LSTM结构,性能接近但计算更高效。
- Transformer:
- 自注意力机制:计算序列元素间的全局依赖关系,替代传统RNN的序列处理方式。
- 典型模型:
- BERT(Bidirectional Encoder Representations from Transformers):双向编码上下文特征,用于文本理解。
- GPT(Generative Pre-trained Transformer):生成式预训练模型,通过单向注意力生成文本。
3. 生成模型
- 生成对抗网络(GAN):
- 组成:生成器(生成逼真数据)与判别器(鉴别真伪),通过对抗训练提升生成质量。
- 应用:图像生成(StyleGAN)、数据增强、艺术创作(如Deepfake)。
- 扩散模型(Diffusion Model):
- 原理:逐步对噪声数据进行去噪,最终生成目标样本(如Stable Diffusion)。
- 优势:生成过程可控(如文本引导图像生成),质量接近真实数据。
四、自然语言处理(NLP)
1. 核心技术
-
词嵌入:
- 静态词向量:Word2Vec(Skip-Gram/CBOW模型)通过神经网络学习词汇的分布式表示,捕捉语义相似性;GloVe基于全局词频统计,优化共现矩阵分解以提升向量质量。
- 动态词向量:ELMo通过双向LSTM生成上下文相关的词向量,解决多义词问题;BERT采用Transformer架构,通过掩码语言模型(MLM)实现双向上下文感知。
-
文本分类:
- 传统方法:TF-IDF提取文本特征后,结合SVM分类器实现高效分类。
- 深度方法:TextCNN利用卷积核捕捉局部语义模式;Transformer通过自注意力机制建模长距离依赖,显著提升分类性能。
-
机器翻译:
- 统计机器翻译(SMT):基于规则和统计模型(如HMM)对齐源语言与目标语言,但依赖人工构建翻译规则。
- 神经机器翻译(NMT):以Google Translate为代表,采用编码器-解码器架构,结合注意力机制实现端到端翻译,显著提升流畅度。
2. 大语言模型(LLM)
-
技术演进:
- GPT系列:GPT-3(1750亿参数)通过自回归生成文本,支持复杂推理;GPT-4引入多模态输入(文本+图像/音频),扩展应用场景。
- 开源模型:LLaMA(280亿参数)和Alpaca(70亿参数)推动技术民主化,降低部署门槛。
-
应用场景:
- 智能客服:通过意图识别(如BERT)和多轮对话管理(如RAG),实现24小时自动化服务。
- 代码生成:GitHub Copilot基于LLM解析自然语言描述,生成高质量代码片段并提示调试建议。
五、计算机视觉(CV)
1. 核心任务
- 图像分类:
- 经典数据集:MNIST(手写数字)、CIFAR-10
- 模型:AlexNet(2012年突破)、ResNet(残差网络提升性能)、EfficientNet(高精度低计算量)
- 目标检测:
- 两阶段:Faster R-CNN(候选区域 + 分类)
- 单阶段:YOLO(实时检测,YOLOv8支持实例分割,应用于自动驾驶)、SSD(单阶段检测)
- 图像分割:
- 语义分割(FCN、U-Net、DeepLab)
- 实例分割(Mask R-CNN)
2. 三维视觉
- 点云处理:
- PointNet(直接处理无序点云)
- PointNet++(提升小物体处理能力)
- SLAM技术:
- 视觉惯性里程计(VIO,用于机器人导航)
- 双目立体视觉(基于视差计算深度)、ORB-SLAM(多传感器融合)
六、工具与框架
1. 开发工具
- Python库:
- NumPy(数值计算)、Pandas(数据分析)
- Scikit-learn(传统机器学习)
- 深度学习框架:
- TensorFlow(静态图,工业部署友好)
- PyTorch(动态图,研究首选)
- JAX(自动微分 + GPU加速)
2. 云计算平台
- AWS SageMaker:托管式机器学习服务
- Google Colab:免费GPU支持的Jupyter笔记本
相关文章:
6.人工智能与机器学习
一、人工智能基本原理 1. 人工智能(AI)定义与范畴 核心目标:模拟人类智能行为(如推理、学习、决策)分类: 弱人工智能(Narrow AI):专精单一任务(如AlphaGo、…...
VirtualBox虚拟机转VM虚拟机
前言:部分靶机只适用于VirtualBox,VM打不开VirtualBox的文件,所以需要进行转换 前置条件:本机已经下载VM和VirtualBox 第一步:文件转换 找到VirtualBox.exe所在位置,启动cmd窗口 文件转换的命令…...
谈谈 HTTPS 的工作原理,SSL / TLS 握手流程是什么?
一、HTTPS 核心机制:非对称加密 对称加密 HTTPS HTTP over TLS/SSL,通过 混合加密体系 解决三大问题: 防窃听 - 对称加密传输内容(如 AES)防篡改 - 数字签名验证数据完整性防冒充 - 数字证书验证服…...
使用DeepSeek+KIMI生成高质量PPT
一、使用DeepSeek DeepSeek官网:DeepSeek 点击“开始对话”,进入交互页面。 在上图中,输入问题,即可获取AI生成的结果。 基础模型(V3):通用模型(2024.12),高…...
基于SpringBoot的失物招领平台的设计与实现
基于SpringBoot的失物招领平台的设计与实现 基于微信小程序的失物招领系统 失物招领小程序 校园失物招领小程序 基于微信小程序SSMMySQL开发,高分JAVA成品毕业设计,附带往届论文、启动教程、讲解视频、二次开发教程和配套安装包文件,论文中…...
鸿蒙NEXT开发-元服务和服务卡片的开发
注意:博主有个鸿蒙专栏,里面从上到下有关于鸿蒙next的教学文档,大家感兴趣可以学习下 如果大家觉得博主文章写的好的话,可以点下关注,博主会一直更新鸿蒙next相关知识 目录 1. 元服务基本概念 1.1 基本介绍 1.2 元…...
【Spark+Hive】基于Spark大数据技术小红书舆情分析可视化预测系统(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅
目录 一、项目背景 二、项目目标 三、算法介绍 四、开发技术介绍 五、项目创新点 六、项目展示 七、权威教学视频 源码获取方式在文章末尾 一、项目背景 在数字经济蓬勃发展的当下,社交电商平台小红书凭借其"内容电商"的独特模式,已…...
IO基础知识和练习
一、思维导图 二、练习 1.使用标准IO函数,实现文件的拷贝 #include <head.h> int main(int argc, const char *argv[]) {FILE *pfopen("./one.txt","r");FILE *fpfopen("./two.txt","r");if(pNULL)PRINT_ERROR(&qu…...
gradle libs.versions.toml文件
1.libs.versions.toml介绍2.创建libs.versions.toml文件3.libraries5.versions6.plugins7.bundles 1.libs.versions.toml介绍 下图是官网介绍 意思就是说项目所有插件和库的依赖版本都统一在这个文件配置。 文件中有以下四个部分 versions, 申明要使用的插件和库的版本号的…...
影刀RPA开发拓展--SQL常用语句全攻略
前言 SQL(结构化查询语言)是数据库管理和操作的核心工具,无论是初学者还是经验丰富的数据库管理员,掌握常用的 SQL 语句对于高效管理和查询数据都至关重要。本文将系统性地介绍最常用的 SQL 语句,并为每个语句提供详细…...
2024_BUAA数据结构上机题解分享
📎 GitHub/Gitee同步开源 | 🚀 点击访问Gitee仓库 点击访问GitHub仓库 (若访问缓慢可尝试切换仓库镜像源) 这份代码库不是捷径,而是北航数据结构的生存地图。当你被困在递归迷雾中时,愿这些经过OJ系统千锤百…...
什么是分布式和微服务?
一、分布式系统 定义: 分布式系统是由多个独立的计算节点(或称为服务器、计算机)通过网络相互连接,共同协作以完成特定任务的系统。这些节点可以运行在不同的物理服务器或虚拟机上。 核心思想: 提高系统的可扩展性&am…...
2025 Lakehouse 趋势全景展望:从技术演进到商业重构
1. 为什么湖仓正在成为企业数据架构的必选项? 越来越多的企业正在通过实时数据处理能力构建核心竞争力——用户期待 APP 精准捕捉需求并实时响应,企业员工追求业务系统的秒级反馈,这些场景背后是千亿级数据资产的敏捷调度。 据 IDC 预测&am…...
一、NRF2401无线通信模块使用记录
一、电路引脚图 1、引脚说明: 2、引脚标号: 找到1号引脚,与原理图对号入座。 3、cubemx初始化配置: 5、驱动文件 配置spi,并构建发送与接收函数接口 .h #define TX_ADR_WIDTH 5 //发射地址宽度 #define TX_PLO…...
NVIDIA GPU 架构详解:Pascal、Volta、Turing、Ampere、Ada、Hopper、Blackwell
目录 1. Pascal(帕斯卡)架构(2016)关键技术性能特性代表产品应用场景 2. Volta(伏特)架构(2017)关键技术性能特性代表产品应用场景 3.Turing(图灵)架构&#…...
初阶数据结构(C语言实现)——3顺序表和链表(2)
2.3 数组相关面试题 原地移除数组中所有的元素val,要求时间复杂度为O(N),空间复杂度为O(1)。OJ链接 力扣OJ链接-移除元素删除排序数组中的重复项。力扣OJ链接-删除有序数组中的重复项合并两个有序数组。力扣OJ链接-合并两个有序数组 2.3.1 移除元素 1…...
DeepSeek R1模型性能瓶颈分析与解决方案
摘要 研究发现,DeepSeek R1模型在处理复杂问题时可能遭遇性能瓶颈。当模型过度思考时,其性能会下降。通过减少不必要的思考过程,计算成本可降低43%。研究团队分析了4018条轨迹数据,并创建了一个开源数据集,以推动智能体…...
IP-----BGP协议
7.BGP协议 1.BGP的所属分类 2.BGP的特性 3.BGP的数据包 4.BGP的6种状态机 5.BGP的工作过程 6.BGP的路由黑洞 1.BGP路由黑洞 2.解决方法 7.BGP的防环 1.EBGP水平分割 2.IBGP水平分割 1.解决IBGP环路的规则 2.解决IBGP水平分割问题 3.作用 8.BGP的基础配置 1.查看…...
【String】917. 仅仅反转字母
917. 仅仅反转字母 - 力扣(LeetCode) 使用双指针,一个指针指向s的开始,一个指向s的末尾,同时遍历即可。...
python3使用selenium打开火狐并全屏
序言 本来桌面端全屏这种东西现在用electron或者tauri来做软件的全屏,但是奈何今天拿到了一块早些年的nx板子,arm架构的,系统有点老,装node只能到16版本,装了半天终于搞好了,发现这个系统没法隐藏系统的顶…...
探秘基带算法:从原理到5G时代的通信变革【二】Viterbi解码
文章目录 二、关键算法原理剖析2.1 Viterbi 解码2.1.1 卷积码与网格图基础**卷积码****网格图****生成多项式****理想情况下解码过程** 2.1.2 Viterbi 算法核心思想2.1.3 路径度量与状态转移机制2.1.4 算法流程与关键步骤详解2.1.5 译码算法举例与复杂度分析2.1.6 算法代码示例…...
Spring Bean 作用域设置为prototype在并发场景下是否是线程安全的
在并发场景下,将 Spring Bean 作用域设置为 prototype 通常能在一定程度上保证线程安全,但这并不意味着绝对的线程安全 1. prototype 作用域的特点 在 Spring 中,Bean 的作用域定义了 Bean 的生命周期和可见性。prototype 作用域表示每次从…...
金融项目实战
测试流程 测试流程 功能测试流程 功能测试流程 需求评审制定测试计划编写测试用例和评审用例执行缺陷管理测试报告 接口测试流程 接口测试流程 需求评审制定测试计划分析api文档编写测试用例搭建测试环境编写脚本执行脚本缺陷管理测试报告 测试步骤 测试步骤 需求评审 需求评…...
mybatis热点面试题第五弹
1. MyBatis与Hibernate的区别 答案: MyBatis: 不完全是一个ORM框架,需要手动编写SQL语句,灵活性高,适合对数据库操作有高性能要求的场景。缺点是无法做到数据库无关性,如果需要支持多种数据库,…...
c++头文件和命名空间
在 C 中,头文件和命名空间是两个重要的概念,它们分别用于代码组织和作用域管理。 一、头文件(Header Files) 1. 作用 声明接口:存放函数、类、变量的声明(而非定义)。代码复用:通…...
命令行参数和环境变量 ─── linux第13课
目录 命令行参数 命令行参数列表: 如何实现命令行参数传递到此进程 环境变量 基本概念 常见环境变量 查看环境变量方法 编辑 环境变量如何写入 总结: 测试PATH 命令行参数 同一个程序,可以根据命令行参数的不同,表现不同功能 比如:指令中的选项的实现. ls -al…...
基于 openEuler 22.09 的 OpenStack Yoga 部署
openEuler 虚拟化环境部署 使用 VMWare Workstation 创建三台 2 CPU、8G内存、100 GB硬盘 的虚拟机 主机 IP 作用 Controller 192.168.184.110 控制节点 Compute 192.168.184.111 计算节点 Storage 192.168.184.112 存储节 一 基础配置 1.1 配置 yum 源 由于 op…...
【Linux实践系列】:用c语言实现一个shell外壳程序
🔥本文专栏:Linux Linux实践项目 🌸博主主页:努力努力再努力wz 那么今天我们就要进入Linux的实践环节,那么我们之前学习了进程控制相关的几个知识点,比如进程的终止以及进程的等待和进程的替换,…...
通俗易懂的分类算法之K近邻详解
通俗易懂的分类算法之K近邻详解 用最通俗的语言和例子,来彻底理解 K近邻(K-Nearest Neighbors,简称 KNN) 这个分类算法。不用担心复杂的数学公式,我会用生活中的例子来解释,保证你一听就懂! 1.…...
NO.19十六届蓝桥杯模拟赛第三期上
1 如果一个数 p 是个质数,同时又是整数 a 的约数,则 p 称为 a 的一个质因数。 请问, 2024 的最大的质因数是多少? 答:23 #include <bits/stdc.h> using namespace std;int main() {ios::sync_with_stdio(false)…...
