当前位置: 首页 > news >正文

6.人工智能与机器学习


一、人工智能基本原理

1. 人工智能(AI)定义与范畴
  • 核心目标:模拟人类智能行为(如推理、学习、决策)
  • 分类
    • 弱人工智能(Narrow AI):专精单一任务(如AlphaGo、语音助手)
    • 强人工智能(General AI):具备人类全面认知能力(尚未实现)
    • 超级智能(Superintelligence):超越人类所有领域的智能(理论阶段)
2. AI技术体系
  • 知识表示

    • 逻辑表示:通过一阶谓词逻辑(FOL)描述事实与规则,例如“若P则Q”的确定性推理。
    • 语义网络:以节点(概念)和边(关系)表示知识,支持非结构化数据的灵活关联,如“中南大学→位于→长沙市”。
    • 框架与本体:通过预定义模板(框架)或层级化概念体系(本体)组织领域知识,增强知识复用与推理效率。
  • 推理机制

    • 确定性推理
      • 演绎推理:从一般规则推导出具体结论(如三段论),应用于专家系统与定理证明。
      • 归结推理:通过子句集化简解决逻辑问题,如数学定理求解。
    • 不确定性推理
      • 贝叶斯网络:基于概率图模型处理不确定信息,如医疗诊断中的概率推断。
      • 模糊逻辑:通过模糊集合与模糊推理处理模糊性知识,如模糊控制系统。
  • 搜索与优化

    • 启发式搜索
      • A*算法:结合启发函数(如欧几里得距离)优化路径规划,广泛应用于游戏AI与机器人导航。
      • 双向搜索:同时从初始状态与目标状态进行搜索,减少搜索空间。
    • 进化算法
      • 遗传算法:模拟自然选择与遗传机制,通过交叉、变异操作优化复杂问题(如函数优化)。
      • 粒子群优化:基于群体智能调整搜索方向,适用于连续空间优化问题。
  • 支撑技术

    • 机器学习:包括监督学习(如线性回归)、无监督学习(如聚类)和强化学习(如AlphaGo策略优化)。
    • 深度学习:基于神经网络(CNN、RNN)自动提取特征,突破传统算法的局限性。
    • 计算资源:GPU/TPU加速并行计算,分布式架构支持大规模数据处理。
3. 应用与挑战
  • 应用领域
    • 计算机视觉:图像识别(CNN)、目标检测(YOLO)。
    • 自然语言处理:机器翻译(Transformer)、情感分析(BERT)。
    • 智能决策:博弈论(如AlphaGo)、强化学习(自动驾驶)。
  • 核心挑战
    • 数据依赖:高质量数据获取与偏见治理。
    • 可解释性:深度学习“黑箱”问题。
    • 伦理与安全:AI决策的公平性与隐私保护。

二、机器学习算法与应用

1. 机器学习基础
  • 定义:通过数据训练模型,使系统具备预测或决策能力
  • 学习范式
    • 监督学习(带标签数据):分类(邮件垃圾过滤)、回归(房价预测)
    • 无监督学习(无标签数据):聚类(客户分群)、降维(PCA)
    • 半监督学习:少量标注数据 + 大量未标注数据(如医学影像中结合少量标注与大量未标注数据)
    • 强化学习:智能体与环境交互(如AlphaGo自我对弈、机器人路径规划)
2. 经典算法
  • 线性回归
    • 模型: y = β 0 + β 1 x 1 + ⋯ + β n x n y = \beta_0 + \beta_1x_1 + \cdots + \beta_nx_n y=β0+β1x1++βnxn
    • 损失函数:均方误差(MSE)
    • 优化方法:梯度下降(批量梯度下降、随机梯度下降)
    • 应用:房价预测、股票价格趋势分析
  • 决策树与随机森林
    • 分裂标准:信息增益(ID3)、基尼系数(CART)
    • 随机森林:多棵树投票,抗过拟合(如客户信用评分模型)
    • 改进:通过特征随机选择和样本Bootstrap抽样提升泛化能力
  • 支持向量机(SVM)
    • 核思想:最大化分类间隔(如人脸识别、文本分类)
    • 核技巧:将低维数据映射到高维(RBF核、多项式核)
    • 改进:引入软间隔处理噪声数据,支持多分类任务
  • K均值聚类
    • 步骤:初始化中心点 → 分配簇 → 更新中心 → 迭代至收敛
    • 优化:K-means++初始化、轮廓系数评估聚类效果
    • 应用:客户分群、图像分割
3. 应用场景
  • 金融风控
    • 逻辑回归预测贷款违约概率(如银行信用评分系统)
    • SVM识别信用卡欺诈交易(实时检测异常模式)
  • 医疗诊断
    • 随机森林辅助癌症分类(基于基因表达数据)
    • 深度学习分析医学影像(如X光片肺结节检测)
  • 推荐系统
    • 协同过滤(用户-物品矩阵分解,如Netflix电影推荐)
    • 矩阵分解结合深度学习(如YouTube视频推荐)

三、深度学习与前沿技术

1. 深度学习基础
  • 神经网络架构
    • 前馈神经网络(FNN):由输入层、隐藏层和输出层构成,通过全连接实现非线性映射,适用于分类和回归任务。
    • 反向传播算法:基于链式法则计算梯度,通过梯度下降更新权重,学习率控制参数调整步长。
  • 激活函数
    • ReLU(Rectified Linear Unit):通过f(x)=max(0,x)解决梯度消失问题,加速收敛。
    • Softmax:将输出转换为概率分布,常用于多分类任务的最终层。
  • 正则化技术
    • Dropout:训练时随机屏蔽部分神经元,防止过拟合。
    • L1/L2正则化:通过约束权重大小(L1为绝对值和,L2为平方和)抑制模型复杂度。
2. 核心模型与技术
  • 卷积神经网络(CNN)
    • 结构:卷积层(提取局部特征)→ 池化层(降维)→ 全连接层(分类),通过权值共享减少参数量。
    • 应用:ImageNet图像分类(ResNet、VGG)、目标检测(YOLO)、医学影像分析(UNet)。
  • 循环神经网络(RNN)
    • 特点:通过循环连接处理序列数据,捕捉时序依赖关系,但存在梯度消失问题。
    • 变种
      • LSTM(长短期记忆):引入门控机制缓解梯度消失,适用于长序列。
      • GRU(门控循环单元):简化LSTM结构,性能接近但计算更高效。
  • Transformer
    • 自注意力机制:计算序列元素间的全局依赖关系,替代传统RNN的序列处理方式。
    • 典型模型
      • BERT(Bidirectional Encoder Representations from Transformers):双向编码上下文特征,用于文本理解。
      • GPT(Generative Pre-trained Transformer):生成式预训练模型,通过单向注意力生成文本。
3. 生成模型
  • 生成对抗网络(GAN)
    • 组成:生成器(生成逼真数据)与判别器(鉴别真伪),通过对抗训练提升生成质量。
    • 应用:图像生成(StyleGAN)、数据增强、艺术创作(如Deepfake)。
  • 扩散模型(Diffusion Model)
    • 原理:逐步对噪声数据进行去噪,最终生成目标样本(如Stable Diffusion)。
    • 优势:生成过程可控(如文本引导图像生成),质量接近真实数据。

四、自然语言处理(NLP)

1. 核心技术
  • 词嵌入

    • 静态词向量:Word2Vec(Skip-Gram/CBOW模型)通过神经网络学习词汇的分布式表示,捕捉语义相似性;GloVe基于全局词频统计,优化共现矩阵分解以提升向量质量。
    • 动态词向量:ELMo通过双向LSTM生成上下文相关的词向量,解决多义词问题;BERT采用Transformer架构,通过掩码语言模型(MLM)实现双向上下文感知。
  • 文本分类

    • 传统方法:TF-IDF提取文本特征后,结合SVM分类器实现高效分类。
    • 深度方法:TextCNN利用卷积核捕捉局部语义模式;Transformer通过自注意力机制建模长距离依赖,显著提升分类性能。
  • 机器翻译

    • 统计机器翻译(SMT):基于规则和统计模型(如HMM)对齐源语言与目标语言,但依赖人工构建翻译规则。
    • 神经机器翻译(NMT):以Google Translate为代表,采用编码器-解码器架构,结合注意力机制实现端到端翻译,显著提升流畅度。
2. 大语言模型(LLM)
  • 技术演进

    • GPT系列:GPT-3(1750亿参数)通过自回归生成文本,支持复杂推理;GPT-4引入多模态输入(文本+图像/音频),扩展应用场景。
    • 开源模型:LLaMA(280亿参数)和Alpaca(70亿参数)推动技术民主化,降低部署门槛。
  • 应用场景

    • 智能客服:通过意图识别(如BERT)和多轮对话管理(如RAG),实现24小时自动化服务。
    • 代码生成:GitHub Copilot基于LLM解析自然语言描述,生成高质量代码片段并提示调试建议。

五、计算机视觉(CV)

1. 核心任务
  • 图像分类
    • 经典数据集:MNIST(手写数字)、CIFAR-10
    • 模型:AlexNet(2012年突破)、ResNet(残差网络提升性能)、EfficientNet(高精度低计算量)
  • 目标检测
    • 两阶段:Faster R-CNN(候选区域 + 分类)
    • 单阶段:YOLO(实时检测,YOLOv8支持实例分割,应用于自动驾驶)、SSD(单阶段检测)
  • 图像分割
    • 语义分割(FCN、U-Net、DeepLab)
    • 实例分割(Mask R-CNN)
2. 三维视觉
  • 点云处理
    • PointNet(直接处理无序点云)
    • PointNet++(提升小物体处理能力)
  • SLAM技术
    • 视觉惯性里程计(VIO,用于机器人导航)
    • 双目立体视觉(基于视差计算深度)、ORB-SLAM(多传感器融合)

六、工具与框架

1. 开发工具
  • Python库
    • NumPy(数值计算)、Pandas(数据分析)
    • Scikit-learn(传统机器学习)
  • 深度学习框架
    • TensorFlow(静态图,工业部署友好)
    • PyTorch(动态图,研究首选)
    • JAX(自动微分 + GPU加速)
2. 云计算平台
  • AWS SageMaker:托管式机器学习服务
  • Google Colab:免费GPU支持的Jupyter笔记本

相关文章:

6.人工智能与机器学习

一、人工智能基本原理 1. 人工智能(AI)定义与范畴 核心目标:模拟人类智能行为(如推理、学习、决策)分类: 弱人工智能(Narrow AI):专精单一任务(如AlphaGo、…...

RabbitMQ怎么实现延时支付?

一、使用“死信队列”消息过期时间 1、原理: 设置消息”存活时间“,如果没有被及时消费,就会被丢弃到一个”死信队列“,然后消费者监听这个死信队列处理消息 2、步骤: 2.1、创建两个队列: 2.1.1、普通队…...

vite-vue3使用web-worker应用指南和报错解决

主线程&#xff1a;初始化worker和监听子线程的消息 let worker: any; const salesConfigData ref<any[]>([]); // 显示非上架 const showNotList ref(false);// /src/views/ceshi/salesConfig/worker.js worker new Worker(new URL("/src/views/ceshi/salesConf…...

校园快递助手小程序毕业系统设计

系统功能介绍 管理员端 1&#xff09;登录&#xff1a;输入账号密码进行登录 2&#xff09;用户管理&#xff1a;查看编辑添加删除 学生信息 3&#xff09;寄件包裹管理&#xff1a;查看所有的包裹信息&#xff0c;及物流信息 4&#xff09;待取件信息&#xff1a;查看已到达的…...

python量化交易——金融数据管理最佳实践——使用qteasy管理本地数据源

文章目录 统一定义的金融历史数据表最重要的数据表数据表的定义交易日历表的定义&#xff1a;交易日历表: trade_calendar qteasy是一个功能全面且易用的量化交易策略框架&#xff0c; Github地址在这里。使用它&#xff0c;能轻松地获取历史数据&#xff0c;创建交易策略并完…...

BIO、NIO、AIO、Netty从简单理解到使用

Java编程中BIO、NIO、AIO是三种不同的I/O&#xff08;输入/输出&#xff09;模型&#xff0c;它们代表了不同的I/O处理方式。 Netty就是基于Java的NIO&#xff08;New Input/Output&#xff09;类库编写的一个高性能、异步事件驱动的网络应用程序框架&#xff0c;用于快速开发可…...

计算机毕业设计SpringBoot+Vue.js工厂车间管理系统源码+文档+PPT+讲解)

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长联系方式的名片&#xff01; 作者简介&#xff1a;Java领…...

一、图形图像的基本概念

文章目录 一、分辨率概念二、图形图像的区别三、位图和矢量图的区别 一、分辨率概念 图形显示计数中的分辨率概念有三种&#xff0c;即屏幕分辨率、显示分辨率和显卡分辨率。它们既有区别又有着密切的联系&#xff0c;对图形显示的处理有极大的影响。 1.屏幕分辨率 显示器分辨…...

前端跨域问题初探:理解跨域及其解决方案概览

在当今的Web开发中&#xff0c;跨域问题是一个常见且棘手的挑战 随着前端技术的不断进步&#xff0c;越来越多的应用需要从不同的域名、协议或端口获取资源 然而&#xff0c;浏览器的同源策略&#xff08;Same-Origin Policy&#xff09;限制了这种跨域请求&#xff0c;以确保…...

SQL分组问题

下列为电商公司用户访问时间数据 统计某个用户连续的访问记录&#xff0c;如果时间间隔小于60s&#xff0c;就分为一组 id ts 1001 17523641234 1001 17523641256 1002 17523641278 1001 17523641334 1002 17523641434 1001 17523641534 1001 17523641544 1002 17523…...

Oracle 数据库基础入门(二):深入理解表的约束

在 Oracle 数据库的学习进程中&#xff0c;表的约束是构建健壮、准确且高效数据库的关键要素。约束如同数据库的 “规则守护者”&#xff0c;它通过对数据的限制&#xff0c;确保了数据的完整性和一致性&#xff0c;就如同交通规则保障道路上车辆行驶的有序性一样。对于 Java 全…...

DeepSeek掘金——DeepSeek-R1驱动的房地产AI代理

DeepSeek掘金——DeepSeek-R1驱动的房地产AI代理 本文探讨如何使用 Smolagents 和 DeepSeek-R1 构建房地产代理,并利用工具进行网页抓取和数据导出。 AI 代理对于自动化复杂的推理任务至关重要。Smolagents 是由 Hugging Face 开发的轻量级 AI 代理框架,允许将大型语言模型 …...

WebP2P技术在嵌入式设备中的应用:EasyRTC音视频通话SDK如何实现高效通信?

在数字化时代&#xff0c;实时通信技术&#xff08;RTC&#xff09;与人工智能&#xff08;AI&#xff09;的融合正在重塑各个行业的交互方式。从在线教育到远程医疗&#xff0c;从社交娱乐到企业协作&#xff0c;RTC的应用场景不断拓展。然而&#xff0c;传统的RTC解决方案往往…...

【零基础到精通Java合集】第三集:流程控制与数组

针对**“流程控制与数组”**的15分钟课程内容设计,聚焦代码逻辑设计与数据结构基础: 课程标题:流程控制与数组(15分钟) 目标:掌握分支/循环语法与数组操作,能编写条件判断与数据遍历程序 一、课程内容与时间分配 0-2分钟 课程目标与逻辑导图 明确学习目标:分支结构、…...

VsCode + EIDE + OpenOCD + STM32(野火DAP) 开发环境配置

VsCode EIDE OpenOCD STM32(野火DAP) 开发环境配置 接受了新时代编辑器的我&#xff0c;实在受不了Keil的上古编辑页面&#xff0c;周树人说过&#xff1a;由奢入俭难&#xff0c;下面我们一起折腾一下开源软件Vscode&#xff0c; 用以开发51和STM32&#xff0c;有错误之处&…...

【vue-echarts】——01.认识echarts

文章目录 前言一、echarts二、使用步骤1.vue cli创建项目并安装第三方模块echarts2.显示图表总结前言 定制的数据可视化图表。ECharts最初由百度团队开源,并于2018年初捐赠给Apache基金会,成为ASF孵化级项目。2021年1月26日晚,Apache基金会官方宣布ECharts项目正式毕业。 一…...

【http://noi.openjudge.cn/】4.3算法之图论——1538:Gopher II

[【http://noi.openjudge.cn/】4.3算法之图论——1538:Gopher II] 题目 查看提交统计提问 总时间限制: 2000ms 内存限制: 65536kB 描述 The gopher family, having averted the canine threat, must face a new predator. The are n gophers and m gopher holes, each at di…...

Linux常见操作命令

Linux系统拥有丰富的命令行工具&#xff0c;通过这些命令可以高效地完成各种系统管理和日常操作任务。以下是一些常见的Linux操作命令&#xff1a; 文件和目录操作&#xff1a; - 创建目录&#xff1a;使用 mkdir 命令&#xff0c;例如 mkdir test 可以创建名为 test 的目录。如…...

Linux下测试Wifi性能——2.Linux下wifi指令

一、前言 相关知识大家看前一章节 Linux下测试Wifi性能——1.Wifi相关知识-CSDN博客 二、指令 1.查找可用网卡 iw dev 其中 接口名称&#xff08;Interface&#xff09; p2p0 和 wlan0 都是无线接口&#xff08;网卡&#xff09;的名称。 wlan0 是常见的无线局域网接口名…...

(十 九)趣学设计模式 之 中介者模式!

目录 一、 啥是中介者模式&#xff1f;二、 为什么要用中介者模式&#xff1f;三、 中介者模式的实现方式四、 中介者模式的优缺点五、 中介者模式的应用场景六、 总结 &#x1f31f;我的其他文章也讲解的比较有趣&#x1f601;&#xff0c;如果喜欢博主的讲解方式&#xff0c;…...

RocketMQ延迟消息机制

两种延迟消息 RocketMQ中提供了两种延迟消息机制 指定固定的延迟级别 通过在Message中设定一个MessageDelayLevel参数&#xff0c;对应18个预设的延迟级别指定时间点的延迟级别 通过在Message中设定一个DeliverTimeMS指定一个Long类型表示的具体时间点。到了时间点后&#xf…...

【JavaEE】-- HTTP

1. HTTP是什么&#xff1f; HTTP&#xff08;全称为"超文本传输协议"&#xff09;是一种应用非常广泛的应用层协议&#xff0c;HTTP是基于TCP协议的一种应用层协议。 应用层协议&#xff1a;是计算机网络协议栈中最高层的协议&#xff0c;它定义了运行在不同主机上…...

模型参数、模型存储精度、参数与显存

模型参数量衡量单位 M&#xff1a;百万&#xff08;Million&#xff09; B&#xff1a;十亿&#xff08;Billion&#xff09; 1 B 1000 M 1B 1000M 1B1000M 参数存储精度 模型参数是固定的&#xff0c;但是一个参数所表示多少字节不一定&#xff0c;需要看这个参数以什么…...

最新SpringBoot+SpringCloud+Nacos微服务框架分享

文章目录 前言一、服务规划二、架构核心1.cloud的pom2.gateway的异常handler3.gateway的filter4、admin的pom5、admin的登录核心 三、code-helper分享总结 前言 最近有个活蛮赶的&#xff0c;根据Excel列的需求预估的工时直接打骨折&#xff0c;不要问我为什么&#xff0c;主要…...

el-switch文字内置

el-switch文字内置 效果 vue <div style"color:#ffffff;font-size:14px;float:left;margin-bottom:5px;margin-right:5px;">自动加载</div> <el-switch v-model"value" active-color"#3E99FB" inactive-color"#DCDFE6"…...

MODBUS TCP转CANopen 技术赋能高效协同作业

在现代工业自动化领域&#xff0c;MODBUS TCP和CANopen两种通讯协议因其稳定性和高效性被广泛应用于各种设备和系统中。而随着科技的不断进步&#xff0c;这两种通讯协议也正在被逐步融合&#xff0c;形成了一种新型的通讯方式——开疆智能MODBUS TCP转CANopen网关KJ-TCPC-CANP…...

Spring Boot+Neo4j知识图谱实战:3步搭建智能关系网络!

一、引言 在数据驱动的背景下&#xff0c;知识图谱凭借其高效的信息组织能力&#xff0c;正逐步成为各行业应用的关键技术。本文聚焦 Spring Boot与Neo4j图数据库的技术结合&#xff0c;探讨知识图谱开发的实现细节&#xff0c;帮助读者掌握该技术栈在实际项目中的落地方法。 …...

如何在最短时间内提升打ctf(web)的水平?

刚刚刷完2遍 bugku 的 web 题&#xff0c;前来答题。 每个人对刷题理解是不同&#xff0c;有的人是看了writeup就等于刷了&#xff0c;有的人是收藏了writeup就等于刷了&#xff0c;有的人是跟着writeup做了一遍就等于刷了&#xff0c;还有的人是独立思考做了一遍就等于刷了。…...

html-<abbr> 缩写或首字母缩略词

定义与作用 <abbr> 标签用于表示缩写或首字母缩略词&#xff0c;它可以帮助用户更好地理解缩写的含义&#xff0c;尤其是对于那些不熟悉该缩写的用户。 title 属性的内容提供了缩写的详细说明。当用户将鼠标悬停在缩写上时&#xff0c;会显示一个提示框。 示例&#x…...

Java 二维码

Java 二维码 **技术&#xff1a;**谷歌 ZXing 实现 首先添加依赖 <!-- 二维码依赖 --><dependency><groupId>com.google.zxing</groupId><artifactId>core</artifactId><version>3.5.1</version></dependency><de…...