当前位置：首页 > news >正文

二、AI知识（神经网络）

news 2025/7/8 12:30:12

二、AI知识（神经网络）

1.常用算法

FNN
CNN
RNN
LSTM
DNN
GRU

2.深度学习中概念及算法

1. 感知机

感知机（Perceptron）是一种最早的人工神经网络模型之一，通常用来解决二分类问题。它由弗兰克·罗森布拉特（Frank Rosenblatt）于1958年提出，是单层的线性分类模型，也是深度学习和神经网络发展的起点之一。

2. 激活函数（如Sigmoid、ReLU、Softmax）

一、Sigmoid

Sigmoid函数（也叫逻辑斯蒂函数或S型函数）是一种常用的数学函数，它的输出值总是介于0和1之间。

二、ReLU

ReLU（Rectified Linear Unit）函数是一种常用的激活函数，尤其在深度学习神经网络中应用广泛。它将输入值小于0的部分“修剪”掉，并且对输入值大于或等于0的部分保持不变。

三、Softmax

Softmax 函数（也称为归一化指数函数）是一个常用于分类任务，尤其是多类别分类问题中的激活函数。它的作用是将一个向量转换为一个概率分布，每个输出值介于 0 和 1 之间，且所有输出值的和为 1。

3. 损失函数（如回归损失：MSE、MAE；分类损失：交叉熵损失Cross Entropy Loss、二元交叉熵BCE、Dice Loss）

一、MSE

MSE损失函数（Mean Squared Error Loss Function）是一种常用的回归问题中的损失函数，用于衡量模型预测值与真实值之间的误差。它计算预测值与实际值之间差异的平方的平均值，因此常用于衡量模型预测的准确性。

二、MAE

MAE损失函数（Mean Absolute Error Loss Function，平均绝对误差）是回归问题中另一种常见的损失函数，用于衡量模型预测值与真实值之间的差异。与MSE（均方误差）不同，MAE计算的是误差的绝对值的平均值，因此它对异常值的敏感度较低。

三、交叉熵损失Cross Entropy Loss

交叉熵损失（Cross Entropy Loss）是一种广泛用于分类问题，尤其是多分类和二分类闵比方法的损失函数。它衡量的是模型输出的概率分布与实际标签之间的差异，尤其是在分类问题中经常使用。

四、二元交叉熵BCE

二元交叉熵（Binary Cross-Entropy, BCE），又称二分类交叉熵损失函数，是用于二分类问题的常见损失函数。它用于衡量模型预测的概率与实际标签之间的差异，尤其是在目标是二分类（0或1）问题时。二元交叉熵损失非常适合用于输出为概率值的模型（如使用 Sigmoid 激活函数的模型）。

五、Dice Loss

Dice Loss 是一种常用于图像分割（特别是医学图像分割）任务中的损失函数。它基于 Dice 相似系数（Dice Similarity Coefficient, DSC），一种衡量两个样本相似度的指标，常用来评估两个集合的重叠程度。Dice Loss 主要用于处理类别不平衡或小目标检测的问题，因为它能够对小区域的预测更加敏感。

4. 前向传播/反向传播（深度学习框架，如TensorFlow、PyTorch）

一、TensorFlow

原理

TensorFlow 是一个开源的机器学习框架，最初由 Google Brain 团队开发，并于2015年发布。它广泛用于深度学习模型的构建、训练和部署，支持从小型实验到大规模生产环境的各类机器学习任务。TensorFlow 提供了丰富的 API，支持各种机器学习任务，尤其在深度学习、神经网络和深度强化学习方面表现突出。它支持多种计算平台，包括 CPU、GPU 和 TPU（Google 的专用硬件加速器），并可以运行在多个操作系统和设备上，如 Linux、Windows、macOS、Android 和 iOS。

优点

强大的功能：TensorFlow 提供了丰富的功能，支持从研究到生产的全流程。
支持多种平台：支持 CPU、GPU、TPU 的加速，并且支持不同平台（如移动端、嵌入式设备、Web 等）。
良好的社区支持：拥有一个活跃的开发者社区，丰富的文档和教程资源。
灵活性和可扩展性：适用于小规模的实验，也能支持大规模的分布式计算任务。

缺点

学习曲线较陡：TensorFlow 的学习曲线较陡，尤其是对初学者来说，理解计算图和低级 API 可能较为困难。
调试不方便：相比于 PyTorch 等框架，TensorFlow 的动态图调试相对较为复杂。
开发速度较慢：TensorFlow 2.0 虽然改进了易用性，但相比其他一些框架（如 PyTorch），开发速度可能略显缓慢。

二、PyTorch

1.原理

PyTorch 是一个广泛使用的开源深度学习框架，由 Facebook 的人工智能研究实验室（FAIR）开发。它提供了灵活的接口来构建和训练深度学习模型，特别适用于神经网络和大规模数据处理任务。PyTorch 的设计原则强调易用性、动态计算图和强大的 GPU 支持。

2.优点

易于学习和使用：PyTorch 提供了非常直观和简洁的 API，适合初学者和研究人员。尤其对于 Python 程序员来说，PyTorch 是“更 Pythonic”的，语法和结构更符合 Python 编程习惯。
动态计算图：动态计算图的设计允许在运行时定义模型结构，这对复杂、动态变化的模型（如循环神经网络 RNN）尤其有用。在调试时，你可以像调试普通 Python 程序一样调试模型，灵活性极高。
强大的自动微分功能：PyTorch 的 autograd 使得反向传播计算变得非常简单，只需要在模型中定义 forward() 方法，自动微分将处理其他所有操作。
深度学习社区和生态系统：PyTorch 在学术界的应用广泛，许多前沿研究和论文都采用了 PyTorch。PyTorch 也有强大的生态系统，包括 torchvision、torchtext、torchaudio 等模块，可以快速构建计算机视觉、自然语言处理等任务的模型。
灵活性：由于其动态计算图和灵活的接口，PyTorch 能够更容易地处理那些需要动态计算图的任务（如变长序列处理、条件计算等）。
良好的 GPU 加速支持：PyTorch 可以轻松利用 GPU 进行加速计算，且支持多 GPU 训练（如通过 torch.nn.DataParallel 或 torch.nn.parallel.DistributedDataParallel）。

3.缺点

生产环境部署不如 TensorFlow：相比 TensorFlow，PyTorch 在生产环境中的部署和优化工具相对较弱。TensorFlow 提供了强大的生产部署工具，如 TensorFlow Serving、TensorFlow Lite 和 TensorFlow.js，而 PyTorch 在这方面的支持相对较少，尽管通过 TorchServe 和 ONNX，这一差距逐步在缩小。
不如 TensorFlow 对跨平台的支持全面：TensorFlow 提供了更多的跨平台支持，例如 TensorFlow.js（用于在浏览器中运行深度学习模型）、TensorFlow Lite（用于移动设备）等。而 PyTorch 在这一领域的工具相对较少。
学习曲线相对较高（在某些方面）：尽管 PyTorch 在很多情况下很易于使用，但当你开始进行更复杂的分布式训练、大规模数据处理等操作时，可能会遇到一些挑战，尤其是涉及到多节点、多 GPU 等复杂配置时。
不如 TensorFlow 的文档和教程丰富：虽然 PyTorch 的文档相当好，但 TensorFlow 在社区支持、文档、教程等方面有更广泛的覆盖，特别是在企业和大规模生产系统中。

5. 梯度下降（如BGD、SGD、MBGD）

一、BGD

批量梯度下降（Batch Gradient Descent，简称BGD）是梯度下降算法的一种形式。在批量梯度下降中，整个训练数据集都会被用来计算损失函数的梯度，然后更新模型的参数。也就是说，BGD 在每次迭代时使用所有的训练数据来计算梯度，并根据该梯度更新参数。

二、SGD

随机梯度下降（Stochastic Gradient Descent，简称 SGD）是梯度下降算法的一种变种。与批量梯度下降（BGD）不同，SGD 每次迭代只使用单个样本来计算梯度并更新参数。这个过程相比于批量梯度下降计算更高效，并且能够在更短的时间内开始优化，但也有一些波动。

三、MBGD

MBGD（Mini-Batch Gradient Descent，迷你批量梯度下降）是梯度下降方法的一个变种。它结合了批量梯度下降（BGD）和随机梯度下降（SGD）的优点，常用于优化机器学习算法，尤其是在处理大量数据时。

6. 梯度消失、梯度爆炸（产生原因、缓解策略）

一、梯度消失

产生原因

梯度消失主要由不适合的激活函数、深度网络结构和不良的权重初始化引起。

缓解策略

为了解决这个问题，可以采用如ReLU激活函数、合适的权重初始化、批归一化、残差网络等多种策略。这些方法通过使梯度在深层网络中更稳定，从而确保网络能够有效地训练。

二、梯度爆炸

产生原因

梯度爆炸是深度学习训练中可能出现的一个问题，通常由不当的权重初始化、过大的学习率、深层网络架构等因素引起。

缓解策略

常用的缓解策略包括权重初始化方法的选择、梯度裁剪、学习率调整、优化算法选择、批归一化、网络结构优化和正则化等。这些策略可以有效地避免梯度爆炸，使得训练过程更加稳定，最终得到一个更为健壮的模型。

7. 优化器（如：梯度下降系列（批量梯度下降BGD、随机梯度下降SGD、小批量梯度下降MBGD）、动量法、NAG、Adagrad、RMSprop、Adam）

一、动量法

二、NAG

三、Adagrad

四、RMSprop

五、Adam

8. 超参数（概念、调优算法）

1.概念

2.调优算法

二、AI知识（神经网络）

二、AI知识（神经网络） 1.常用算法 FNN CNN RNN LSTM DNN GRU 2.深度学习中概念及算法 1. 感知机感知机（Perceptron）是一种最早的人工神经网络模型之一，通常用来解决二分类问题。它由弗兰克罗森布拉特&#…...

编程日记 2025/1/4 13:28:29

node.js之---子线程（child_process）模块

为什么需要子线程（child_process）模块 Worker Threads 的基本概念如何使用 Worker Threads Worker Threads 的性能 Worker 线程的优势和限制进阶用法：共享内存为什么需要子线程（child_process）模块在 Node.js…...

编程日记 2025/1/4 13:27:26

Json字符串解析失败

通过第三方服务，拿到响应体的data对象（拿到的时候对象是有值的） 通过JSON.parseObject方法，拿到的对象，值为null 通过查看对应的json字符串，发现命名不一样... JSONField SeriealizedName注解是用来解析j…...

编程日记 2025/1/4 13:23:20

LeetCode算法题——螺旋矩阵ll

题目描述给你一个正整数n，生成一个包含1到n2所有元素，且元素按顺时针顺序螺旋排列的n x n正方形矩阵matrix 。示例输入：n 3 输出：[[1,2,3],[8,9,4],[7,6,5]]题解思路： 将整个过程分解为逐圈填充的过程&#xf…...

编程日记 2025/1/4 13:22:19

【开源社区openEuler实践】hpcrunner

title: 探索 Hpcrunner：高性能计算的得力助手 date: ‘2024-12-31’ category: blog tags: Hpcrunner高性能计算任务调度资源优化 sig: HPC archives: ‘2024-12’ author:way_back summary: Hpcrunner 作为高性能计算领域的一款实用工具，专注于优化任务…...

编程日记 2025/1/4 13:21:18

linux下安装达梦数据库v8详解

目录操作系统、数据库 1、下载达梦数据库 2、安装前准备 2.1、建立数据库用户和组 2.2、修改文件打开最大数 2.3、挂载镜像 2.4、新建安装目录 3、数据库安装 4、配置环境变量 5、初始化数据库实例 6、注册服务 7、使用数据库 8、卸载数据库 9、多实例管理 10、…...

编程日记 2025/1/4 13:20:16

Redis的常用命令

Redis中文字典网站 redis 命令手册https://redis.com.cn/commands.html Keys * 查看当前库所有的key exists ke 判断某个key是否存在 type key查看你的key是什么类型 Del key删除执行的key数据 unlink key非阻塞删除，仅仅将keys从keyspace元数据中删除&#xf…...

编程日记 2025/1/4 13:18:12

Docker入门常用命令总结

1.从远程仓库拉取一个纯净的镜像 docker pull docker .io/centos 2.创建并进入容器（左外右内） docker run --name xxx -dit 镜像id（镜像名称:Tag） /bin/bash 【参数必须放在镜像ID之前】 -i 让Docker分配一个伪终端，并…...

编程日记 2025/1/4 13:17:11

【Qt】容器控件、布局管理控件

目录容器控件 QGroupBox QTabWidget 布局管理控件 QVBoxLayout 例子： QHBoxLayout 例子： QGridLayout 例子： 例子： QFormLayout 例子： QSpacerItem 例子： 容器控件 QGroupBox 表示一个带有…...

编程日记 2025/1/4 13:16:09

cesium小知识：常见的20多种property详解

要详细解释 Cesium 中所有的 Property 类，内容确实会非常丰富且详尽。 Property 基础 Property 是 Cesium 中用于表示随时间或条件变化的值的基础类。它允许你定义属性值如何根据时间、用户交互或其他逻辑动态改变。Property 的设计使得你可以创建复杂的动画和交互效果，而…...

编程日记 2025/1/4 13:14:06

图数据库 | 17、高可用分布式设计（上）

我们在前面的文章中，探索了多种可能的系统扩展方式，以及每种扩展方式的优劣。本篇文章将通过具体的架构设计方案来对每一种方案的设计、投入产出比、各项指标与功能，以及孰优孰劣等进行评价。在设计高性能、高可用图数据库的时候&#xf…...

编程日记 2025/1/4 13:12:04

1.运控概述

以下并不是我原创（包括图片），都是来源于网络收集。如CSDN博主，朝夕教育，AI等。什么是运动控制运控是指“控制移动”之意，可以利用各种电机进行位置控制等操作，让机器听懂你的指令。什么是…...

编程日记 2025/1/4 13:11:00

DuckDB：密钥管理器及其应用

密钥管理器(Secrets Manager)为所有使用密钥的后端提供了统一的用户界面。密钥信息可以被限定范围，因此不同的存储前缀可以有不同的密钥信息，例如允许在单个查询中连接跨组织的数据。密钥也可以持久化，这样就不需要在每次启动DuckDB时都指定它…...

编程日记 2025/1/4 13:07:56

单元测试4.0+思路总结

Jmockit使用笔记_增加代码覆盖率_覆盖try catch_使用new MockUp私有方法-CSDN博客一般使用new MockUp模拟被测试代码中的私有方法(常用） 使用new Expetations模拟被测试代码中的方法?...

编程日记 2025/1/4 13:06:49

epoll 水平ET跟边缘LT触发的区别是什么

epoll默认的是水平触发意思就是当我们depoll默认的是水平触发 LT 模式（水平触发） 工作机制：在 LT 模式下，只要文件描述符（例如套接字）对应的 I/O 缓冲区中有数据可读或者可写空间（对于写操作…...

编程日记 2025/1/4 13:04:45

设计模式创建型单例模式（Singleton Pattern）与常见技术框架应用解析

单例模式（Singleton Pattern）是一种创建型设计模式，旨在确保某个类在应用程序的生命周期内只有一个实例，并提供一个全局访问点来获取该实例。这种设计模式在需要控制资源访问、避免频繁创建和销毁对象的场景中尤为有用。一、核心…...

编程日记 2025/1/4 13:02:42

Java项目实战II基于微信小程序的家庭大厨（开发文档+数据库+源码）

目录一、前言二、技术介绍三、系统实现四、核心代码五、源码获取全栈码农以及毕业设计实战开发，CSDN平台Java领域新星创作者，专注于大学生项目实战开发、讲解和毕业答疑辅导。一、前言在快节奏的生活中，家庭聚餐成为了连接亲情…...

编程日记 2025/1/4 12:57:36

【JVM】总结篇-字节码篇

字节码篇 Java虚拟机的生命周期 JVM的组成 Java虚拟机的体系结构什么是Java虚拟机虚拟机：指以软件的方式模拟具有完整硬件系统功能、运行在一个完全隔离环境中的完整计算机系统 ，是物理机的软件实现。常用的虚拟机有VMWare，Visual Box&…...

编程日记 2025/1/4 12:50:25

HTML——28.音频的引入

<!DOCTYPE html> <html><head><meta charset"UTF-8"><title>音频引入</title></head><body><!--audio:在网页中引入音频当属性名和属性值一样，可以只写属性名src属性:指定音频文件路径，必…...

编程日记 2025/1/4 12:49:23

Visual Point Cloud Forecasting enables Scalable Autonomous Driving——点云论文阅读（12）

此内容是论文总结，重点看思路！！文章概述这篇文章介绍了一个名为 ViDAR 的视觉点云预测框架，它通过预测历史视觉输入生成未来点云，作为自动驾驶的预训练任务。ViDAR 集成了语义、三维几何和时间动态信息，有效提升了感知、预测和规划等自动驾驶核心任务的性能。实验表明…...

编程日记 2025/1/4 12:44:16

逻辑回归：给不确定性划界的分类大师

想象你是一名医生。面对患者的检查报告（肿瘤大小、血液指标），你需要做出一个**决定性判断**：恶性还是良性？这种“非黑即白”的抉择，正是**逻辑回归（Logistic Regression）** 的战场&a…...

编程新知 2025/6/20 12:22:50

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架，支持"一次开发，多端部署"，可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务，为旅游应用带来&#xf…...

编程新知 2025/6/21 9:41:59

五年级数学知识边界总结思考-下册

目录一、背景二、过程1.观察物体小学五年级下册“观察物体”知识点详解：由来、作用与意义**一、知识点核心内容****二、知识点的由来：从生活实践到数学抽象****三、知识的作用：解决实际问题的工具****四、学习的意义：培养核心素养…...

编程新知 2025/6/20 13:47:44

DIY｜Mac 搭建 ESP-IDF 开发环境及编译小智 AI

前一阵子在百度 AI 开发者大会上，看到基于小智 AI DIY 玩具的演示，感觉有点意思，想着自己也来试试。如果只是想烧录现成的固件，乐鑫官方除了提供了 Windows 版本的 Flash 下载工具之外，还提供了基于网页版的 ESP LA…...

编程新知 2025/7/7 19:42:57

使用 SymPy 进行向量和矩阵的高级操作

在科学计算和工程领域，向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能，能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作，并通过具体…...

编程新知 2025/7/6 21:40:59

python报错No module named ‘tensorflow.keras‘

是由于不同版本的tensorflow下的keras所在的路径不同，结合所安装的tensorflow的目录结构修改from语句即可。原语句： from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后： from tensorflow.python.keras.lay…...

编程新知 2025/6/21 22:37:01

Aspose.PDF 限制绕过方案：Java 字节码技术实战分享（仅供学习）

Aspose.PDF 限制绕过方案：Java 字节码技术实战分享（仅供学习） 一、Aspose.PDF 简介二、说明（⚠️仅供学习与研究使用）三、技术流程总览四、准备工作1. 下载 Jar 包2. Maven 项目依赖配置五、字节码修改实现代码&#…...

编程新知 2025/7/6 17:46:52

AGain DB和倍数增益的关系

我在设置一款索尼CMOS芯片时，Again增益0db变化为6DB，画面的变化只有2倍DN的增益，比如10变为20。这与dB和线性增益的关系以及传感器处理流程有关。以下是具体原因分析： 1. dB与线性增益的换算关系 6dB对应的理论线性增益应为&…...

编程新知 2025/7/8 0:38:36

C#中的CLR属性、依赖属性与附加属性

CLR属性的主要特征封装性： 隐藏字段的实现细节提供对字段的受控访问访问控制： 可单独设置get/set访问器的可见性可创建只读或只写属性计算属性： 可以在getter中执行计算逻辑不需要直接对应一个字段验证逻辑： 可以…...

编程新知 2025/6/16 10:20:03

文章目录 1. 基础HTML辅助方法1.1 Html.ActionLink()1.2 Html.RouteLink()1.3 Html.Display() / Html.DisplayFor()1.4 Html.Editor() / Html.EditorFor()1.5 Html.Label() / Html.LabelFor()1.6 Html.TextBox() / Html.TextBoxFor() 2. 表单相关辅助方法2.1 Html.BeginForm() …...

编程新知 2025/7/7 15:54:19

二、AI知识（神经网络）

1.常用算法

2.深度学习中概念及算法

1. 感知机

2. 激活函数（如Sigmoid、ReLU、Softmax）

一、Sigmoid

二、ReLU

三、Softmax

3. 损失函数（如回归损失：MSE、MAE；分类损失：交叉熵损失Cross Entropy Loss、二元交叉熵BCE、Dice Loss）

一、MSE

二、MAE

三、交叉熵损失Cross Entropy Loss

四、二元交叉熵BCE

五、Dice Loss

4. 前向传播/反向传播（深度学习框架，如TensorFlow、PyTorch）

一、TensorFlow

二、PyTorch

5. 梯度下降（如BGD、SGD、MBGD）

一、BGD

二、SGD

三、MBGD

6. 梯度消失、梯度爆炸（产生原因、缓解策略）

一、梯度消失

二、梯度爆炸

7. 优化器（如：梯度下降系列（批量梯度下降BGD、随机梯度下降SGD、小批量梯度下降MBGD）、动量法、NAG、Adagrad、RMSprop、Adam）

一、动量法

二、NAG

三、Adagrad

四、RMSprop

五、Adam

8. 超参数（概念、调优算法）

相关文章：