模型 神经网络(通俗解读)
系列文章 分享 模型,了解更多👉 模型_思维模型目录。仿脑智能,深度学习,精准识别。
1 神经网络的应用
1.1 鸢尾花分类经典问题
神经网络的一个经典且详细的经典应用是鸢尾花分类问题 。主要是通过构建一个神经网络模型来自动区分不同类型的鸢尾花。具体来说,鸢尾花分为三种类别:狗尾巴、杂草和小腹肌。为了实现这一分类任务,首先收集了花朵的四种特征值,包括花萼长、花萼宽、花瓣长和花瓣宽。这些特征值与花朵的具体类别(标签)一起构成了数据集。
接着,使用这些数据集来训练神经网络模型。该模型由输入层、隐藏层和输出层组成。通过反向传播算法进行训练,不断调整网络中的权重和偏置,以最小化损失函数。
接下来让我们用通俗的语言来解释神经网络是怎么对鸢尾花进行分类的:
- 问题是什么? 就像我们有时候分不清不同种类的花一样,计算机也需要帮助来识别鸢尾花的三种类型:狗尾巴、杂草和小腹肌。
- 我们有什么信息? 我们有鸢尾花的四种特征,就像是花的“身体尺寸”,包括花萼的长短和宽窄,以及花瓣的长短。
- 神经网络是做什么的? 神经网络就像是计算机的“大脑”,它可以通过学习这些花的特征来“认识”不同的鸢尾花。
- 输入层是什么? 输入层就像是一个神经网络的“眼睛”,它接收我们提供的四种特征信息。
- 隐藏层是做什么的? 隐藏层是神经网络的“思考”部分,它通过一些我们看不见的复杂计算,帮助网络理解输入数据之间的关系。
- 输出层是什么? 输出层就像是神经网络的“嘴巴”,它告诉我们每朵花可能属于的类别。
- 训练过程是什么? 训练过程就像是教小孩子学习新事物一样。我们给神经网络看很多已经标记好的鸢尾花和它们的特征,然后告诉它哪些是正确的分类。如果它猜错了,我们就一点点调整它的“记忆”(也就是权重和偏置),直到它能够正确分类。
- 超参数是什么? 超参数就像是食谱中的调料,我们通过调整它们来改善神经网络的“口味”,也就是让它更好地学习和分类。
- 反向传播是什么? 反向传播就像是小孩子学习时的反馈,如果它做错了,我们就告诉它哪里错了,然后它就会知道下次要怎么做。
- 最终目标是什么? 最终,我们希望神经网络能够像一个熟练的园丁一样,准确无误地识别出任何一朵鸢尾花的种类,即使它以前从未见过这朵花。
1.2 图神经网络(GNN)进行医疗诊断和分析
图神经网络(GNN)在医疗诊断和分析中展现出了巨大潜力,特别是在处理具有复杂数据结构的医疗信息方面。以下是一些具体的应用:
-
大脑功能连接分析:GNN被用于分析功能性磁共振成像(fMRI)数据,识别大脑不同区域之间的功能连接。这些连接对于理解大脑功能和诊断如自闭症谱系障碍(ASD)、精神分裂症(SZ)等精神疾病至关重要。研究中,GNN模型分为个体图和群体图两种,个体图的节点代表大脑的不同区域,边代表区域间的功能相关性;群体图的节点代表受试者,边代表受试者之间的相似性。
-
基于电波图的分析:GNN也被应用于脑电图(EEG)和心电图(ECG)的分析中,用于情感状态分析、癫痫诊断以及心脏异常识别。例如,通过从EEG信号中提取特征构建图表示,对心理状态进行分类,并使用具有Attention机制的GNN-LSTM进行EEG信号分析。
-
解剖结构分析:GNN模型可以基于MRI、CT、X光等医学成像数据进行疾病分类和预测。例如,基于MRI数据对阿兹海默病和帕金森病进行分类,或基于CT图像对结核病和COVID-19进行分类。此外,GNN还被用于医学图像分割,如血管分割和器官分割,显示出有前景的临床应用结果。
-
药物发现:在药物研发领域,GNN被用于预测分子是否具有抗生素特性,通过训练深层GNN模型Chemprop,可以在大规模数据集中发现具有抗菌活性的独特结构分子,有助于扩展抗生素库。
-
疾病建模和干预措施模拟:GNN还被用于模拟和评估不同公共健康干预措施对疾病传播的影响,如社会隔离或疫苗接种。通过引入强化学习方法,可以动态优化干预措施,以在控制疫情和最小化经济影响之间找到平衡。
这里展示了GNN在医疗领域的广泛应用,从辅助诊断到疾病预测,再到药物发现和公共卫生决策支持,GNN正成为医疗数据分析的重要工具。
1.3 神经网络在ChatGPT中的应用之Transformer
神经网络在ChatGPT中的应用是多方面的,这里主要对Transformer相关部分进行解读,具体如下:
-
基础架构 - Transformer: ChatGPT的核心是基于Transformer架构,这是一种完全基于注意力机制的模型架构(简而言之,Transformer是神经网络领域的一个创新分支,专门优化了对文本等序列化数据的处理能力)。Transformer通过自注意力机制和位置编码的方式,处理输入数据并生成对应的输出,使ChatGPT能够理解自然语言的上下文信息,并生成符合语境的回答 。
-
自注意力机制: 自注意力机制是Transformer架构的核心,它通过计算输入序列中每个位置的自注意力权重,捕捉序列中不同位置之间的依赖关系。这种机制使得Transformer能够在处理长序列时,保持较高的计算效率和准确性 。
-
位置编码: 位置编码是Transformer架构中的另一个关键组成部分,它为输入序列添加了位置信息,帮助模型理解元素之间的相对位置关系,从而提高模型的自然语言处理能力 。
我们可以看到神经网络在ChatGPT中的重要性,神经网络是Transformer模型的基础,而ChatGPT的核心是基于Transformer架构,Transformer架构是基于神经网络的。神经网络是chatGPT的基石。
1.4 神经网络在游戏行业中的应用语音驱动嘴型动画技术
语音驱动嘴型动画技术是神经网络在游戏行业中的应用之一。它利用深度学习算法来实现音频与面部动画之间的同步。这种技术的核心在于通过神经网络模型学习语音与嘴型之间的对应关系,从而能够自动生成与语音匹配的嘴型动画。
具体来说,网易互娱AI Lab开发的面部动捕技术就是一个很好的例子,它通过自研的面部动捕技术,可以捕捉玩家的细微表情,并通过神经网络模型生成逼真的面部动画,这项技术已经在《梦幻西游三维版》、《时空中的绘旅人》以及《神都夜行录》等多款游戏中得到应用。
此外,还有研究者提出了基于BLSTM-RNN(双向长短期记忆网络)的语音驱动逼真面部动画合成方法,这种方法通过训练神经网络模型,能够根据输入的语音信号合成逼真的面部动画,进一步提升了动画的真实感和自然度
1.5 神经网络在理财产品推荐系统中的应用
在理财产品推荐系统中,索信达金融AI实验室团队与香港大学张爱军博士团队合作开发的基于GAMxNN(广义加性模型可解释神经网络)的推荐方法较为经典。这种方法主要解决了传统银行理财产品推荐系统中的一个核心问题:在数据预测中往往存在精度与解释性之间的权衡。一些模型可能预测精度较高,但解释性不足,而另一些则相反,具有较好的解释性但预测精度较低 。
GAMxNN模型通过结合广义线性模型的可解释性与神经网络处理高维数据的能力,提供了一种既能保证高精度又具备高解释性的解决方案。在具体实施中,该方法首先进行数据清洗与预处理,然后通过随机森林算法进行特征选择,以确定每个变量的重要性,并剔除相关性过高的特征变量。接下来,使用AUC(Area Under the ROC Curve)作为模型评价指标,训练GAMxNN模型并找到最优的超参数。最终,通过输入客户的特定特征值,模型能够预测出推荐结果,并识别出影响推荐的主要因素 。
这种方法的优势在于,它不仅能够为银行提供精准的理财产品推荐,还能够解释推荐背后的逻辑,帮助银行客户经理更好地理解推荐原因,满足监管要求,提高客户信任度。通过这种方式,银行可以更精准地把握客户需求,同时提供更加个性化的服务。
2 模型 神经网络
2.1 什么是神经网络?
神经网络(Neural Networks)是一种受人脑结构启发的计算模型,它由大量的节点(或称为“神经元”)组成,这些节点通过连接相互传递信息。神经网络能够通过学习来识别模式和数据中的复杂关系,广泛应用于机器学习、深度学习、图像识别、语音识别、自然语言处理等领域。
神经网络的起源可以追溯到20世纪中叶,其发展历程大致可以分为几个重要阶段:
- 感知机时代(1950s-1970s):在1958年,感知机作为最简单的人工神经网络模型被提出,它是一种线性二分类器,标志着神经网络的诞生。
- BP算法时代(1986-1998):1986年,BP算法(反向传播算法)的提出解决了多层神经网络的训练问题,使得神经网络能够学习和模拟更为复杂的函数。
- 深度学习时代(2006-至今):2006年,深度学习的概念被提出,深度置信网络(DBN)和逐层预训练策略的引入,使得深度神经网络的训练变得更加有效,开启了深度学习的新纪元。
此外,值得注意的是,1943年Warren McCulloch和Walter Pitts提出了M-P神经元模型,这是人工神经元的数学描述,也是神经网络的基础之一。而在1958年,Frank Rosenblatt发明了感知器,这是人工神经网络的第一个实际应用,标志着神经网络进入了新的发展阶段。
在深度学习时代,重要的里程碑事件包括2012年AlexNet在ImageNet竞赛中的成功,2014年VGGNet和GoogLeNet的提出,以及2015年ResNet的问世等。这些进展极大地推动了人工智能领域的发展,使得神经网络在语音处理、计算机视觉、自然语言处理等多个领域中取得了突破性的成就。
神经网络的基本组成单元如下:
- 神经元(Neurons):是神经网络的基本单元,每个神经元可以接收输入,进行加权求和,并通过激活函数产生输出。
- 权重(Weights):连接神经元的边,决定了输入信号对神经元输出的影响大小。
- 偏置(Biases):为神经元的输出添加一个常数偏移,帮助模型更好地拟合数据。
- 激活函数(Activation Functions):非线性函数,用于引入非线性特性,使得神经网络能够学习和执行更复杂的任务。
神经网络的类型主要有:
- 前馈神经网络(Feedforward Neural Networks):信息在网络中只向前流动,从输入层到隐藏层,最终到输出层。
- 卷积神经网络(Convolutional Neural Networks, CNNs):特别适用于处理图像数据,通过卷积层提取图像特征。
- 循环神经网络(Recurrent Neural Networks, RNNs):能够处理序列数据,每个神经元除了有当前的输入外,还有之前时刻的输出作为输入。
- 长短期记忆网络(Long Short-Term Memory, LSTM):一种特殊的RNN,能够学习长期依赖关系。
神经网络的训练过程如下:
- 前向传播(Forward Propagation):数据在网络中从输入层到输出层的传播过程。
- 损失函数(Loss Function):衡量模型预测值与实际值之间的差异,常见的有均方误差、交叉熵等。
- 反向传播(Backpropagation):利用损失函数的梯度信息,反向更新网络中的权重和偏置。
- 优化算法(Optimization Algorithms):如梯度下降、随机梯度下降等,用于调整权重和偏置,以最小化损失函数。
神经网络的强大之处在于其能够自动提取特征并进行学习,而不需要人为设计特征,这使得它们在处理复杂问题时非常有效。随着计算能力的提升和大数据的可用性,神经网络已经成为现代人工智能领域的核心技术之一。
2.2 为什么会有神经网络?
神经网络这个模型的出现,主要是因为人们想模仿人脑的工作方式,让计算机能够更好地处理一些复杂的问题。下面用一些通俗的语言来解释为什么会有神经网络:
- 模仿大脑:就像我们大脑里有很多神经元一样,神经网络也是由很多简单的单元组成的,它们通过相互连接来处理信息。
- 自动学习:神经网络可以自己从数据中学习,不需要人告诉它每一步该怎么做,就像我们学习骑自行车一样,多摔几次就会了。
- 处理复杂问题:有些问题特别复杂,比如识别图片中的猫和狗,人眼一看就知道,但要让计算机做到这一点,就需要用到神经网络。
- 不用手动找规律:在很多情况下,我们不知道数据背后的规律是什么,神经网络可以帮助我们自动找出这些规律。
- 提高效率:对于某些任务,比如语音识别,神经网络可以比传统方法更快更准确地完成。
- 适应性强:神经网络可以适应不同的任务,就像一个多才多艺的人,既能画画,又能唱歌。
- 技术发展:随着计算机技术的发展,我们有了更强的计算能力,这使得神经网络能够处理更多的数据,变得更聪明。
- 实际应用:在很多实际应用中,比如自动驾驶汽车、推荐系统等,神经网络都发挥了重要作用。
- 创新驱动:科学家和工程师们不断探索新的方法,神经网络就是这些创新中的一个成果。
- 解决问题的新途径:有时候,传统的计算机算法解决不了的问题,神经网络提供了一种新的解决思路。
总的来说,神经网络就像是给计算机装上了一个能够自动学习和处理复杂信息的大脑,让计算机在很多方面变得更加智能。
3 模型简图

相关文章:
模型 神经网络(通俗解读)
系列文章 分享 模型,了解更多👉 模型_思维模型目录。仿脑智能,深度学习,精准识别。 1 神经网络的应用 1.1 鸢尾花分类经典问题 神经网络的一个经典且详细的经典应用是鸢尾花分类问题 。主要是通过构建一个神经网络模型来自动区分…...
事务的使用
1.如何使用事务: 1.1.事务的完成过程: 1.步骤1:开启事务2.步骤2:一系列的DML操作3.步骤3:事务结束状态:提交事务(COMMIT),中止事务(事务回滚ROLLBACK) 1.2.事务分类: …...
【免费】企业级大模型应用推荐:星环科技无涯·问知
无涯问知是星环科技发布的大模型应用系统,那么我们先简单了解下星环科技吧! 星环科技(股票代码:688031)致力于打造企业级大数据和人工智能基础软件,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数…...
从〇 搭建PO模式的Web UI自动化测试框架
Page Object模式简介 核心思想 将页面元素和操作行为封装在独立的类中,形成页面对象(Page Object)。每个页面对象代表应用程序中的一个特定页面或组件。 优点: 代码复用性高 页面对象可以在多个测试用例中复用。 易于维护 …...
在Ubuntu中重装Vscode(没有Edit Configurations(JSON)以及有错误但不标红波浪线怎么办?)
在学习时需要将vscode删除重装,市面上很多方法都不能删干净,删除之后拓展都还在。因此下面的方法可以彻底删除。注意,我安装时使用的是snap方法。 如果你的VScode没有Edit Configurations(JSON),以及有错误但不标红波浪线的话&…...
Oracle 用户-表空间-表之间关系常用SQL
问题: 当某一个表数据量特别大,突然插入数据一直失败,可能是表空间不足,需要查看表的使用率 用户-表空间-表之间关系:用户可以有多个表空间,表空间可以有多个表,表只能拥有一个表空间和用户 1.…...
家政服务管理系统小程序的设计
管理员账户功能包括:系统首页,个人中心,用户管理,管理阿姨管理,家政公司管理,服务项目管理,家政预约管理,评价管理,留言板管理,系统管理 微信端账号功能包括…...
【算法】并查集的介绍与使用
1.并查集的概论 定义: 并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题(即所谓的并、查)。比如说,我们可以用并查集来判断一个森林中有几棵树、某个节点是否属于某棵树等。 主要构成: …...
Shell——运算符
在 Shell 编程中,运算符用于执行各种类型的操作,如算术运算、字符串比较、文件测试等。以下是 Shell 中常用的运算符分类和示例: 1. 算术运算符 Shell 中使用 expr 或 $(( ... )) 来进行算术运算。 : 加法-: 减法*: 乘法/: 除法%: 取余**:…...
SweetAlert2
1. SweetAlert2 SweetAlert2是一个基于JavaScript的库, 用于在网页上替换标准的警告框(alert), 确认框(confirm)和提示框(prompt), 并提供更加美观和用户友好的界面.需要在项目中引入SweetAlert2, 可以通过CDN链接或者将库文件下载到你的项目中来实现这一点. 通过CDN引入:<…...
c语言中比较特殊的输入函数
目录 一.getchar()函数 1.基本功能 2.使用方法 (1).读取单个字符 (2).读取多个字符(直到遇到换行符) (3).处理输入中的空白字符 3.返回值 4.应用场景 5.注意事项 二.fgets()函数 1.函数原型 2.工作原理 3.使用示例 (1).从标准输入读取一行…...
Java版自动化测试之Selenium
1. 准备 编程语言:Java JDK版本:17 Maven版本:3.6.1 2. 开始 声明:本次只测试Java的Selenium自动化功能 本次示例过程:打开谷歌游览器,进入目标网址,找到网页的输入框元素,输入指…...
【计算机网络】——计算机网络的性能指标
速率(speed) 连接在计算机网络上的主机在数字信道上传送数据的速率。 影响条件: 带宽(band width) 指在固定的时间可传输的资料数量 单位:bps或HZ 吞吐量(throughtput) 指对网络、…...
MongoDB数据类型介绍
MongoDB作为一种高性能、开源、无模式的文档型数据库,支持丰富的数据类型,以满足各种复杂的数据存储需求。本文将详细介绍MongoDB支持的主要数据类型,包括数值类型、字符串类型、日期和时间类型、布尔类型、二进制类型、数组、对象以及其他扩…...
【SpringBoot】SpringBoot 中 Bean 管理和拦截器的使用
目录 1.Bean管理 1.1 自定义Bean对象 1.2 Bean的作用域和生命周期 2.拦截器的使用 1.Bean管理 默认情况下,Spring项目启动时,会把我们常用的Bean都创建好放在IOC容器中,但是有时候我们自定义的类需要手动配置bean,这里主要介绍…...
Spring IoCDI(中)--IoC的进步
通过上文的讲解和学习, 我们已经知道了Spring IoC 和DI的基本操作, 接下来我们来系统的学习Spring IoC和DI 的操作. 前⾯我们提到IoC控制反转,就是将对象的控制权交给Spring的IOC容器,由IOC容器创建及管理对 象,也就是bean的存储。 1. Bean的…...
读软件开发安全之道:概念、设计与实施02经典原则
1. CIA原则 1.1. 软件安全都构建在信息安全的三大基本原则之上,即机密性(confidentiality)、完整性(integrity)和可用性(availability) 1.2. 双方交换的数据 1.2.1. 从技术上看,端点之间的数据交换本身就会削弱交互的机密性 1.2.2. 隐藏通信数据量的一…...
MySQL中处理JSON数据:大数据分析的新方向,详解与示例
文章目录 1. MySQL中的JSON数据类型2. JSON函数和运算符3. 创建JSON列的表4. 插入JSON数据5. 查询JSON数据6. 复杂查询和聚合7. JSON 数据的索引8. 总结 在当今的大数据时代,JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式&a…...
【图形学】TA之路-矩阵
在 Unity 中,矩阵广泛用于处理各种图形变换,例如平移、旋转、缩放等。矩阵的使用不仅限于三维空间,还可以应用于二维空间的操作。了解矩阵及其运算对于游戏开发和计算机图形学非常重要。Unity 中使用的是行向量不是列向量,这个要注…...
LAMM: Label Alignment for Multi-Modal Prompt Learning
系列论文研读目录 文章目录 系列论文研读目录文章题目含义AbstractIntroductionRelated WorkVision Language ModelsPrompt Learning MethodologyPreliminaries of CLIPLabel AlignmentHierarchical Loss 分层损失Parameter Space 参数空间Feature Space 特征空间Logits Space …...
蓝牙 BLE 扫描面试题大全(2):进阶面试题与实战演练
前文覆盖了 BLE 扫描的基础概念与经典问题蓝牙 BLE 扫描面试题大全(1):从基础到实战的深度解析-CSDN博客,但实际面试中,企业更关注候选人对复杂场景的应对能力(如多设备并发扫描、低功耗与高发现率的平衡)和前沿技术的…...
React Native在HarmonyOS 5.0阅读类应用开发中的实践
一、技术选型背景 随着HarmonyOS 5.0对Web兼容层的增强,React Native作为跨平台框架可通过重新编译ArkTS组件实现85%以上的代码复用率。阅读类应用具有UI复杂度低、数据流清晰的特点。 二、核心实现方案 1. 环境配置 (1)使用React Native…...
Rust 异步编程
Rust 异步编程 引言 Rust 是一种系统编程语言,以其高性能、安全性以及零成本抽象而著称。在多核处理器成为主流的今天,异步编程成为了一种提高应用性能、优化资源利用的有效手段。本文将深入探讨 Rust 异步编程的核心概念、常用库以及最佳实践。 异步编程基础 什么是异步…...
多种风格导航菜单 HTML 实现(附源码)
下面我将为您展示 6 种不同风格的导航菜单实现,每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...
图表类系列各种样式PPT模版分享
图标图表系列PPT模版,柱状图PPT模版,线状图PPT模版,折线图PPT模版,饼状图PPT模版,雷达图PPT模版,树状图PPT模版 图表类系列各种样式PPT模版分享:图表系列PPT模板https://pan.quark.cn/s/20d40aa…...
CSS设置元素的宽度根据其内容自动调整
width: fit-content 是 CSS 中的一个属性值,用于设置元素的宽度根据其内容自动调整,确保宽度刚好容纳内容而不会超出。 效果对比 默认情况(width: auto): 块级元素(如 <div>)会占满父容器…...
Java编程之桥接模式
定义 桥接模式(Bridge Pattern)属于结构型设计模式,它的核心意图是将抽象部分与实现部分分离,使它们可以独立地变化。这种模式通过组合关系来替代继承关系,从而降低了抽象和实现这两个可变维度之间的耦合度。 用例子…...
从面试角度回答Android中ContentProvider启动原理
Android中ContentProvider原理的面试角度解析,分为已启动和未启动两种场景: 一、ContentProvider已启动的情况 1. 核心流程 触发条件:当其他组件(如Activity、Service)通过ContentR…...
ZYNQ学习记录FPGA(一)ZYNQ简介
一、知识准备 1.一些术语,缩写和概念: 1)ZYNQ全称:ZYNQ7000 All Pgrammable SoC 2)SoC:system on chips(片上系统),对比集成电路的SoB(system on board) 3)ARM:处理器…...
LangChain 中的文档加载器(Loader)与文本切分器(Splitter)详解《二》
🧠 LangChain 中 TextSplitter 的使用详解:从基础到进阶(附代码) 一、前言 在处理大规模文本数据时,特别是在构建知识库或进行大模型训练与推理时,文本切分(Text Splitting) 是一个…...
