当前位置：首页 > news >正文

神经网络为什么可以学习

news 2026/2/8 19:14:47

本资料转载于B站up主：大模型成长之路,仅用于学习和讨论，如有侵权请联系

动画解析神经网络为什么可以学习_哔哩哔哩_bilibilis

1、一个神经网络是由很多神经元形成的

1.1 也可以是一层，也可以是多层

2 层和层之间的连接就跟一张网一样

2.1 每两个神经元之间有两个参数，我们称之为权重

3 在同一层神经元之间是没有链接的

3.1

4 每两个神经元之间有一些参数

4.1

5、神经网络的第一层称为输入层，主要获取输入信息

5.1

6、中间称为隐藏层，用于特征提取调整权重，让隐藏层的某种神经单元，对某种模式形成反应

6.1

7、最后一层输出层，最终任务是输出最终结果

7.1

8 为了学习后面的模式，神经网络首先会定义一个损失函数

8.1

9 训练的过程就是将数据不断输入到模型里

9.1

10 利用梯度下降和方向传播的方法

10.1

11、不断优化模型的参数,上面反向传播,以便更好的优化背后的规律,使得损失函数的值越来越小,最终达到学习到背后规律的目的

11.1

12 最简单的神经元,只有一个输入X

12.1

13 一个参数W,经过神经元的输入之后，可以输出y

13.1

14、由一个神经元，一个输入，一个输出组成的，到底是一个什么样的模型

14.1

15 表示了一个很简单的关系y=w*x +b

15.1

16 这里w和b是需要训练学习的参数

16.1

17 举个例子，当W=0.6，b=e的时候

17.1

18 学习神经网络如何学习输入和输出数据反应的模型

18.1

19 我们的训练数据都是一些点，这些点都位于一条直线上

19.1

20 我们采用的模型非常简单

20.1

21、我们采用的神经元网络模型非常简单，线性关系

21.1

22 我们希望这个数据能够很好的拟合我们的网络数据

22.1

23 用π托迟来训练这个模型

23.1

24 损失函数是MSE，均方误差，均方误差是一种非常常见的损失函数

24.1

25 用来衡量真实值和误差值之间的差异,我们使用了linear输入，linear模型，他只有一个模型，他只有一个输入，和一个输出,在这里输出的个数代表神经元的个数

26、我们使用了Linear模型，他只有一个输入，我们使用了Adma优化器来进行了优化

27、下面代码是输入数据，梯度下降，T度下降，优化网络参数的代码

28、刚开始的时候，只是呈线性关系，随着训练进行，数据逐渐找到规律，不断拟合数据，损失函数的值不断减小

29、直到完全拟合数据的线性关系，这表明我们神经网络已经学习到了输入和输出之间的关系

29.1

30

30.1

31、

31.1

32

32.1

33

33.1

34

34.1

35

35.1

36

36.1

37

37.1

38

38.1

39

39.1

40

40.1

41、

41.1

42

42.1

43

43.1

44

44.1

45

45.1

46

46.1

47

47.1

48

48.1

49

49.1

50

50.1

神经网络为什么可以学习

本资料转载于B站up主：大模型成长之路,仅用于学习和讨论，如有侵权请联系动画解析神经网络为什么可以学习_哔哩哔哩_bilibilis 1、一个神经网络是由很多神经元形成的 1.1 也可以是一层，也可以是多层 2 层和层之间的连接就跟一张网一样 2.1 每…...

编程日记 2023/8/22 22:31:30

Docker基础入门：镜像、容器导入导出与私有仓库搭建

Docker基础入门：镜像导入导出与私有仓库搭建一、 Docker镜像、容器的导入和导出1.1、Docker镜像的导出1.2、Docker镜像的载入1.3、Docker容器的导出1.4、Docker容器的导入二、镜像和容器导出和导入的区别:三、commit操作_本地镜像发布到阿里云3.1、commit操作有关…...

编程日记 2023/8/22 22:30:29

Go语言入门指南：基础语法和常用特性解析(上)

一、Go语言前言 Go是一种静态类型的编译语言，常常被称作是21世纪的C语言。Go语言是一个开源项目，可以免费获取编译器、库、配套工具的源代码，也是高性能服务器和应用程序的热门选择。 Go语言可以运行在类UNIX系统——比如Linux、OpenBSD、M…...

编程日记 2023/8/22 22:29:28

排序算法合集

F B I W a r n i n g : \color{red}FBI \qquad Warning: FBIWarning: 本人没有完整的计算机科班的教育经历，但是一直在兢兢业业，努力学习。这些排序函数都是自己零零散散写的，也没有经过深思熟虑和优化，纯粹是为了自娱自乐。 …...

编程日记 2023/8/22 22:28:27

Vue2-全局事件总线、消息的订阅与发布、TodoList的编辑功能、$nextTick、动画与过渡

🥔：高度自律即自由更多Vue知识请点击——Vue.js VUE2-Day9 全局事件总线1、安装全局事件总线2、使用事件总线（1）接收数据（2）提供数据（3）组件销毁前最好解绑 3、TodoList中的孙传父&…...

编程日记 2023/8/22 22:27:25

DP读书：鲲鹏处理器架构与编程（八）3.1鲲鹏处理器片上系统与Taishan处理器内核架构

鲲鹏处理器片上系统架构一、鲲鹏处理器片上系统与Taishan处理器内核架构1. 鲲鹏处理器片上系统概况a. 鲲鹏处理器片上系统与鲲鹏芯片家族b. 鲲鹏920处理器片上系统的组成部件c. 鲲鹏920处理器片上系统的特征d. 鲲鹏920处理器片上系统的逻辑结构 2. Taishan V110 处理器内核微架…...

编程日记 2023/8/22 22:26:23

如何使用 HOOPS Exchange SDK 和 Polygonica Bridge

这里将讨论使用 HOOPS Exchange 和 Polygonica 以及它们之间的桥梁进行 CAD 访问和网格处理。--提供Crack HOOPS 全系列SDK HOOPS Exchange 基础知识首先，让我们简单回顾一下 HOOPS Exchange。HOOPS Exchange 是一款具有 C 接口的数据访问 SDK，支持导入…...

编程日记 2023/8/22 22:25:22

spring异步框架使用教程

背景在需求开发过程中，为了提升效率，很容易就会遇到需要使用多线程的场景。这个时候一般都会选择建一个线程池去专门用来进行某一类动作，这种任务到来的时候往往伴随着大量的线程被创建调用。而还有另外一种场景是整个任务的执行耗时比较长…...

编程日记 2023/8/22 22:24:20

【数学建模】清风数模正课3 插值算法

插值算法在数模比赛中，很多类型的题目都需要根据已知的函数点进行数据分析和模型处理； 当此时题目所给的数据较少时，我们就无法进行准确科学的分析，所以需要更多的数据，也就是函数点； 这就需要使用数学…...

编程日记 2023/8/22 22:23:18

什么是eval()?eval是用来干什么的？

一、什么是eval()? eval() 是 JavaScript 中的一个全局函数，用于解析并执行传递给它的字符串作为 JavaScript 代码。二、eval()是用来干什么的？ 当调用 eval() 时，它会将传入的字符串参数视为 JavaScript 代码，并在调用位置执…...

编程日记 2023/8/22 22:22:16

JavaScript-console：JavaScript控制台（Console）常用方法

一、理解 console JavaScript 控制台（console）是一个开发人员在编写 JavaScript 代码时常用的工具。它是浏览器提供的一种界面，让开发人员能够追踪代码执行的状态和结果。JavaScript 控制台可以记录代码输出的信息、警告和错误，并…...

编程日记 2023/8/22 22:21:13

后端地址 1.本地环境 curl --request GET \--url http://localhost:8080/by-admin/captchaImage \--header Authorization: Bearer d7a035d9-b30c-4ca5-8951-8cec90607943确认后端 ip 端口上下文 2.测试环境部署到测试环境可能是换成内网ip和内网服务端口(ip、端口可能会…...

编程日记 2023/8/22 22:20:11

rabbitmq的发布确认

生产者将信道设置成 confirm 模式，一旦信道进入 confirm 模式， 所有在该信道上面发布的消息都将会被指派一个唯一的 ID (从 1 开始)，一旦消息被投递到所有匹配的队列之后，broker 就会发送一个确认给生产者(包含消息的唯一 ID)&…...

编程日记 2023/8/22 22:19:10

RISC-V公测平台发布· CoreMark测试报告

一. CoreMark简介 CoreMark是一款用于评估CPU性能的基准测试程序，它包含了多种不同的计算任务，包括浮点数、整数、缓存、内存等方面的测试。CoreMark的测试结果通常被用来作为CPU性能的参考，它可以帮助开发人员和系统管理员评估不同处理器和…...

编程日记 2023/8/22 22:18:08

模型微调（fine-tune）

一、关于模型微调的一些基础知识 1、模型微调（fine-tune） 微调(fine-tune)通过使用在大数据上得到的预训练好的模型来初始化自己的模型权重，从而提升精度。这就要求预训练模型质量要有保证。微调通常速度更快、精度更高。当然，自己…...

编程日记 2023/8/22 22:17:07

云农场种植：互联网+智慧牧场，为农业注入新的活力和创新

随着科技的不断发展，数字化农业正逐渐成为现代农业的趋势。传统农业面临着土地资源有限、劳动力不足等问题，而云农场种植模式通过数字化技术的运用，互联网养殖着重于“绿色、特色产品和智慧生态”，通过建立“线上养殖线下托养线上…...

编程日记 2023/8/22 22:16:06

Hadoop学习一（初识大数据）

目录一什么是大数据？ 二大数据特征三分布式计算四 Hadoop是什么? 五 Hadoop发展及版本六为什么要使用Hadoop 七 Hadoop vs. RDBMS 八 Hadoop生态圈九 Hadoop架构一什么是大数据？ 大数据是指无法在一定时间内用常规软件工具对其内…...

编程日记 2023/8/22 22:15:04

linux定时备份MySQL数据库循环删除前30天的备份文件

linux定时备份MySQL数据库循环删除前30天的备份文件一、检查有没安装crond,如果没有，先安装 1、先检查一下有没有cron rpm -qa|grep cron如果输入上面命令有如下显示，则不需要安装 2、没有安装的话，就使用一下命令安装 yum -y install …...

编程日记 2023/8/22 22:14:03

不加电透明屏：在场景化应用中，有哪些特点和优点？

不加电透明屏是一种新型的显示技术，它可以在不需要电源的情况下显示图像和文字。这种屏幕的原理是利用光的折射和反射来实现显示效果，而不需要通过电流来激发像素点。不加电透明屏的最大优点是节能环保。传统的显示屏需要消耗大量的电能来显示图像&a…...

编程日记 2023/8/22 22:13:01

全球公链进展| Shibarium已上线；opBNB测试网PreContract硬分叉；Sui 主网 V1.7.1 版本

01 ETH 以太坊最新一次核心开发者执行会议：讨论 Devnet 8 更新、ElP-4788、Holesky 测试网等以太坊核心开发者 Tim Beiko 总结最新一次以太坊核心开发者执行会议（ACDE），讨论内容包括 Devnet 8 更新、ElP-4788、Holesky 测试网、…...

编程日记 2023/8/22 22:11:59

【kafka】Golang实现分布式Masscan任务调度系统

要求： 输出两个程序，一个命令行程序（命令行参数用flag）和一个服务端程序。命令行程序支持通过命令行参数配置下发IP或IP段、端口、扫描带宽，然后将消息推送到kafka里面。服务端程序： 从kafka消费者接收…...

编程新知 2026/2/4 19:38:41

Lombok 的 @Data 注解失效，未生成 getter/setter 方法引发的HTTP 406 错误

HTTP 状态码 406 (Not Acceptable) 和 500 (Internal Server Error) 是两类完全不同的错误，它们的含义、原因和解决方法都有显著区别。以下是详细对比： 1. HTTP 406 (Not Acceptable) 含义： 客户端请求的内容类型与服务器支持的内容类型不匹…...

编程新知 2026/2/1 20:49:03

树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频

使用rpicam-app通过网络流式传输视频使用 rpicam-app 通过网络流式传输视频UDPTCPRTSPlibavGStreamerRTPlibcamerasrc GStreamer 元素文章来源： http://raspberry.dns8844.cn/documentation 原文网址使用 rpicam-app 通过网络流式传输视频本节介绍来自 rpica…...

编程新知 2025/11/5 13:03:58

Python：操作 Excel 折叠

💖亲爱的技术爱好者们，热烈欢迎来到 Kant2048 的博客！我是 Thomas Kant，很开心能在CSDN上与你们相遇～💖 本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】 Python 操作 Excel 系列读取单元格数据按行写入设置行高和列宽自动调整行高和列宽水平…...

编程新知 2026/1/30 20:05:06

Redis相关知识总结（缓存雪崩，缓存穿透，缓存击穿，Redis实现分布式锁，如何保持数据库和缓存一致）

文章目录 1.什么是Redis？2.为什么要使用redis作为mysql的缓存？3.什么是缓存雪崩、缓存穿透、缓存击穿？3.1缓存雪崩3.1.1 大量缓存同时过期3.1.2 Redis宕机 3.2 缓存击穿3.3 缓存穿透3.4 总结 4. 数据库和缓存如何保持一致性5. Redis实现分布式…...

编程新知 2026/2/8 12:24:34

MFC内存泄露

1、泄露代码示例 void X::SetApplicationBtn() {CMFCRibbonApplicationButton* pBtn GetApplicationButton();// 获取 Ribbon Bar 指针// 创建自定义按钮CCustomRibbonAppButton* pCustomButton new CCustomRibbonAppButton();pCustomButton->SetImage(IDB_BITMAP_Jdp26)…...

编程新知 2026/1/22 15:14:25

系统设计 --- MongoDB亿级数据查询优化策略

系统设计 --- MongoDB亿级数据查询分表策略背景Solution --- 分表背景使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log，共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题，不能使用ELK只能使用…...

编程新知 2026/1/4 3:47:09

【C++从零实现Json-Rpc框架】第六弹 —— 服务端模块划分

一、项目背景回顾前五弹完成了Json-Rpc协议解析、请求处理、客户端调用等基础模块搭建。本弹重点聚焦于服务端的模块划分与架构设计，提升代码结构的可维护性与扩展性。二、服务端模块设计目标高内聚低耦合：各模块职责清晰，便于独立开发…...

编程新知 2025/10/13 4:15:41

代理篇12|深入理解 Vite中的Proxy接口代理配置

在前端开发中，常常会遇到跨域请求接口的情况。为了解决这个问题，Vite 和 Webpack 都提供了 proxy 代理功能，用于将本地开发请求转发到后端服务器。什么是代理（proxy）？代理是在开发过程中，前端项目通过开发服务器，将指定的请求“转发”到真实的后端服务器，从而绕…...

编程新知 2025/10/27 20:33:34

10-Oracle 23 ai Vector Search 概述和参数

一、Oracle AI Vector Search 概述企业和个人都在尝试各种AI，使用客户端或是内部自己搭建集成大模型的终端，加速与大型语言模型（LLM）的结合，同时使用检索增强生成（Retrieval Augmented Generation &#…...

编程新知 2026/2/7 21:32:44