当前位置: 首页 > article >正文

吴恩达深度学习复盘(1)神经网络与深度学习的发展

一、神经网络的起源与生物学动机

  1. 灵感来源
    神经网络的最初动机源于对生物大脑的模仿。20 世纪 50 年代,科学家试图通过软件模拟神经元的工作机制(如树突接收信号、轴突传递信号),构建类似人类大脑的信息处理系统。

  2. 生物神经元的简化模型
    人工神经网络采用数学模型简化生物神经元的行为:每个神经元接收输入(数字信号),通过加权求和与激活函数处理后输出。尽管这一模型远不及真实大脑复杂,但早期研究认为其可能复现智能行为。

二、神经网络的发展历程
  1. 20 世纪 50-80 年代:萌芽期

    • 1958 年,感知机(Perceptron)的提出标志着神经网络的诞生,但受限于硬件和理论,未能解决复杂问题。
    • 1980 年代,反向传播算法的提出推动了多层神经网络的发展,在手写数字识别等任务中取得突破(如邮政编码识别)。
  2. 1990 年代:低谷期

    • 传统神经网络因计算成本高、数据量不足及理论局限,逐渐被支持向量机(SVM)等方法取代。
  3. 2005 年后:复兴与深度学习崛起

    • 数据爆炸:互联网、移动设备普及带来海量数字化数据(如健康记录、在线行为)。
    • 计算能力提升:GPU(图形处理器)的应用大幅加速模型训练,尤其适用于深层神经网络。
    • 算法创新:深度神经网络(如 CNN、RNN)在语音识别(2010 年微软)、计算机视觉(2012 年 ImageNet 竞赛)等领域实现突破性进展。
三、深度学习的核心特点
  1. “深度” 的含义

    • 深度学习强调多层非线性特征提取。例如,CNN 通过卷积层、池化层逐步从像素中提取边缘、纹理到复杂物体特征。
  2. 与传统神经网络的区别

    • 深度网络层数更多(如 ResNet 可达千层),参数量更大,依赖大规模数据训练。
    • 名称变化:“深度学习” 更突出层级结构,淡化生物学隐喻,强调工程实用性。
四、应用领域的革命
  1. 语音识别

    • 深度学习使错误率下降 50% 以上,推动 Siri、Alexa 等智能助手普及。
  2. 计算机视觉

    • 2012 年 ImageNet 竞赛中,AlexNet 准确率远超传统方法,开启图像分类、目标检测的新时代。
  3. 自然语言处理(NLP)

    • Transformer 模型(如 GPT 系列)实现文本生成、翻译等任务的突破,重塑人机交互方式。
  4. 其他领域

    • 医疗影像诊断、气候变化预测、个性化推荐(如 Netflix、亚马逊)等均依赖深度学习。
五、复兴的关键驱动力
  1. 数据量激增

    • 传统算法(如线性回归)在小数据下表现良好,但无法充分利用大数据的潜力。深度学习通过深层网络挖掘数据中的复杂模式。
  2. 硬件进步

    • GPU 并行计算能力比 CPU 快数十倍,支持训练更大规模的模型(如 GPT-4 拥有万亿参数)。
  3. 算法优化

    • 批量归一化、残差连接等技术缓解梯度消失问题,使训练深层网络成为可能。
六、生物学动机的淡化与未来
  1. 从模仿到工程化

    • 早期神经网络试图复制大脑机制,但现代研究更关注算法有效性。例如,反向传播与突触可塑性无直接关联。
  2. 神经科学的启示

    • 尽管当前模型与大脑差异显著(如离散符号处理 vs. 连续神经信号),神经科学的新发现(如脉冲神经网络)可能为未来算法提供灵感。
笔者总结

前几节课程没什么公式和概念。只是让学习者有个大概的印象,热下身。

人工神经网络(ANN)是模拟生物神经元结构的计算模型,通过多层节点和权重连接处理数据,早期受限于层数(通常 1-2 层隐含层)和数据规模,依赖人工设计特征。

深度学习则是 ANN 的子集,特指具有深层结构(数十至上百层)的神经网络,其核心突破在于通过层次化特征提取自动学习抽象特征,解决了传统 ANN 难以处理的复杂问题。

深度学习的兴起得益于三大驱动力:

数据爆炸(互联网、移动设备带来的海量数字化数据);

硬件进步(GPU/TPU 加速训练);

算法优化(ReLU 激活函数、残差连接等技术缓解梯度消失)。

典型应用从早期语音识别(如 2010 年微软的深度学习突破)扩展到计算机视觉(2012 年 ImageNet 竞赛)、自然语言处理(GPT 系列模型)等领域。与 ANN 相比,深度学习更依赖大规模数据和计算资源,但通过深层网络实现了从图像、文本到语音的端到端学习,彻底改变了机器学习的应用范式。

神经网络从模仿生物大脑的尝试,演变为基于工程原理的强大工具,其复兴得益于数据、硬件与算法的协同进步。未来,随着神经科学和计算技术的突破,神经网络可能进一步逼近人类智能的边界,同时保持其作为通用人工智能基石的地位。

相关文章:

吴恩达深度学习复盘(1)神经网络与深度学习的发展

一、神经网络的起源与生物学动机 灵感来源 神经网络的最初动机源于对生物大脑的模仿。20 世纪 50 年代,科学家试图通过软件模拟神经元的工作机制(如树突接收信号、轴突传递信号),构建类似人类大脑的信息处理系统。 生物神经元的简…...

用Python实现资本资产定价模型(CAPM)

使用 Python 计算资本资产定价模型(CAPM)并获取贝塔系数(β)。 步骤 1:导入必要的库 import pandas as pd import yfinance as yf import statsmodels.api as sm import matplotlib.pyplot as plt 步骤 2&#xff1…...

Linux进程管理之子进程的创建(fork函数)、子进程与线程的区别、fork函数的简单使用例子、子进程的典型应用场景、父进程等待子进程结束后自己再结束

收尾 进程终止:子进程通过exit()或_exit()终止,父进程通过wait()或waitpid()等待子进程终止,并获取其退出状态。?其实可以考虑在另一篇博文中来写 fork函数讲解 fork函数概述 fork() 是 Linux 中用于创建新进程的系统调用。当…...

妙用《甄嬛传》中的选妃来记忆概率论中的乘法公式

强烈推荐最近在看的不错的B站概率论课程 《概率统计》正课,零废话,超精讲!【孔祥仁】 《概率统计》正课,零废话,超精讲!【孔祥仁】_哔哩哔哩_bilibili 其中概率论中的乘法公式,老师用了《甄嬛传…...

虚幻基础:UI

文章目录 控件蓝图可以装载其他控件蓝图可以安装其他蓝图接口 填充:相对于父组件填充水平框尺寸—填充—0.5:改变填充的尺寸填充—0.5:改变与父组件的距离 锚点:相对于父组件的控件坐标系原点,屏幕比例改变时&#xff…...

【MySQL篇】事务管理,事务的特性及深入理解隔离级别

目录 一,什么是事务 二,事务的版本支持 三,事务的提交方式 四,事务常见操作方式 五,隔离级别 1,理解隔离性 2,查看与设置隔离级别 3,读未提交(read uncommitted&a…...

项目实战-角色列表

抄上一次写过的代码: import React, { useState, useEffect } from "react"; import axios from axios; import { Button, Table, Modal } from antd; import { BarsOutlined, DeleteOutlined, ExclamationCircleOutlined } from ant-design/icons;const…...

fetch`的语法规则及常见用法

fetch() 是 JavaScript 用于发送 HTTP 请求的内置 API,功能强大,语法简洁。以下是 fetch 的语法规则及常见用法。 1. fetch 基本语法 fetch(url, options).then(response > response.json()) // 解析 JSON 响应体.then(data > console.log(data))…...

如何排查java程序的宕机和oom?如何解决宕机和oom?

排查oom 用jmap生成我们的堆空间的快照Heap Dump(堆转储文件),来分析我们的内存占用 用可视化工具,例如java中的jhat分析Heap Dump文件 ,它分析完会通过一个浏览器打开一个可视化页面展示分析结果 根据oom的类型来调…...

26_ajax

目录 了解 接口 前后端交互 一、安装服务器环境 nodejs ajax发起请求 渲染响应结果 get方式传递参数 post方式传递参数 封装ajax_上 封装ajax下 了解 清楚前后端交互就可以写一些后端代码了。小项目 现在写项目开发的时候都是前后端分离 之前都没有前端这个东西&a…...

代理模式(Proxy Pattern)实现与对比

代理模式(Proxy Pattern)实现与对比 1. 虚拟代理(Virtual Proxy) 定义:延迟加载对象,避免资源浪费。 适用场景:大文件或资源的加载(如图片、数据库连接)。 代码示例 /…...

MySQL - 数据库基础操作

SQL语句 结构化查询语言(Structured Query Language),在关系型数据库上执行数据操作、数据检索以及数据维护的标准语言。 分类 DDL 数据定义语言(Data Definition Language),定义对数据库对象(库、表、列、索引)的操作。 DML 数据操作语言(Data Manip…...

​​​​​​Spring Boot热部署插件

在实际开发中,我们修改某些代码或页面都需要重启应用后才能生效,如果每次都手动重启,会降低了开发效率;热部署是指当我们修改代码后,服务能自动重启加载新修改的内容,这样大大提高了我们开发的效率&#xf…...

pip install cryptacular卡住,卡在downloading阶段

笔者安装pip install cryptacular卡在downloading阶段,但不知道为何 Collecting cryptacularCreated temporary directory: /tmp/pip-unpack-qfbl8f08http://10.170.22.41:8082 "GET http://repo.huaweicloud.com/repository/pypi/packages/42/69/34d478310d6…...

AI大模型从0到1记录学习 day09

第 8 章 面向对象之类和对象 8.1 面向过程和面向对象 面向过程编程(Procedural Programming)和面向对象编程(OOP)是两种不同的编程范式,它们在软件开发中都有广泛的应用。 Python是一种混合型的语言,既支持…...

【FW】ADB指令分类速查清单

1. 设备管理 指令核心作用adb devices列出已连接设备adb reboot重启设备adb reboot bootloader进入Bootloader模式adb reboot recovery进入Recovery模式adb root获取Root权限(需设备支持)adb remount挂载系统分区为可读写 2. 应用管理 指令核心作用adb…...

Kafka中的消息是如何存储的?

大家好,我是锋哥。今天分享关于【Kafka中的消息是如何存储的?】面试题。希望对大家有帮助; 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 在 Kafka 中,消息是通过 日志(Log) 的方式进行存储的。…...

Altium Designer——同时更改多个元素的属性(名称、网络标签、字符串标识)

右键要更改的其中一个对象,选择查找相似… 进入到筛选界面,就是选择你要多选的对象的共同特点(名字、大小等等),我这里要更改的是网络标签,所以我选择Text设置为一样。 点击应用就是应用该筛选调节&#…...

当模板方法模式遇上工厂模式:一道优雅的烹饪架构设计

当模板方法模式遇上工厂模式:一道优雅的烹饪架构设计 模式交响曲的实现模板方法模式搭建烹饪骨架(抽象类)具体菜品(子类) 工厂模式 模式协作的优势呈现扩展性演示运行时流程控制 完整代码 如果在学习 设计模式的过程中…...

c++位运算总结

在C中,位运算是对二进制位进行操作的运算,主要有以下几种: 1. 按位与( & ):两个操作数对应位都为1时,结果位才为1,否则为0。例如 3 & 5 , 3 二进制是 0000 0011…...

企业级知识库建设:自建与开源产品集成的全景解析 —— 产品经理、CTO 与 CDO 的深度对话

文章目录 一、引言二、主流产品与方案对比表三、自建方案 vs. 开源产品集成:技术路径对比3.1 自建方案3.2 开源产品集成方案 四、结论与个人观点 一、引言 在当今数据驱动的商业环境中,构建高质量的知识库已成为企业数字化转型的关键一环。本博客分别从…...

Python小练习系列 Vol.6:单词搜索(网格回溯)

🧠 Python小练习系列 Vol.6:单词搜索(网格回溯) 🔍 本期我们来挑战一道 LeetCode 上经典的网格型回溯题 —— 单词搜索,考察对 DFS 状态恢复的掌握! 🧩 一、题目描述 给定一个 m x…...

shell脚本--MySQL简单调用

实现功能 增 数据库的创建,数据表的创建已经实现 创建用户 删 删除数据库, 删除库下的某个表, 删除某个用户 改 暂无 查 查看所有的数据库, 查看某个库下的所有数据表, 查看某个表的结构, 查…...

vue3项目配置别名

vue3项目配置别名 src别名的配置TypeScript 编译配置如果出现/别名引入报找不到的问题 src别名的配置 在开发项目的时候文件与文件关系可能很复杂,因此我们需要给src文件夹配置一个别名!!! // vite.config.ts import {defineCon…...

Rust 面向对象

Rust 面向对象 引言 Rust 是一种系统编程语言,以其高性能、内存安全和并发支持而受到关注。Rust 的面向对象特性是其强大功能之一,它允许开发者以面向对象的方式构建复杂的应用程序。本文将深入探讨 Rust 的面向对象编程(OOP)特性,包括类的定义、继承、封装和多态等概念…...

[ C语言 ] | 从0到1?

目录 认识计算机语言 C语言 工欲善其事必先利其器 第一个C语言代码 这一些列 [ C语言 ] ,就来分享一下 C语言 相关的知识点~ 认识计算机语言 我们说到计算机语言,语言,就是用来沟通的工具,计算机语言呢?就是我们…...

[Mac]利用Hexo+Github Pages搭建个人博客

由于我这台Mac基本没啥环境,因此需要从零开始配置,供各位参考。 注意⚠️:MacBook (M4)使用/bin/zsh作为默认Shell,其对应的配置文件为~/.zshrc 参考文档: HEXO系列教程 | 使用GitHub部署静态博客HEXO | 小白向教程 文…...

pycharm与python版本

python 3.6-3.9 pycharm 2021版本搭配最好 python 3.8 pycharm 2019版本搭配最好 pycharm各版本下载...

Qt在IMX6ULL嵌入式系统中图片加载问题排查与解决

Qt在IMX6ULL嵌入式系统中图片加载问题排查与解决(保姆级教学!) 在使用Qt开发IMX6ULL嵌入式系统的过程中,我遇到了图片加载的常见问题。本文将分享问题排查的详细过程和解决方案,希望能帮助遇到类似困难的开发者。 问题…...

界面控件Telerik和Kendo UI 2025 Q1亮点——AI集成与数据可视化

Telerik DevCraft包含一个完整的产品栈来构建您下一个Web、移动和桌面应用程序。它使用HTML和每个.NET平台的UI库,加快开发速度。Telerik DevCraft提供完整的工具箱,用于构建现代和面向未来的业务应用程序,目前提供UI for ASP.NET MVC、Kendo…...