当前位置: 首页 > news >正文

2021秋招-总目录

2021秋招-目录

知识点总结

  1. 预训练语言模型: Bert家族
    1.1 BERT、attention、transformer理解部分
  1. B站讲解–强烈推荐
  2. 可视化
  3. 推倒
  4. 结合代码理解
  5. 代码部分
  6. 常见面试考点以及问题:
  1. word2vec 、 fasttext 、elmo;
  2. BN 、LN、CN、WN
  3. NLP中的loss与评价总结
    4.1 loss_function:
  1. 深度学习-Loss函数
  1. L1、L2正则化总结: L1,L2正则所有问题-视频-PPT截图⭐⭐⭐⭐
    5.1 知乎-L1正则化与L2正则化⭐⭐⭐
    5.2 贝叶斯眼里的正则化⭐⭐
    5.1 L1正则化与L2正则化
    5.2 深入理解L1、L2正则化
    5.3 L1和L2正则化的概率解释🎃
    5.4 机器学习中的范数规则化之(一)L0、L1与L2范数
    5.5 L1正则化和L2正则化的详细直观解释
    5.6 机器学习——正则化不理解的地方
  2. 过拟合、欠拟合 原因、现象、解决办法。
    6.1 深度学习中的过拟合问题和解决办法(转载)
    6.2

面经

刷题

深度学习汇总

0. 数学公式整理

机器学习之常用矩阵/向量运算-待整理

  1. 矩阵乘法
  2. Hadamard product
  3. 向量点积
  4. 向量叉积
  5. CNN中点积求和
  6. 矩阵乘法中: 可以看作 向量点积;

(转载)数学-矩阵计算 矩阵和向量的求导法则-待整理

1. 前馈网络、反向传播公式推导

反向传播算法(过程及公式推导)⭐⭐⭐
反向传播算法—从四个基本公式说起

  • 神经元结构神经网络入门——神经元算法
    在这里插入图片描述
  • 神经元/数据/参数 计算; 神经元指的一个结构。
    在这里插入图片描述
    在这里插入图片描述

2. SGD推倒

3. 优化器总结

4. 激活函数总结

5. pooling、dropout、

6. 参数 &超参数、batch_size、学习率

6.损失函数专题

7.过拟合、欠拟合

8.BN、LN

8.1 Internal Covariate Shift

  • 如何理解 Internal Covariate Shift?

​ 深度神经网络模型的训练为什么会很困难?其中一个重要的原因是,深度神经网络涉及到很多层的叠加,而每一层的参数更新会导致上层的输入数据分布发生变化,通过层层叠加,高层的输入分布变化会非常剧烈,这就使得高层需要不断去重新适应底层的参数更新。为了训好模型,我们需要非常谨慎地去设定学习率、初始化权重、以及尽可能细致的参数更新策略。

​ Google 将这一现象总结为 Internal Covariate Shift,简称 ICS。 什么是 ICS 呢?

​ 大家都知道在统计机器学习中的一个经典假设是“源空间(source domain)和目标空间(target domain)的数据分布(distribution)是一致的”。如果不一致,那么就出现了新的机器学习问题,如 transfer learning / domain adaptation 等。而 covariate shift 就是分布不一致假设之下的一个分支问题,它是指源空间和目标空间的条件概率是一致的,但是其边缘概率不同

​ 大家细想便会发现,的确,对于神经网络的各层输出,由于它们经过了层内操作作用,其分布显然与各层对应的输入信号分布不同,而且差异会随着网络深度增大而增大,可是它们所能“指示”的样本标记(label)仍然是不变的,这便符合了covariate shift的定义。由于是对层间信号的分析,也即是“internal”的来由。

那么ICS会导致什么问题?

简而言之,每个神经元的输入数据不再是“独立同分布”。

其一,上层参数需要不断适应新的输入数据分布,降低学习速度。

其二,下层输入的变化可能趋向于变大或者变小,导致上层落入饱和区,使得学习过早停止。

其三,每层的更新都会影响到其它层,因此每层的参数更新策略需要尽可能的谨慎。

参考文献

9.CNN

10.RNN

11.Attention-Transformer

12.BERT

13.BERT~ALBert ~ 。。。

相关文章:

2021秋招-总目录

2021秋招-目录 知识点总结 预训练语言模型: Bert家族 1.1 BERT、attention、transformer理解部分 B站讲解–强烈推荐可视化推倒结合代码理解代码部分常见面试考点以及问题: word2vec 、 fasttext 、elmo;BN 、LN、CN、WNNLP中的loss与评价总结 4.1 loss_function&#xff1…...

HTML5生成二维码

H5生成二维码 前言二维码实现过程页面实现关键点全部源码 前言 本文主要讲解如何通过原生HTML、CSS、Js中的qrcodejs二维码生成库,实现一个输入URL按下回车后输出URL。文章底部有全部源码,需要可以自取。 实现效果图: 上述实现效果为&#…...

大数据-之LibrA数据库系统告警处理(ALM-25005 Nscd服务异常)

告警解释 系统每60秒周期性检测nscd服务的状态,如果连续4次(3分钟)查询不到nscd进程或者无法获取ldapserver中的用户时,产生该告警。 当进程恢复且可以获取ldapserver中的用户时,告警恢复。 告警属性 告警ID 告警级…...

NLP:使用 SciKit Learn 的文本矢量化方法

一、说明 本文是使用所有 SciKit Learns 预处理方法生成文本数字表示的深入解释和教程。对于以下每个矢量化器,将给出一个简短的定义和实际示例:one-hot、count、dict、TfIdf 和哈希矢量化器。 SciKit Learn 是一个用于机器学习项目的广泛库,…...

这些仪表板常用的数据分析模型,你都见过吗?

本文由葡萄城技术团队发布。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 ##前言 在数字化时代,数据已经成为了企业决策和管理的重要依据。而仪表板作为一种数据可视化工具&#x…...

【Proteus仿真】【Arduino单片机】多功能数字时钟设计

文章目录 一、功能简介二、软件设计三、实验现象联系作者 一、功能简介 本项目使用Proteus8仿真Arduino单片机控制器,使用PCF8574、LCD1602液晶、DS1302温度传感器、DS1302时钟、按键、蜂鸣器等。 主要功能: 系统运行后,LCD1602显示当前日期…...

c语言回文数

以下是用C语言编写的回文数代码&#xff1a; #include <stdio.h>int main() { int num, reversedNum 0, remainder, originalNum; printf("请输入一个正整数&#xff1a;"); scanf("%d", &num); originalNum num; while (num …...

【学习记录】从0开始的Linux学习之旅——编译linux内核

一、学习背景 从接触嵌入式至今&#xff0c;除了安装过双系统接触了一丢丢linux外&#xff0c;linux在我眼中向来是个传说。而如今得到了一块树莓派&#xff0c;于是决心把linux搞起来。 二、概念学习 Linux操作系统通常是基于Linux内核&#xff0c;并结合GNU项目中的工具和应…...

uni-app - 日期 · 时间选择器

目录 1.基本介绍 2.案例介绍 ①注意事项&#xff1a; ②效果展示 3.代码展示 ①view部分 ②js部分 ③css样式 1.基本介绍 从底部弹起的滚动选择器。支持五种选择器&#xff0c;通过mode来区分&#xff0c;分别是普通选择器&#xff0c;多列选择器&#xff0c;时间选择器&a…...

使用USB转JTAG芯片CH347在Vivado下调试

简介 高速USB转接芯片CH347是一款集成480Mbps高速USB接口、JTAG接口、SPI接口、I2C接口、异步UART串口、GPIO接口等多种硬件接口的转换芯片。 通过XVC协议&#xff0c;将CH347应用于Vivado下&#xff0c;简单尝试可以成功&#xff0c;源码如下&#xff0c;希望可以一起共建&a…...

硬技能之上的软技巧(三)

在硬技能的基础上&#xff0c;如何运用软技巧来进一步提升个人能力和职业发展。在之前的讨论中&#xff0c;我们提到了硬技能和软技巧的基本概念&#xff0c;以及如何运用软技巧来提升个人能力和职业发展。本篇文章将进一步探讨软技巧中的一些重要方面&#xff0c;包括自我管理…...

mysql 查询

-- 多表查询select * from tb_dept,tb_emp; 内来链接 -- 内连接 -- A 查询员工的姓名 &#xff0c; 及所属的部门名称 &#xff08;隐式内连接实现&#xff09;select tb_emp.name,tb_dept.name from tb_emp,tb_dept where tb_emp.idtb_emp.id;-- 推荐使用select a.name,b.n…...

2311rust过程宏的示例

原文 Rust2018中的过程宏 在Rust2018版本中,我最喜欢的功能是过程宏.在Rust中,过程宏有着悠久而传奇的历史(并继续拥有传奇的未来!) 因为2018年版极大改善了定义和使用它们的体验. 什么是过程宏 过程宏是,在编译时用一段语法,生成新语法的函数.Rust2018中的过程宏有三个风格…...

数据分析:数据预处理流程及方法

数据预处理是数据分析过程中至关重要的一步&#xff0c;它涉及到清洗、转换和整理原始数据&#xff0c;以便更好地适应分析模型或算法。以下是一些常见的数据预处理方法和规则&#xff1a; 数据清洗&#xff1a; 处理缺失值&#xff1a;检测并处理数据中的缺失值&#xff0c;可…...

uniapp 防抖节流封装和使用

防抖(debounce)&#xff1a;定义一个时间&#xff0c;延迟n秒执行&#xff0c;n秒内再次调用&#xff0c;会重新计时&#xff0c;计时结束后才会再次执行 主要运用场景&#xff1a; 输入框实时搜索&#xff1a;在用户输入内容的过程中&#xff0c;使用防抖可以减少频繁的查询…...

springcloud alibaba学习视频

阿里云登录 - 欢迎登录阿里云&#xff0c;安全稳定的云计算服务平台...

【MySQL】一些内置函数(时间函数、字符串函数、数学函数等,学会了有妙用)

内置函数 前言正式开始时间函数显示当前日期、时间、日期时间的日期计算相差多少天示例创建一张表&#xff0c;记录生日 留言表 字符串函数charsetconcatinstr(string, substring)ucase和lcaseleft(string, length)length求字符串长度replace(str, search_str, replace_str)tri…...

QtC++与QColumnView详解

介绍 在 Qt 中&#xff0c;QColumnView 是用于显示多列数据的控件&#xff0c;它提供了一种多列列表视图的方式&#xff0c;类似于文件资源管理器中的详细视图。QColumnView 是基于模型/视图架构的&#xff0c;通常与 QFileSystemModel 或自定义模型一起使用。 以下是关于 QC…...

微信小程序配置企业微信的在线客服

配置企业微信后台 代码实现 <button tap"openCustomerServiceChat">打开企业微信客服</button>methods: {openCustomerServiceChat(){wx.openCustomerServiceChat({extInfo: {url: 你刚才的客服地址},corpId: 企业微信的id,showMessageCard: true,});} …...

深入理解Java AQS:从原理到源码分析

目录 AQS的设计原理1、队列节点 Node 和 FIFO队列结构2、state 的作用3、公平锁与非公平锁 AQS 源码解析1、Node节点2、acquire(int)3、release(int)4、自旋&#xff08;Spin&#xff09;5、公平性与 FIFO 基于AQS实现的几种同步器1、ReentrantLock&#xff1a;可重入独占锁2、…...

开源工具token-usage-ui:可视化监控LLM API Token用量与成本

1. 项目概述&#xff1a;一个为AI开发者量身打造的Token用量监控利器如果你正在开发基于OpenAI、Anthropic、Azure OpenAI等主流大语言模型API的应用&#xff0c;那么“Token用量”这个指标&#xff0c;你一定不会陌生。它直接关联着你的API调用成本、应用性能&#xff0c;甚至…...

权限管理自动化实践:从RBAC/ABAC模型到Claw Farm工具集

1. 项目概述&#xff1a;从“Claw Farm”看权限管理的自动化实践 最近在开源社区里看到一个挺有意思的项目&#xff0c;叫“claw-farm”。光看名字&#xff0c;你可能会联想到“爪子农场”或者某种游戏模组&#xff0c;但它的实际定位是一个专注于权限&#xff08;Permission&a…...

Java面试现场:从Redis缓存到分布式事务,水货程序员李四的‘表演‘

Java面试现场&#xff1a;从Redis缓存到分布式事务&#xff0c;水货程序员李四的表演 场景&#xff1a;某互联网大厂Java工程师面试现场&#xff0c;严肃的面试官正在面试一位名叫李四的求职者。 第一轮面试&#xff1a;Java核心与基础 面试官&#xff1a;李四&#xff0c;先简…...

AISMM落地学术界仅剩90天:3大不可逆趋势、5类高危研究陷阱与2026必争技术制高点

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;2026奇点智能技术大会&#xff1a;AISMM与学术研究 2026奇点智能技术大会&#xff08;Singularity Intelligence Summit 2026&#xff09;正式发布全新学术框架 AISMM&#xff08;Artificial Intellige…...

革命性Ruby安装工具ruby-install:一键安装5种Ruby实现完全指南

革命性Ruby安装工具ruby-install&#xff1a;一键安装5种Ruby实现完全指南 【免费下载链接】ruby-install Installs Ruby, JRuby, TruffleRuby, or mruby 项目地址: https://gitcode.com/gh_mirrors/ru/ruby-install ruby-install是一款功能强大的命令行工具&#xff0c…...

AI辅助数据分析:用测试数据与覆盖率数据驱动质量改进

AI辅助数据分析&#xff1a;用测试数据与覆盖率数据驱动质量改进&#xff08;让质量变成“可运营指标”&#xff09;很多团队做质量建设时&#xff0c;容易陷入两种极端&#xff1a; “只看感觉”&#xff1a;靠资深工程师经验判断哪里风险高“只看数字”&#xff1a;盯着覆盖率…...

六层板层压性能检验走过场?3个致命缺陷,高温必爆

六层板层压是核心工艺&#xff0c;层压性能检验常被忽视&#xff1a;外观无气泡、不分层就合格&#xff0c;结果高温焊接、长期使用后&#xff0c;层间分层、气泡鼓起、板翘曲&#xff0c;整板报废。某消费电子客户踩坑&#xff1a;一款智能手表六层板&#xff0c;层压检验仅看…...

技能进化系统:用数据可视化与网状图谱管理个人知识成长

1. 项目概述与核心价值最近在GitHub上看到一个挺有意思的项目&#xff0c;叫“skill-evolution”。光看这个名字&#xff0c;你可能会联想到技能树、能力进化或者某种学习系统。没错&#xff0c;这个项目本质上就是一个个人技能管理与进化追踪系统。它不是那种简单的待办清单&a…...

如何快速解决细胞图像分割难题:Cellpose完整指南

如何快速解决细胞图像分割难题&#xff1a;Cellpose完整指南 【免费下载链接】cellpose a generalist algorithm for cellular segmentation with human-in-the-loop capabilities 项目地址: https://gitcode.com/gh_mirrors/ce/cellpose Cellpose是一款基于深度学习的开…...

中科院深圳先进技术研究院等机构揭示网站生成智能体的致命盲区

这项由中国科学院深圳先进技术研究院、中国科学院大学、大连理工大学以及澳大利亚新南威尔士大学共同完成的研究&#xff0c;以预印本形式发布于2026年4月30日&#xff0c;论文编号为arXiv:2604.27419v1&#xff0c;分类于计算机人工智能领域。感兴趣的读者可通过该编号在arXiv…...