当前位置：首页 > news >正文

自然语言NLP学习

news 2026/5/13 4:15:35

2-7 门控循环单元（GRU）_哔哩哔哩_bilibili

GRU LSTM

双向RNN

CNN 卷积神经网络

输入层转化为向量表示

dropout

ppl

标量

在物理学和数学中，标量（Scalar）是一个只有大小、没有方向的量。它只用一个数值就可以完全描述，且满足交换律。例如，质量、温度、时间、体积、密度、功、能量等都是标量。

在向量代数中，标量与向量是相对的概念，标量可以与向量相乘，从而改变向量的长度但不改变其方向。例如，在三维空间中，如果一个向量的长度为3，一个标量为2，那么这个标量乘以向量的结果将得到一个长度为6，方向不变的新向量。

注意力分数

隐向量

隐向量（Latent Vector）是机器学习和深度学习中一个重要的概念，特别是在自然语言处理、推荐系统、图像识别等领域。隐向量是用来表示复杂数据的一种低维实数向量，它通过训练学习到的，并试图捕捉原始高维数据中的潜在结构和语义信息。

在推荐系统中：

隐向量通常用来表示用户和物品（如电影、音乐等），每个用户和每件物品都被映射到一个固定维度的向量空间中。
例如，在因子分解机（FM，Factorization Machines）模型中，各个特征（比如用户ID或商品ID）对应的隐向量可以通过矩阵分解得到，这些隐向量的内积可以用来预测用户对商品的评分或者偏好。

在自然语言处理中：

单词或文档也可以用隐向量来表示，这种表示方法常被称为词嵌入（Word Embeddings），如Word2Vec、GloVe等模型生成的向量。
这些隐向量可以捕获单词之间的语义相似性，使得在向量空间中距离相近的单词具有类似的含义。

在深度学习架构中：

在神经网络中，Embedding层就是用来将离散的高维输入（如one-hot编码）转换为连续的低维隐向量，以便进行后续的计算和模式挖掘。

总的来说，隐向量是一种压缩和抽象的表示形式，它有助于模型理解和处理高维稀疏数据，并能够发现数据内部隐藏的模式和联系。

softmax函数是一种在机器学习和深度学习中广泛使用的归一化指数函数，主要用于多分类问题的输出层计算预测类别概率分布。

激活函数

注意力机制解决信息瓶颈问题

Transformer

BPE

交叉熵

正则化

加权平均是一种统计方法，用于计算一组数值的平均值时，考虑到每个数值的重要性（权重）不同。在普通平均数中，所有数据点都同等重要，而在加权平均中，每个数据点有一个与其对应的权重值，这个权重反映了该数据点在最终结果中的相对影响程度。

加权平均的计算公式为：

加权平均数=∑(每个数据值×对应权重)∑(所有权重)加权平均数=∑(所有权重)∑(每个数据值×对应权重)

例如，在学校教育场景中，一个学生的学期总评成绩可能由平时测验、期中考试和期末考试的成绩按不同比例（权重）综合得出：

平时测验：80 分，权重 20%
期中考试：90 分，权重 30%
期末考试：95 分，权重 50%

那么，该学生的学期总评成绩可以通过以下步骤计算：

学期总评成绩=(80×0.2)+(90×0.3)+(95×0.5)0.2+0.3+0.5学期总评成绩=0.2+0.3+0.5(80×0.2)+(90×0.3)+(95×0.5)

此外，在财务领域，加权平均法常用于库存管理，计算存货的单位成本。例如，考虑一段时间内多次购入商品的情况，每次购入的数量和单价不同，这时会根据各批次进货的数量（作为权重）和其相应的单价来计算整个库存的平均单位成本。

3-13 预训练语言模型--PLM介绍_哔哩哔哩_bilibili

相关文章：

自然语言NLP学习

2-7 门控循环单元（GRU）_哔哩哔哩_bilibili GRU LSTM 双向RNN CNN 卷积神经网络输入层转化为向量表示 dropout ppl 标量在物理学和数学中，标量（Scalar）是一个只有大小、没有方向的量。它只用一个数值就可以完全…...

编程日记 2024/1/26 6:12:37

js实现填涂画板

文章目录 1实现效果2 实现代码凑个数，存粹是好玩儿，哈哈... 1实现效果最上方一栏： 左侧是颜色按钮，点击选中颜色， 中间是功能按钮，重置颜色、清空画板、回退、涂改液（填涂色置为白色&#xff…...

编程日记 2024/1/26 6:11:36

springboot农机电招平台源码和论文

随着农机电招行业的不断发展，农机电招在现实生活中的使用和普及，农机电招行业成为近年内出现的一个新行业，并且能够成为大群众广为认可和接受的行为和选择。设计农机电招平台的目的就是借助计算机让复杂的销售操作变简单，变高效。…...

编程日记 2024/1/26 6:10:35

TensorFlow 深度学习开发环境搭建全教程

PyTorch 深度学习开发环境搭建全教程 TensorFlow 深度学习开发环境搭建全教程 1、指定清华源命令 -i https://pypi.tuna.tsinghua.edu.cn/simple2、conda安装这是AI开发环境的全家桶，官网下载链接Anaconda | Start Coding Immediately 尽量不要选择太新版本…...

编程日记 2024/1/26 6:08:33

Qt —— QCharts之曲线示波器（附源码）

示例效果介绍 Qt5.7 版本后 Qt Charts 的发布。Qt Charts可以创建时尚的、交互式的、以数据为中心的用户界面。Qt Charts使用Qt Charts来简化集成。图表组件可以用作或对象或QML类型。该类管理不同类型的系列和其他图表相关对象（如图例和轴）的图形表示形式。是一个可以在 .…...

编程日记 2024/1/26 6:07:32

【秒剪】如何更换视频画幅比例以及画面背景？

Step1：点击上方显示的画幅比例 Step2：在下方选择合适的视频画幅或更换画面背景 Step3：点击上方【填充方式】 Step4：选择合适的填充方式即可 Step5：点击这里即可自定义视频背景...

编程日记 2024/1/26 6:05:30

HarmonyOS鸿蒙学习笔记（23）监听Wifi状态变化

监听Wifi状态变化前言创建接收状态变化的Bean对象创建订阅者和订阅事件参考资料： 前言本篇博文通过动态订阅公共事件来说明怎么使用HarmonyOS监听Wifi状态的变化。关于动态订阅公共事件的概念，官网有详细说明，再次就不在赘述。博文相关项目…...

编程日记 2024/1/26 6:04:29

mac 安装配置oh-my-zsh

1. 安装brew /bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)" 按照步骤安装即可安装完成查看版本 brew -v 2. 安装zsh brew install zsh 查看版本 zsh --version 3. 安装oh-my-zsh github官网链…...

编程日记 2024/1/26 6:03:28

[pytorch入门] 2. tensorboard

tensorboard简介 TensorBoard 是一组用于数据可视化的工具。它包含在流行的开源机器学习库 Tensorflow 中.但是也可以独立安装，服务Pytorch等其他的框架可以常常用来观察训练过程中每一阶段如何输出的安装pip install tensorboard启动tensorboard --logdir<d…...

编程日记 2024/1/26 6:00:25

基于卡尔曼滤波的平面轨迹优化

文章目录概要卡尔曼滤波代码主函数代码CMakeLists.txt概要在进行目标跟踪时，算法实时测量得到的目标平面位置，是具有误差的，连续观测，所形成的轨迹如下图所示，需要对其进行噪声滤除。这篇博客将使用卡尔曼滤波，对轨迹进行优化。优化的结果为黄色线。卡尔曼滤波代码…...

编程日记 2024/1/26 5:59:23

GBASE南大通用分享如何更新嵌套的集合

如果您想要更新集合的集合，则必须声明游标来访问外层的集合，然后声明嵌套的游标来访问内层的集合。例如，假设 manager 表有一附加的列 scores，它包含一其元素类型为整数的 MULTISET 的 LIST，如下图所示。更新集合…...

编程日记 2024/1/26 5:56:19

Maya------插入循环边

11.maya 常用建模命令1.插入循环边多切割_哔哩哔哩_bilibili 与边相对距离逐渐变化...

编程日记 2024/1/26 5:54:17

Nginx_入门

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加 Nginx_入门提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、Nginx概述二、Nginx的应用…...

编程日记 2024/1/26 5:50:13

坚持刷题｜平衡二叉树

文章目录题目考察点代码实现实现总结对实现进一步改进扩展提问坚持刷题，老年痴呆追不上我，今天继续二叉树：平衡二叉树题目 110.平衡二叉树考察点递归能力： 能否使用递归来解决问题。树的基本操作：能否正确地访…...

编程日记 2024/1/26 5:49:12

江大白 | 万字长文图解Numpy教程，看这一篇就够了！

本文来源公众号“江大白”，仅用于学术分享，侵权删，干货满满，有超级详细的图解。原文链接：万字长文图解Numpy教程，看这一篇就够了！ (qq.com) 以下文章来源于博客：Medium 作者&…...

编程日记 2024/1/26 5:47:10

数据结构——静态链表

1.定义： （1）单链表：各个结点散落在内存中的各个角落，每个结点有指向下一个节点的指针(下一个结点在内存中的地址); （2）静态链表：用数组的方式来描述线性表的链式存储结构: 分配一…...

编程日记 2024/1/26 5:45:07

C++ 知识列表【图】

举例C的设计模式和智能指针当谈到 C 的设计模式时，以下是一些常见的设计模式： 工厂模式（Factory Pattern）：用于创建对象的模式，隐藏了对象的具体实现细节，只暴露一个公共接口来创建对象。单例…...

编程日记 2024/1/26 5:44:06

系统登录的时候的密码如何做到以加密的形式进行登录【java.security包下的api】工具类。

/** description: 将普通的publicKey转化得到一个RSAPublicKey* author: zkw* date: 2024/1/24 16:17* param: publicKey 普通的publicKey* return: RSAPublicKey 得到一个新的RSAPublicKey**/public static RSAPublicKey getPublicKey(String publicKey) throws NoSuchAlgorit…...

编程日记 2024/1/26 5:39:00

java基础学习: 什么是泛型的类型擦除

文章目录一、什么是泛型2、泛型编译前和编译后对比3、泛型的优点（1）提高了代码的复用性和可读性（2）提高了代码的安全性二、泛型的定义1、泛型类2、泛型接口3、泛型方法三、泛型通配符1、？和T有什么区别2、通配符的分…...

编程日记 2024/1/26 5:34:56

Vue+OpenLayers7入门到实战：在地图上添加缩放控件、比例尺控件和鼠标经纬度位置显示控件

返回《Vue+OpenLayers7》专栏目录：Vue+OpenLayers7 前言本章主要介绍如何使用OpenLayers7在地图上添加地图缩放控件，比例尺显示控件和鼠标经纬度位置展示控件这三个Control控件。二、依赖和使用 "ol": "7.5.2"使用npm安装依赖npm install ol@7.5.…...

编程日记 2024/1/26 5:33:55

基于本地LLM与多智能体架构的DD游戏引擎实现与优化

1. 项目概述：一个本地化、多智能体驱动的龙与地下城游戏引擎最近在折腾一个挺有意思的项目，叫 TD-LLM-DND。简单来说，这是一个让你能在自己电脑上，用本地运行的大语言模型（LLM）来跑一场“龙与地下城”&…...

编程新知 2026/5/13 3:41:02

AGHub：统一管理AI编码助手配置与技能，打造高效开发工作流

1. 项目概述：为什么我们需要一个AI编码代理的“集线器”？ 最近一年，我几乎把所有主流的AI编码助手都试了个遍：Cursor、Windsurf、Claude Code、Gemini CLI，还有各种基于OpenCode的本地模型。它们各有千秋，…...

编程新知 2026/5/13 3:15:45

从经典工程恶作剧看理论派与实践派的思维碰撞与团队协作

1. 项目概述：一场经典的工程恶作剧及其启示在任何一个技术团队里，总有一些故事会口口相传，成为团队文化的一部分。我今天想分享的这个故事，发生在上世纪80年代初，一个微电路设计小组里。它无关乎高深的技术突破&#x…...

编程新知 2026/5/13 3:07:41

SQLite Having 子句详解

SQLite Having 子句详解 SQLite 是一款轻量级的数据库管理系统，广泛应用于移动应用、桌面应用以及各种嵌入式系统。在 SQLite 中，HAVING 子句是一个非常重要的特性，它用于对 GROUP BY 子句的查询结果进行过滤。本文将详细介绍 SQLite 的 HAVING 子句，包括其用法、语法以及…...

编程新知 2026/5/13 1:07:11

图解人工智能（10）人工智能的发展历程

人工智能自20世纪50年代发展至今，经历了若干次高潮和低谷。每到陷入困境的时候，总有一些科学家勇敢地打破传统思想的束缚，创造出新理论、新方法，使人工智能重现生机。例如，在符号主义陷入危机的时候，费根鲍…...

编程新知 2026/5/13 0:18:13

3步免费获取公式识别神器：img2latex-mathpix本地部署终极指南

3步免费获取公式识别神器：img2latex-mathpix本地部署终极指南【免费下载链接】img2latex-mathpix Mathpix has changed their billing policy and no longer has free monthly API requests. This repo is now archived and will not receive any updates for the …...

编程新知 2026/5/13 0:16:13

在株洲如何根据个人需求选择合适的床垫？

如何根据个人需求选择合适的床垫？在快节奏的现代生活中，一张舒适的床垫对于保证良好的睡眠质量至关重要。然而，面对市场上琳琅满目的床垫产品，如何根据个人需求选择一款合适的床垫呢？本文将从多个维度出发，…...

编程新知 2026/5/13 0:14:12

别再乱打包了！手把手教你用Kali Linux和Metasploit生成免杀后门（附实战演示）

Kali Linux高级免杀技术实战：从原理到绕过Windows Defender 在渗透测试和红队演练中，后门程序的免杀能力直接决定了行动的成败。许多初学者在使用Metasploit生成基础payload后，常常发现它们被主流杀毒软件轻易拦截。本文将深入探讨免杀技术的…...

编程新知 2026/5/12 22:02:44

为AI智能体构建可编程邮箱：mailbot实战指南

1. 项目概述：为AI智能体打造专属的“可编程邮箱”如果你正在开发一个AI智能体，无论是客服机器人、自动化工作流还是个人助理，让它具备收发邮件的能力往往是刚需。传统的做法是什么？要么去折腾Gmail的API，忍受OAuth授权…...

编程新知 2026/5/12 21:22:08

Windows运行Android应用终极指南：APK Installer让你的电脑秒变安卓手机

Windows运行Android应用终极指南：APK Installer让你的电脑秒变安卓手机【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 在移动应用生态日益丰富的今天&…...

编程新知 2026/5/12 21:09:51