当前位置：首页 > news >正文

【Pytorch：nn.Embedding】简介以及使用方法：用于生成固定数量的具有指定维度的嵌入向量embedding vector

news 2026/2/9 6:21:46

文章目录

1、nn.Embedding
2、使用场景

1、nn.Embedding

首先我们讲解一下关于嵌入向量embedding vector的概念

1）在自然语言处理NLP领域，是将单词、短语或其他文本单位映射到一个固定长度的实数向量空间中。嵌入向量具有较低的维度，通常在几十到几百维之间，且每个维度都包含一定程度上的语义信息。这意味着在嵌入向量空间中，语义上相似的单词在向量空间中也更加接近。
2）在计算机视觉领域，是将图像或图像中的区域映射到一个固定长度的实数向量空间中。嵌入向量在计算机视觉任务中起到了表示和提取特征的作用。通过将图像映射到嵌入向量空间，可以捕捉到图像的语义信息、视觉特征以及图像之间的相似性。

总之，嵌入向量是具有固定维度的，而不论是在NLP领域还是CV领域，都需要生成多个嵌入向量，因此也有固定数量。
于是，我们就可以简单理解该类为：

CLASS torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None,
norm_type=2.0, scale_grad_by_freq=False, sparse=False, _weight=None, _freeze=False, device=None, dtype=None)
''
一个简单的查找表，用于存储固定词典和尺寸的embeddings：其实就是存储了固定数量的具有固定维度的嵌入向量
该模块需要使用索引检索嵌入向量：也就是说模块的输入是索引列表，输出是相应存储的嵌入向量。
1) num_embeddings: 嵌入向量的数量
2) embedding_dim: 嵌入向量的维度
注意：
1）它的成员变量weight：具有shape为 (num_embeddings, embedding_dim) 的可学习的参数
2）输入为：任意形状[*]的IntTensor或LongTensor，内部元素为索引值，即0到num_embeddings-1之间的值输出为：[*, H]的嵌入向量，H为embedding_dim
''

例如：

from torch import nn
import torch# an Embedding module containing 10 tensors of size 3
embedding = nn.Embedding(10, 3)
# a batch of 2 samples of 4 indices each
input = torch.LongTensor([[1, 2, 4, 5], [4, 3, 2, 9]])
print(embedding(input))
print(embedding.weight)
''
输出为：
tensor([[[ 0.4125,  0.1478,  0.3764],[ 0.5272, -0.4960,  1.5926],[ 0.2231, -0.7653, -0.5333],[ 2.8278,  1.5299,  1.4080]],[[ 0.2231, -0.7653, -0.5333],[-0.3996,  0.3626, -0.3369],[ 0.5272, -0.4960,  1.5926],[ 0.6222,  1.3385,  0.6861]]], grad_fn=<EmbeddingBackward>)
Parameter containing:
tensor([[-0.1316, -0.2370, -0.8308],[ 0.4125,  0.1478,  0.3764],[ 0.5272, -0.4960,  1.5926],[-0.3996,  0.3626, -0.3369],[ 0.2231, -0.7653, -0.5333],[ 2.8278,  1.5299,  1.4080],[-0.4182,  0.4665,  1.5345],[-1.2107,  0.3569,  0.9719],[-0.6439, -0.4095,  0.6130],[ 0.6222,  1.3385,  0.6861]], requires_grad=True)
''

2、使用场景

transformer decoder输入的嵌入向量Output Embedding
DETR中的decoder的object queries

【Pytorch：nn.Embedding】简介以及使用方法：用于生成固定数量的具有指定维度的嵌入向量embedding vector

文章目录 1、nn.Embedding2、使用场景 1、nn.Embedding 首先我们讲解一下关于嵌入向量embedding vector的概念 1）在自然语言处理NLP领域，是将单词、短语或其他文本单位映射到一个固定长度的实数向量空间中。嵌入向量具有较低的维度，通常在几…...

编程日记 2023/8/15 23:17:53

动态库的命名规则

1、动态库的命名规则：libname.so.x.y.z 名字含义lib这是共享库的前缀name共享库名字x主版本号y次版本号z发布版本号 2、每个版本号的含义版本号含义主版本号表示库的重大升级，不同主版本号的库之间是不兼容的。依赖旧的主版本号的程序需要改动相应的…...

编程日记 2023/8/15 23:16:52

【Linux】网络----＞网络理论

网络理论网络协议分层模型网络数据的封装于分用地址管理网络协议分层模型 OSI五层模型：应用层，传输层，网络层，数据链路层，物理层应用层：主要负责应用程序间的沟通，代表协议有HTML协议&#x…...

编程日记 2023/8/15 23:15:51

Android学习之路(4) UI控件之输入框

本节引言： 在本节中，我们来学习第二个很常用的控件EditText(输入框)； 和TextView非常类似，最大的区别是：EditText可以接受用户输入！ 1.设置默认提示文本如下图，相信你对于这种用户登录的界面并…...

编程日记 2023/8/15 23:14:48

1.初识Web

文章目录 1. 什么是Web?2.初始Web前端2.1.Web标准 1. 什么是Web? web:全球广域网，也称万维网(www World Wide Web)，能够通过浏览器访问的网站。 2.初始Web前端网页有哪些部分组成？ 文字、图片、音频、视频、超链接… 我们看到的网页&am…...

编程日记 2023/8/15 23:13:47

【微服务技术一】Eureka、Nacos、Ribbon（配置管理、注册中心、负载均衡）

微服务技术一技术栈图一、注册中心Eureka概念：搭建EurekaServer服务注册服务发现（消费者对提供者的远程调用） 二、Ribbon负载均衡负载均衡的原理：LoadBalanced负载均衡的策略：IRule懒加载三、Nacos注册中心Nacos的安…...

编程日记 2023/8/15 23:12:46

【Linux】可重入函数 volatile关键字以及SIGCHLD信号

可重入函数 volatile关键字以及SIGCHLD信号一、可重入函数1、引入2、可重入函数的判断二、volatile关键字1、引入2、关于编译器的优化的简单讨论三、SIGCHLD信号一、可重入函数 1、引入我们来先看一个例子来帮助我们理解什么是可重入函数： 假设我们现在要对…...

编程日记 2023/8/15 23:11:45

【动态规划】回文串问题

文章目录动态规划（回文串问题）1. 回文子串2. 最长回文子串3. 回文串分割 IV4. 分割回文串 ||5. 最长回文子序列6. 让字符串成为回文串的最小插入次数动态规划（回文串问题） 1. 回文子串题目链接状态表示 f[i][j]表示 i 到 j …...

编程日记 2023/8/15 23:10:43

Laravel Swift Mail发送带附件的邮件报错 “Swift_IoException The path cannot be empty“处理

先说下情况，就是我要做一个发送附件的邮件发送功能，结果，报错：The path cannot be empty。给我整的有点迷糊，网上也没有类似的问题。后来，我检查了一下代码，发现有个地方，是需要给附…...

编程日记 2023/8/15 23:09:42

Linux下常见的代理服务器软件介绍

在Linux系统中，代理服务器是我们搭建网络环境和处理网络请求的常用工具。但是，你知道Linux下常见的代理服务器软件有哪些吗？本文将为你带来对几款常见的Linux代理服务器软件的介绍，帮助你选择适合的代理服务器。一、Squid&#…...

编程日记 2023/8/15 23:08:41

SCSS的基本用法

1、声明变量 $ 声明变量的符号 $ 下面这张图左半部分是scss的语法，右半部分是编译后的css。（整篇文章皆是如此） 2、默认变量 !default sass 的默认变量仅需要在值后面加上 !default 即可。如果分配给变量的值后面添加了 !default 标志…...

编程日记 2023/8/15 23:07:39

alertmanager创建nginx-ingress basic auth鉴权

步骤生成密码 printf "admin:$(openssl passwd -crypt xxxxxx)\n" >> auth 创建新的 Kubernetes 密钥 kubectl create secret generic basic-auth --from-file auth -n victoria-metrics 修改 ingress 以使用 secret 中的凭证来实现基本身份验证编辑 P…...

编程日记 2023/8/15 23:06:36

系列六、Redis中的五大数据类型及相关操作

一、五大数据类型 String类型、List类型、Set类型、ZSet类型、hash类型。二、String类型 2.1、内存储存模型 2.2、常用操作命令三、List类型 3.1、概述 list列表，相当于Java中的list集合。特点：元素有序且可以重复。 3.2、内存存储模型 3.3、常用…...

编程日记 2023/8/15 23:05:34

四大运营商的大流量卡测评，看完您会选哪个运营商？

很多朋友都说网上的流量卡资费是真的便宜，但是小编认为资费便宜归便宜，但是运营商的小心思也有不少。今天小编就带大家看一看三大运营商推出的正规流量卡都有哪些小心思？ 首先，移动推出的线上大流量卡数量是最少的&#xff…...

编程日记 2023/8/15 23:04:32

Apache-Maven

安装Maven 解压apache-maven到目录下 Maven目录如下 bin：目录中存放的是可执行文件，JAVA项目中的编译执行打包都要使用bin. conf:存放的是Maven的配置文件，本地配置、私服配置都需要在conf下的settings.xml进行配置。 lib下存放的是Maven所…...

编程日记 2023/8/15 23:03:31

什么是原子交换?

安全地在各个区块链网络之间传输资产对于释放被困流动性并吸引更多用户进入这一领域至关重要，同时也保持 Web3 的信任最小化核心价值。原子交换是一种让两个人在不依赖于中介来促成交易的情况下，在不同的区块链网络之间交换通证资产的方式。这为 DeFi 用…...

编程日记 2023/8/15 23:02:30

java springboot word文档转pdf

java springboot word文档转pdf 1、环境2、依赖3、代码 1、环境 1、java、springboot 2、maven或者gradle 3、办公软件（自己电脑上的wps或者office等，如果部署到服务器上也要安装，linux、Mac 都有，自己安装） 可能会遇…...

编程日记 2023/8/15 23:01:29

【Leetcode Sheet】Weekly Practice 2

Leetcode Test 1281 整数的各位积和之差(8.9) 给你一个整数 n，请你帮忙计算并返回该整数「各位数字之积」与「各位数字之和」的差。提示： 1 < n < 10^5 【原始代码】： int subtractProductAndSum(int n){//1 < n < 10^5//…...

编程日记 2023/8/15 23:00:28

【BERTopic应用 03/3】：微调参数

一、说明一般来说，BERTopic 在开箱即用的模型中工作得很好。但是，当您有数百万个数据要处理时，使用基本模型处理数据可能需要一些时间。在这篇文章中，我将向您展示如何微调BERTopic中的一些参数并比较它们的结果。让我们潜入。二…...

编程日记 2023/8/15 22:59:27

2023年上半年数学建模竞赛题目汇总与难度分析

2023年上半年数学建模竞赛题目汇总与难度分析由于近年来国赛ABC题出题方式漂浮不定，没有太大的定性，目前总体的命题方向为，由之前的单一模型问题变为数据分析评价优化或者预测类题目是B、C题的主要命题方向。为了更好地把握今年命题的主方…...

编程日记 2023/8/15 22:58:26

Java 语言特性(面试系列2)

一、SQL 基础 1. 复杂查询 （1）连接查询（JOIN） 内连接（INNER JOIN）：返回两表匹配的记录。 SELECT e.name, d.dept_name FROM employees e INNER JOIN departments d ON e.dept_id d.dept_id; 左…...

编程新知 2025/10/24 14:20:29

2021-03-15 iview一些问题

1.iview 在使用tree组件时，发现没有set类的方法，只有get，那么要改变tree值，只能遍历treeData，递归修改treeData的checked，发现无法更改，原因在于check模式下，子元素的勾选状态跟父节…...

编程新知 2026/2/5 3:29:13

华为OD机试-食堂供餐-二分法

import java.util.Arrays; import java.util.Scanner;public class DemoTest3 {public static void main(String[] args) {Scanner in new Scanner(System.in);// 注意 hasNext 和 hasNextLine 的区别while (in.hasNextLine()) { // 注意 while 处理多个 caseint a in.nextIn…...

编程新知 2026/1/28 11:11:03

反射获取方法和属性

Java反射获取方法在Java中，反射（Reflection）是一种强大的机制，允许程序在运行时访问和操作类的内部属性和方法。通过反射，可以动态地创建对象、调用方法、改变属性值，这在很多Java框架中如Spring和Hiberna…...

编程新知 2025/11/9 2:57:17

Linux-07 ubuntu 的 chrome 启动不了

文章目录问题原因解决步骤一、卸载旧版chrome二、重新安装chorme三、启动不了，报错如下四、启动不了，解决如下总结问题原因在应用中可以看到chrome，但是打不开(说明：原来的ubuntu系统出问题了，这个是备用的硬盘&a…...

编程新知 2026/1/29 17:56:19

深入解析C++中的extern关键字：跨文件共享变量与函数的终极指南

🚀 C extern 关键字深度解析：跨文件编程的终极指南 📅 更新时间：2025年6月5日 🏷️ 标签：C | extern关键字 | 多文件编程 | 链接与声明 | 现代C 文章目录前言🔥一、extern 是什么？&…...

编程新知 2026/2/1 6:50:07

如何理解 IP 数据报中的 TTL？

目录前言理解前言面试灵魂一问：说说对 IP 数据报中 TTL 的理解？我们都知道，IP 数据报由首部和数据两部分组成，首部又分为两部分：固定部分和可变部分，共占 20 字节，而即将讨论的 TTL 就位于首…...

编程新知 2026/2/4 18:09:49

Go 语言并发编程基础：无缓冲与有缓冲通道

在上一章节中，我们了解了 Channel 的基本用法。本章将重点分析 Go 中通道的两种类型 —— 无缓冲通道与有缓冲通道，它们在并发编程中各具特点和应用场景。一、通道的基本分类类型定义形式特点无缓冲通道make(chan T)发送和接收都必须准备好&#xff0…...

编程新知 2026/1/29 3:25:02

使用LangGraph和LangSmith构建多智能体人工智能系统

现在，通过组合几个较小的子智能体来创建一个强大的人工智能智能体正成为一种趋势。但这也带来了一些挑战，比如减少幻觉、管理对话流程、在测试期间留意智能体的工作方式、允许人工介入以及评估其性能。你需要进行大量的反复试验。在这篇博客〔原作者&a…...

编程新知 2026/1/26 13:48:59

代码规范和架构【立芯理论一】（2025.06.08）

1、代码规范的目标代码简洁精炼、美观，可持续性好高效率高复用，可移植性好高内聚，低耦合没有冗余规范性，代码有规可循，可以看出自己当时的思考过程特殊排版，特殊语法，特殊指令，必须…...

编程新知 2026/1/28 11:47:09

文章目录

1、nn.Embedding

2、使用场景

相关文章：