当前位置：首页 > news >正文

Stanford CS224N - word2vec

news 2026/2/11 3:04:03

最近在听Stanford放出来的Stanford CS224N NLP with Deep Learning这门课，弥补一下之前nlp这块基础知识的一些不清楚的地方，顺便巩固一下基础知识😁

关于word2vec：

1.为什么要把单词表示成向量

一开始人们造了一个类似于词典表的东西-wordnet：
在这里插入图片描述
但是这里面存在一些问题，大概有这么几个：

例如，“proficient”被列为“good”的同义词，但这只在某些情境下是正确的。
WordNet在某些同义词组中列出了冒犯性的同义词，而没有涵盖单词的内涵或适用性。
WordNet缺少对单词新含义的收录，例如"wicked"、“badass”、“nifty”、“wizard”、“genius”、“ninja”、"bombest"等。
难以保持最新
存在主观性的问题
需要耗费大量人力来创建和调整
不能用于准确计算单词相似度

再后来就有了one-hot编码：

但是嘞，用了一段时间以后人们发现这里还是存在一些问题，这里教授举了这样一个例子：

在网络搜索中的例子中，如果用户搜索“西雅图汽车旅馆”，我们希望匹配包含“西雅图酒店”的文档。
但是：汽车旅馆 = [0 0 0 0 0 0 0 0 0 0 1 0 0 0 0]
酒店 = [0 0 0 0 0 0 0 1 0 0 0 0 0 0 0] 这两个向量是正交的。
对于独热向量来说，没有自然的相似度概念

提出的解决方案：学习将相似度编码在向量中。
更具体的说，从 context words 中去学习某个单词的意思，这也是word2vec思想的重要部分
所以归纳起来，把单词表示成我们想要的这种向量的好处可以概括为以下三个方面：

数值表示：计算机只能处理数值数据，而文本是一种非结构化的数据形式。把单词转化为向量，可以将文本转化为数值表示，使得计算机可以对其进行处理和分析。这样，我们可以利用数值计算的优势，如向量运算、相似度计算等。
特征表示：将单词转化为向量可以捕捉到单词之间的语义和语法关系。向量空间中的距离和角度可以表示单词之间的相似性和关联性。这样的向量表示可以作为特征输入到各种NLP任务中。通过将单词转化为向量，我们可以将文本转化为可计算的特征，从而进行更高级的文本分析和处理。如图，将单词转化为高维向量以后语义相近的单词挨得比较近。
维度降低：传统的文本表示方法，如独热编码，会将每个单词表示为一个高维稀疏向量，其中大部分元素为0。这种表示方法会导致高维度的特征空间，浪费存储空间和计算资源。通过将单词转化为低维稠密向量，可以实现维度的降低，减少存储和计算的开销，同时保留了单词之间的语义信息。

2.何为word2vec

课上给的定义：Word2vec (Mikolov et al. 2013) is a framework for learning word vectors

按照我的理解，Word2Vec是一种用于将单词表示为连续向量的算法，他的目标是通过学习单词之间的语义和语法关系，将单词嵌入到一个连续的向量空间中
在这里插入图片描述

3.具体实现步骤

构建训练样本：
Word2Vec模型的训练样本由目标单词和其上下文单词组成。在Skip-gram模型中，每个目标单词会与其周围的上下文单词配对；在CBOW模型中，每个上下文单词会与其对应的目标单词配对。这样可以为每个配对样本创建一对输入和输出。上课给出的例子是从头到尾滑动计算第 $t + j$ 个词和第 $t$ 个词(中心词)同时出现的概率,图示里把 $in t o$ 当作中心词， $t = 2$ ,然后计算其他context word和中心词一起出现的概率
训练模型：
使用构建的训练样本和神经网络架构，开始训练Word2Vec模型。训练过程中，模型的目标是通过最大化或最小化特定的目标函数来优化模型的参数。课堂上举的例子是负对数似然函数。通过迭代优化过程，模型逐渐学习到单词的向量表示，以捕捉单词之间的语义和语法关系。

表示出目标函数：
在这里插入图片描述
然后训练

学习到的向量表示：
一旦模型训练完成，每个单词都会被表示为一个固定长度的向量。这些向量在向量空间中的距离和角度反映了单词之间的相似性和关联性。这些向量可以用于各种NLP任务，如计算单词相似度、文本分类、命名实体识别等。

Stanford CS224N - word2vec

最近在听Stanford放出来的Stanford CS224N NLP with Deep Learning这门课，弥补一下之前nlp这块基础知识的一些不清楚的地方，顺便巩固一下基础知识😁 关于word2vec： 1.为什么要把单词表示成向量一开始人们造了一个类似于词典表…...

编程日记 2023/10/20 3:27:33

华为云云耀云服务器L实例评测｜windows系统3389防爆破之安全加固教程

为什么要选择华为云云耀云服务器L实例： 华为云在全国范围内建立了多个数据中心，这些数据中心之间相互冗余，以确保高可靠性和可用性，用户可以选择最适合的区域来部署应用程序，以实现更好的性能和延迟。相对于传统的物…...

编程日记 2023/10/20 3:25:32

零基础如何自学C#?

前言本文来源于知乎的一个提问，提问的是一个大一软件工程专业的学生，他想要自学C#但是不知道该怎么去学，这让他感到很迷茫，希望有人能给他一些建议和提供一些学习方向。个人建议确认目标：自学C#首先你需要大概了解…...

编程日记 2023/10/20 3:24:30

Spring5学习笔记之整合MyBatis

✅作者简介：大家好，我是Leo，热爱Java后端开发者，一个想要与大家共同进步的男人😉😉 🍎个人主页：Leo的博客 💞当前专栏： Spring专栏 ✨特色专栏： M…...

编程日记 2023/10/20 3:22:28

GO 语言的方法？？

GO 中的方法是什么？ 前面我们有分享到 GO 语言的函数，他是一等公民，那么 GO 语言中的方法和函数有什么区别呢？ GO 语言中的方法实际上和函数是类似的，只不过在函数的基础上多了一个参数，这个参数在 GO 语…...

编程日记 2023/10/20 3:21:27

【JavaEE】多线程-初阶

多线程-初阶 1. 认识线程 1.1 概念 1) 线程是什么多个线程组成了一个进程，线程好比是一跟光纤中的一个玻璃丝，进程是整根光纤。一个进程中的线程共享这个进程中的资源（内存、硬盘） 2) 为什么需要线程单核CPU发展出现瓶颈…...

编程日记 2023/10/20 3:19:24

小程序OCR身份证识别

使用两种OCR识别：小程序和腾讯云 1.基于微信小程序OCR插件实现身份证拍照、上传并OCR识别的示例： 首先，在小程序中添加身份证拍照的功能，可以使用wx.chooseImage()选择照片并使用wx.uploadFile()上传，代码如下&#…...

编程日记 2023/10/20 3:18:22

【算法学习】归并算法Merge Sort总结

归并排序思路简单，速度仅次于快速排序，为稳定排序算法，一般用于对总体无序，但是各子项相对有序的数列。 1. 基本思想归并排序使用分治思想，分治模式下每一层递归有三个步骤： 分解（divide)&a…...

编程日记 2023/10/20 3:15:16

Swager如何使用

Swager是一个API文档自动生成工具，可以用于生成API接口文档，供开发者和用户查看和使用。它可以通过描述API接口的规范，自动生成API文档，使得API接口的发布和使用变得更加简单和规范。下面是使用Swagger的步骤： 首先…...

编程日记 2023/10/20 3:14:15

DHorse v1.4.2 发布，基于 k8s 的发布平台

版本说明优化特性在集群列表增加集群版本；修改Jvm的GC指标名； 解决问题解决shell脚本换行符的问题；解决部署历史列表页，环境名展示错误的问题；解决指标收集功能的异常； 升级指南升级指南 DHorse…...

编程日记 2023/10/20 3:13:13

Java使用JJWT令牌

最近在B站大学学习Java开发，刚好学到登入验证，在使用JJWT令牌时踩了一些坑，在这里把代码和依赖给出，希望后来者得以借鉴。依赖 <dependency><groupId>io.jsonwebtoken</groupId><artifactId>jjwt-api&l…...

编程日记 2023/10/20 3:12:12

“第四十四天”

这道题也不是难，但可能会忽略一种情况，当最大小出现在首位的时候，那个时候如果进行交换的话，大小值可能出现覆盖的情况，最终导致丢失最大值或者最小值，比如最大值 10 在第一位，最小值 0 随意&am…...

编程日记 2023/10/20 3:11:11

static void TestFloat(){{//float speed2.0f/20;float speed 0.1f;float distance 2.0f;long needTime (long)(distance / speed);Log.Debug($"needTime{needTime}"); #if UNITY_EDITORif (needTime ! 19) #elseif (needTime ! 20)//.Net服务器和安卓手机 #endif…...

编程日记 2023/10/20 3:10:10

【SA8295P 源码分析 (二)】64 - QNX 与 Android GVM 显示 Dump 图片方法汇总

【SA8295P 源码分析】64 - QNX 与 Android GVM 显示 Dump 图片方法汇总一、QNX侧1.1 surfacedump 功能1.2 screenshot 功能二、Android GVM 侧2.1 screencap -p 导出 PNG 图片2.2 screencap 不加 -p 参数，导出 RGB32 图片2.3 dumpsys SurfaceFlinger --display-id 方法系列文…...

编程日记 2023/10/20 3:09:08

shell命令以及运行原理和lLinux权限

shell命令以及运行原理什么是shell shell是操作系统的外壳程序统称，我们是通过shell去和操作系统沟通的。从技术角度，shell最简单的定义就是命令行解释器，主要包含两个功能： 将使用者的命令翻译给核心处理将核心的处理结果…...

编程日记 2023/10/20 3:08:07

斯坦福JSKarel编程机器人使用介绍

斯坦福JSKarel编程机器人使用介绍为了避免被编程语言固有的复杂性所困扰，有一个被称为卡雷尔（Karel）机器人的微型世界（microworld）的简化环境，可以让编程初学者从中学习理解编程的基本概念，而…...

编程日记 2023/10/20 3:06:05

SpringBoot中pom.xml不引入依赖, 怎么使用parent父项目的依赖

在Spring Boot项目中，如果你想使用父项目的依赖，而不想在pom.xml中显式引入依赖，你可以使用Maven的继承机制。首先，确保你的Spring Boot项目是一个子项目，即它继承自一个父项目。要实现这一点，在pom.xml文…...

编程日记 2023/10/20 3:05:04

基于vue3+ts5+vue-router4+pinia2的PC端项目搭建教程

导语：在日常开发中，有时候会在项目中引入 ts 来解决一些 js 的问题，下面就简单介绍一下如何使用 vue3tsrouterpinia 来搭建一个项目。目录简介创建安装配置实战简介 vue3 目前是常用的 vue 版本，提供了组合式 API 以及一些新…...

编程日记 2023/10/20 3:04:03

6个无版权、免费、高清图片素材库

找免费无版权图片素材，就上这6个网站，超高质量，可商用，赶紧收藏！ 1、菜鸟图库 https://www.sucai999.com/pic.html?vNTYwNDUx 网站主要为新手设计师提供免费素材，这些素材的质量都很高，类别也…...

编程日记 2023/10/20 3:03:02

什么是响应式设计？响应式设计的基本原理是什么？如何兼容低版本的 IE？

什么是响应式设计: 响应式设计（Responsive Design）是一种Web设计和开发方法，旨在使网站在不同设备和屏幕尺寸上都能提供一致的用户体验。响应式设计的目标是适应多种终端，包括桌面计算机、笔记本电脑、平板电脑和移动设备&#x…...

编程日记 2023/10/20 3:02:01

全球首个30米分辨率湿地数据集(2000—2022)

数据简介今天我们分享的数据是全球30米分辨率湿地数据集，包含8种湿地亚类，该数据以0.5X0.5的瓦片存储，我们整理了所有属于中国的瓦片名称与其对应省份，方便大家研究使用。该数据集作为全球首个30米分辨率、覆盖2000–2022年时间…...

编程新知 2026/1/31 17:15:25

苍穹外卖--缓存菜品

1.问题说明用户端小程序展示的菜品数据都是通过查询数据库获得，如果用户端访问量比较大，数据库访问压力随之增大 2.实现思路通过Redis来缓存菜品数据，减少数据库查询操作。缓存逻辑分析： ①每个分类下的菜品保持一份缓存数据…...

编程新知 2026/2/7 15:39:49

Spring Boot+Neo4j知识图谱实战：3步搭建智能关系网络！

一、引言在数据驱动的背景下，知识图谱凭借其高效的信息组织能力，正逐步成为各行业应用的关键技术。本文聚焦 Spring Boot与Neo4j图数据库的技术结合，探讨知识图谱开发的实现细节，帮助读者掌握该技术栈在实际项目中的落地方法。 …...

编程新知 2025/9/17 21:39:04

uniapp中使用aixos 报错

问题： 在uniapp中使用aixos，运行后报如下错误： AxiosError: There is no suitable adapter to dispatch the request since : - adapter xhr is not supported by the environment - adapter http is not available in the build 解决方案&…...

编程新知 2025/11/29 21:26:48

多种风格导航菜单 HTML 实现（附源码）

下面我将为您展示 6 种不同风格的导航菜单实现，每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...

编程新知 2026/2/2 2:49:11