当前位置：首页 > news >正文

pytorch基于 Transformer 预训练模型的方法实现词嵌入（tiansz/bert-base-chinese）

news 2026/5/15 3:56:58

以下是一个完整的词嵌入（Word Embedding）示例代码，使用 modelscope 下载 tiansz/bert-base-chinese 模型，并通过 transformers 加载模型，获取中文句子的词嵌入。

from modelscope.hub.snapshot_download import snapshot_download
from transformers import BertTokenizer, BertModel
import torch# 下载模型到本地目录
model_dir = snapshot_download('tiansz/bert-base-chinese', cache_dir='./bert-base-chinese')
print(f"模型已下载到: {model_dir}")# 本地模型路径
model_path = model_dir  # 使用下载的模型路径# 从本地加载分词器和模型
tokenizer = BertTokenizer.from_pretrained(model_path)
model = BertModel.from_pretrained(model_path)# 将模型设置为评估模式
model.eval()# 输入句子
sentence = "你好，今天天气怎么样？"# 分词并转换为模型输入格式
inputs = tokenizer(sentence, return_tensors='pt')# 获取词嵌入
with torch.no_grad():outputs = model(**inputs)# 输出的最后一层隐藏状态（即词嵌入）
last_hidden_states = outputs.last_hidden_state# 打印词嵌入的形状
print("Embeddings shape:", last_hidden_states.shape)  # [batch_size, sequence_length, hidden_size]# 获取所有 token 的文本表示
tokens = tokenizer.convert_ids_to_tokens(inputs['input_ids'][0])# 打印每个 token 及其对应的嵌入
for i, (token, embedding) in enumerate(zip(tokens, last_hidden_states[0])):print(f"Token {i}: {token}")print(f"Embedding: {embedding[:10]}...")  # 只打印前 10 维

下载模型：
使用 modelscope 的 snapshot_download 方法下载 tiansz/bert-base-chinese 模型到本地目录 ./bert-base-chinese。
加载模型：
使用 transformers 的 BertTokenizer 和 BertModel 从本地路径加载模型和分词器。
输入句子：
定义一个中文句子 "你好，今天天气怎么样？"。
分词和编码：
使用分词器将句子转换为模型输入格式（包括 input_ids 和 attention_mask）。
获取词嵌入：
将输入传递给模型，获取最后一层隐藏状态（即词嵌入）。
输出结果：
打印每个 token 及其对应的嵌入向量（只打印前 10 维）。

Downloading Model to directory: ./bert-base-chinese/tiansz/bert-base-chinese
模型已下载到: ./bert-base-chinese/tiansz/bert-base-chinese
Embeddings shape: torch.Size([1, 13, 768])
Token 0: [CLS]
Embedding: tensor([ 1.0592,  0.1071,  0.4324,  0.0860,  0.9301, -0.6972,  0.7214, -0.0408,-0.1321, -0.1840])...
Token 1: 你
Embedding: tensor([ 0.2686,  0.1246,  0.4344,  0.5293,  0.7844, -0.7398,  0.4845, -0.3669,-0.6001,  0.8876])...
Token 2: 好
Embedding: tensor([ 0.9697,  0.3952,  0.6012, -0.0386,  0.6996, -0.4031,  1.0839,  0.0119,0.0551,  0.2817])...
Token 3: ，
Embedding: tensor([ 0.8255,  0.6987,  0.0310,  0.4167, -0.0159, -0.5835,  1.4922,  0.3883,0.9030, -0.1529])...
Token 4: 今
Embedding: tensor([ 0.1640,  0.2744,  0.6168,  0.0693,  1.0125, -0.4001, -0.2779,  0.6306,-0.1302, -0.0534])...
Token 5: 天
Embedding: tensor([ 0.5449, -0.1022,  0.0316, -0.4571,  0.6967,  0.0789,  0.6432,  0.0501,0.3832, -0.3269])...
Token 6: 天
Embedding: tensor([ 1.0107, -0.3673, -1.0272, -0.1893,  0.3766,  0.2341,  0.3552,  0.0228,-0.2411, -0.2227])...
Token 7: 气
Embedding: tensor([ 0.9320, -0.8562, -0.9696,  0.2202,  0.1046,  0.3335, -0.2725, -0.3014,-0.0057, -0.2503])...
Token 8: 怎
Embedding: tensor([ 0.7004, -0.3408,  0.1803, -0.0093, -0.0996,  0.9946,  0.0251,  0.0321,0.1867, -0.6998])...
Token 9: 么
Embedding: tensor([ 0.7296,  0.0704,  0.2153, -0.2680, -0.4890,  0.8920,  0.0324, -0.0820,0.5248, -0.6742])...
Token 10: 样
Embedding: tensor([ 0.2482,  0.0567,  0.2574,  0.1359,  0.4210,  0.9753,  0.2528, -0.2645,0.3426, -0.4405])...
Token 11: ？
Embedding: tensor([ 1.4162,  0.4149,  0.1098, -0.7175,  0.9875, -0.4366,  0.8482,  0.2046,0.2398, -0.1031])...
Token 12: [SEP]
Embedding: tensor([ 0.2140,  0.1362,  0.3720,  0.5722,  0.3005, -0.1858,  1.1392,  0.2413,-0.1240,  0.0177])...

pytorch基于 Transformer 预训练模型的方法实现词嵌入（tiansz/bert-base-chinese）

以下是一个完整的词嵌入（Word Embedding）示例代码，使用 modelscope 下载 tiansz/bert-base-chinese 模型，并通过 transformers 加载模型，获取中文句子的词嵌入。 from modelscope.hub.snapshot_download import snaps…...

编程日记 2025/2/5 3:32:24

Windows电脑本地部署运行DeepSeek R1大模型（基于Ollama和Chatbox）

文章目录一、环境准备二、安装Ollama2.1 访问Ollama官方网站2.2 下载适用于Windows的安装包2.3 安装Ollama安装包2.4 指定Ollama安装目录2.5 指定Ollama的大模型的存储目录三、选择DeepSeek R1模型四、下载并运行DeepSeek R1模型五、常见问题解答六、使用Chatbox进行交互6.1 …...

编程日记 2025/2/5 3:30:21

区间覆盖问题

文章目录 1. 题面2. 简单分析3. 代码解答4. TLE的2点可能 1. 题面给定 N N N个区间 [ a i , b i ] [a_i,b_i] [ai,bi] 以及一个区间 [ s , t ] [s,t] [s,t]，请你选择尽量少的区间，将指定区间完全覆盖。输出最少区间数，如果无法完全…...

编程日记 2025/2/5 3:29:18

【LLM-agent】(task2)用llama-index搭建AI Agent

note LlamaIndex 实现 Agent 需要导入 ReActAgent 和 Function Tool，循环执行：推理、行动、观察、优化推理、重复进行。可以在 arize_phoenix 中看到 agent 的具体提示词，工具被装换成了提示词ReActAgent 使得业务自动向代码转换成为可能&am…...

编程日记 2025/2/5 3:28:15

SpringAI 人工智能

随着 AI 技术的不断发展，越来越多的企业开始将 AI 模型集成到其业务系统中，从而提升系统的智能化水平、自动化程度和用户体验。在此背景下，Spring AI 作为一个企业级 AI 框架，提供了丰富的工具和机制，可以帮助开发者将…...

编程日记 2025/2/5 3:23:09

axios二次封装安装封装使用安装 pnpm add axios封装 // 进行axios二次封装：使用请求与响应拦截器 import axios from axios import { ElMessage } from element-plus//创建axios实例 const request axios.create({baseURL: import.meta.env.VITE_APP_BASE_API,…...

编程日记 2025/2/5 3:18:01

P7497 四方喝彩 Solution

Description 给定序列 a ( a 1 , a 2 , ⋯ , a n ) a(a_1,a_2,\cdots,a_n) a(a1,a2,⋯,an)，有 m m m 个操作，分四种： add ⁡ ( l , r , v ) \operatorname{add}(l,r,v) add(l,r,v)：对于所有 i ∈ [ l , r ] i \in [l,r…...

编程日记 2025/2/5 3:17:00

深入剖析 Bitmap 数据结构：原理、应用与优化策略

深入理解 Bitmap 数据结构一、引言在计算机科学领域，数据的高效存储和快速处理一直是核心问题。随着数据量的不断增长，如何用最少的空间和最快的速度来表示和操作数据变得至关重要。Bitmap（位图）作为一种简洁而强大的数据结构…...

编程日记 2025/2/5 3:08:51

bypass hcaptcha、hcaptcha逆向

可以过steam，已支持并发，欢迎询问！ 有事危，ProfessorLuoMing...

编程日记 2025/2/5 3:07:49

WebForms DataList 深入解析

WebForms DataList 深入解析引言在Web开发领域，控件是构建用户界面（UI）的核心组件。ASP.NET WebForms框架提供了丰富的控件，其中DataList控件是一个灵活且强大的数据绑定控件。本文将深入探讨WebForms DataList控件的功能、用法以及在实际开发中的应用。 DataList控件…...

编程日记 2025/2/5 3:03:43

C# List 列表综合运用实例⁓Hypak原始数据处理编程小结

C# List 列表综合运用实例⁓Hypak原始数据处理编程小结 1、一个数组解决很麻烦引出的问题1.1、RAW 文件尾部数据如下:1.2、自定义标头 ADD 或 DEL 的数据结构如下： 2、程序 C# 源代码的编写和剖析2.1、使用 ref 关键字，通过引用将参数传递，以…...

编程日记 2025/2/5 2:59:38

【C++基础】字符串/字符读取函数解析

最近在学C以及STL，打个基础参考： c中的char[] ,char* ,string三种字符串变量转化的兼容原则 c读取字符串和字符的6种函数字符串结构首先明确三种字符串结构的兼容关系：string>char*>char [] string最灵活，内置增删查改…...

编程日记 2025/2/5 2:53:26

大模型-CLIP 详细介绍

CLIP简介 CLIP（Contrastive Language–Image Pre-training）是由OpenAI在2021年提出的一种多模态机器学习模型。它旨在通过大量的文本-图像对进行训练，从而学会理解图像内容，并能将这些内容与相应的自然语言描述相匹配。CLIP的核心…...

编程日记 2025/2/5 2:52:24

1.4 Go 数组

一、数组 1、简介数组是切片的基础数组是一个固定长度、由相同类型元素组成的集合。在 Go 语言中，数组的长度是类型的一部分，因此 [5]int 和 [10]int 是两种不同的类型。数组的大小在声明时确定，且不可更改。简单来说，数组…...

编程日记 2025/2/5 2:50:22

WebSocket——环境搭建与多环境配置

一、前言：为什么要使用多环境配置？ 在开发过程中，我们通常会遇到多个不同的环境，比如开发环境（Dev）、测试环境（Test）、生产环境（Prod）等。每个环境的配置和需…...

编程日记 2025/2/5 2:47:17

三、递推关系与母函数，《组合数学(第4版)》卢开澄卢华明

文章目录一、似函数、非函数1.1 母函数1.2 母函数的简单应用1.3 整数拆分1.4 Ferrers 图像1.5 母函数能做什么1.6 递推关系1.6.1 Hanoi 问题1.6.2 偶数个5怎么算 1.7 Fibonacci 序列1.7.1 Fibonacci 的奇妙性质1.7.2 Fibonacci 恒等式1.7.3 Fibonacci 的直接表达式1.7.4 Fibon…...

编程日记 2025/2/5 2:46:16

线程互斥同步

前言： 简单回顾一下上文所学，上文我们最重要核心的工作就是介绍了我们线程自己的LWP和tid究竟是个什么，总结一句话，就是tid是用户视角下所认为的概念，因为在Linux系统中，从来没有线程这一说法，…...

编程日记 2025/2/5 2:41:10

DeepSeek R1 AI 论文翻译

摘要原文地址： DeepSeek R1 AI 论文翻译我们介绍了我们的第一代推理模型，DeepSeek-R1-Zero 和 DeepSeek-R1。 DeepSeek-R1-Zero 是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（…...

编程日记 2025/2/5 2:33:00

如何计算态势感知率？

态势感知率（Situational Awareness Rate）的计算通常需要结合具体应用场景和定义目标，通常涉及对感知、理解、预测三个层次的量化分析。不同领域（如网络安全、军事、工业控制等）可能有不同的量化方式。通用思路和常见方…...

编程日记 2025/2/5 2:30:57

二、CSS笔记

（一）css概述 1、定义 CSS是Cascading Style Sheets的简称，中文称为层叠样式表，用来控制网页数据的表现，可以使网页的表现与数据内容分离。 2、要点怎么找到标签怎么操作标签对象（element） 3、css的四种引入方式 3.1 行内式在标签的style属性中设定CSS样式。这种方…...

编程日记 2025/2/5 2:26:53

pico示波器采集软件SSL1000A在功率器件测试的应用

在新能源汽车电控体系里，IGBT、MOSFET 是电机控制器、OBC、DC-DC 等核心模块的 “功率开关”，它们的开关特性、瞬态响应、稳定可靠性直接影响整车效率与安全。功率器件测试看似简单，实则细节要求极高，因为器件在高频开关中产生的尖…...

编程新知 2026/5/15 2:49:10

告别闪烁！ESP32+WS2812B的精准时序控制与FreeRTOS任务优化指南

告别闪烁！ESP32WS2812B的精准时序控制与FreeRTOS任务优化指南当你在ESP32项目中使用WS2812B LED灯带时，是否遇到过这些令人头疼的问题：明明代码逻辑正确，灯光却频繁闪烁；颜色显示出现偏差；或者在高负载环境…...

编程新知 2026/5/15 2:17:34

MAC地址失效下基于射频指纹的WiFi设备识别技术

1. 项目概述：当MAC地址失效时如何识别设备在当今的智慧城市和物联网环境中，WiFi设备识别技术面临着前所未有的挑战。传统依赖MAC地址的识别方法正逐渐失效——现代移动设备普遍采用MAC地址随机化技术，每次发送探测请求时都会生成虚拟MAC地址。…...

编程新知 2026/5/15 1:20:31

为什么你的团队很忙，却没有结果

“团队忙得脚不沾地，季度业绩却只增长3%。”这是杭州一位制造业老板的真实困惑。如果你也有同感，不妨想一想：你的团队是在“有效增长”，还是“虚假忙碌”？虚假忙碌的三种表现作为扎根杭州的企业管理培训陪跑机构&#…...

编程新知 2026/5/14 22:35:10

瑞德克斯平台：全球金融市场的可靠选择

瑞德克斯平台：全球金融市场的可靠选择在评估金融服务平台时，监管合规、技术能力、客户服务等维度构成了重要的观察方向。瑞德克斯平台作为业内较为活跃的服务机构，其在这些方面的实践具有一定的参考价值。本文将围绕评测视角，对其…...

编程新知 2026/5/14 22:20:13

LangChain 第一课：核心架构与组件（前端友好版）

一、先一句话搞懂：LangChain 到底是什么？LangChain 是一个大模型应用开发框架，专门帮你把「大模型、RAG、Agent、工具调用」这些功能，像搭积木一样快速拼起来，不用从零写复杂逻辑。前端类比秒懂你写 Vue 要用到 Vue、V…...

编程新知 2026/5/14 22:18:10

3步解锁WeMod Pro：Wand-Enhancer免费增强工具完全指南

3步解锁WeMod Pro：Wand-Enhancer免费增强工具完全指南【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer 阅读预期：你能从本文获得什…...

编程新知 2026/5/14 22:15:46

互联网大厂 Java 求职面试：微服务与云原生

互联网大厂 Java 求职面试：微服务与云原生在某互联网大厂的面试中，面试官与求职者燕双非展开了一场关于微服务与云原生的深入对话。以下是他们的问答记录。第一轮提问面试官：燕双非，首先请你简单介绍一下你对微服务架构的理解。…...

编程新知 2026/5/14 22:15:35

SARScape处理Sentinel-1数据实战：手把手教你如何检查和编辑SBAS连接图（Connection Graph）

SARScape处理Sentinel-1数据的SBAS连接图深度解析与实战优化当处理Sentinel-1数据的SBAS-InSAR分析时，连接图（Connection Graph）的质量直接影响最终形变监测结果的可靠性。许多用户在完成数据预处理后，面对复杂的点线图和报告文件…...

编程新知 2026/5/14 19:33:12

ggshield API集成指南：如何将秘密检测融入现有系统

ggshield API集成指南：如何将秘密检测融入现有系统【免费下载链接】ggshield Detect and validate 500 types of hardcoded secrets with advanced checks. Use it as a pre-commit hook, GitHub Action, or CLI for proactive secret detection and security. 项…...

编程新知 2026/5/14 19:24:26

pytorch基于 Transformer 预训练模型的方法实现词嵌入（tiansz/bert-base-chinese）

相关文章：

pytorch基于 Transformer 预训练模型的方法实现词嵌入（tiansz/bert-base-chinese）

Windows电脑本地部署运行DeepSeek R1大模型（基于Ollama和Chatbox）

区间覆盖问题

【LLM-agent】(task2)用llama-index搭建AI Agent

SpringAI 人工智能

【axios二次封装】

P7497 四方喝彩 Solution

深入剖析 Bitmap 数据结构：原理、应用与优化策略

bypass hcaptcha、hcaptcha逆向

WebForms DataList 深入解析

C# List 列表综合运用实例⁓Hypak原始数据处理编程小结

【C++基础】字符串/字符读取函数解析

大模型-CLIP 详细介绍

1.4 Go 数组

WebSocket——环境搭建与多环境配置

三、递推关系与母函数，《组合数学(第4版)》卢开澄卢华明

线程互斥同步

DeepSeek R1 AI 论文翻译

如何计算态势感知率？

二、CSS笔记

pico示波器采集软件SSL1000A在功率器件测试的应用

告别闪烁！ESP32+WS2812B的精准时序控制与FreeRTOS任务优化指南

MAC地址失效下基于射频指纹的WiFi设备识别技术

为什么你的团队很忙，却没有结果

瑞德克斯平台：全球金融市场的可靠选择

LangChain 第一课：核心架构与组件（前端友好版）

3步解锁WeMod Pro：Wand-Enhancer免费增强工具完全指南

互联网大厂 Java 求职面试：微服务与云原生

SARScape处理Sentinel-1数据实战：手把手教你如何检查和编辑SBAS连接图（Connection Graph）

ggshield API集成指南：如何将秘密检测融入现有系统