当前位置: 首页 > article >正文

知识图谱(BILSTM+CRF项目完整实现)【第六章】

一、代码架构图在data_origin中有两种类型的数据:分别是一般项目和一般项目txtoriginal一般项目中放的是部位、症状、索引列之间用制表符隔开一般项目txtoriginal放的是原始数据二、构建序列标注数据要把原始数据转换为目标数据常用的方式是构建字典,把索引作为键,把标签作为值。可以使用标签类型字典把中文转换为英文然后遍历索引防止中间的索引被标记为O可以判断是否是起始索引若果是起始索引拼接B不是起始索引拼接I难点1获取到所有原始数据通过os.Walk()遍历原始数据所在的文件夹得到所有数据文件2获取原始数据对应的标注数据通过文件名称的特点将原始数据文件名中的.txtoriginal替换成就是对应的标注数据三、BILSTM输入输出计算BILSTM输入有三个元素分别是输入张量、隐藏状态、细胞状态BILSTM输出有三个元素分别是输出张量、最终隐藏状态、最终细胞状态无论是输入张量还是输出张亮默认参数的顺序是L【序列长度】N批次数H张量维度如果参数batch_firstTrue的时候,那么参数顺序是(N批次数,L【序列长度】,H张量维度),这是我们常用的顺序输入参数:输入序列:(batch_size,seq_length,n_dim)[batch_firstTrue]隐藏状态维度:hidden_size隐藏状态:(D*num_lays,batch_size,hidden_size)细胞状态:(D*num_lays,batch_size,hidden_size)输出参数:输出序列:(batch_size,seq_length,D*hidden_size)[batch_firstTrue]隐藏状态:(D*num_lays,batch_size,hidden_size)细胞状态:(D*num_lays,batch_size,hidden_size)如果在输出层上面加一个线性层,那所有的输出参数最后一维的hidden变为线性层的维度小结:输入序列(批次,序列长度,序列维度)输出序列(批次,序列长度,输出维度(隐藏维度/自定义的线性维度))细胞状态(层数*双向/单向,批次数,隐藏状态)细胞状态(层数*双向/单向,批次数,隐藏状态)例如输入序列[8,50,128](batch_firsttrue),隐藏层维度100那么隐藏状态是(D*1,8,100)细胞状态为(D*1,8,100)D的取值是看这个模型是双向模型还是单向模型,如果说是单向模型(比如:LSTM)那么D1,如果是双向模型(比如BILSTM),那么D2num_lays指的是总共有多少个模型,如果整个系统只有一个BILSTM,那么num_lays1,如果整个系统里面有两个BILSTM,那么num_lays2输出序列[8,50,D*100](batch_firstTrue)隐藏状态是(D*1,8,100)细胞状态是(D*1,8,100)四、项目BILSTM应用(基线模型)输入序列的批次和长度:[batch_size,seq_length]向量层对输入序列进行向量化:[batch_size,seq_length,embedding_dim]输入序列到BILSTM里面,BILSTM输出维度:[batch_size,seq_length,hidden_size*2](input_size,hidden_size,bidirectionalTrue,batch_firstTrue)BILSTM输出的维度是:隐藏层*D,所以真正的隐藏层维度是BILSTM输出维度/2随机失活层:只保留有效未知的输出结果,无效部分的值转换为0attention_mask:因为输入序列长短不一,但是神经网络要求同一批次输入序列长度相同.这时候使用attention_mask可以防止神经网络看到这些补齐的padding,让神经网络只关注有用的信息(使用padding补齐序列是在数据预处理的时候完成的)线性层:把输出维度转换为标签类型数维度变换分析:1. 输入层input_ids形状[batch_size, seq_len] [2, 59]含义2 个句子每个句子 59 个词的索引含 padding2. 词嵌入层word_embeds操作nn.Embedding(vocab_size, embedding_dim)把每个词索引映射成 300 维向量形状[batch_size, seq_len, embedding_dim] [2, 59, 300]图中标注[2, 59, 300]✅3. BiLSTM 层参数nn.LSTM(input_size300, hidden_size128, bidirectionalTrue)input_size输入维度 词向量维度 300hidden_size单向隐藏层维度 128bidirectionalTrue双向 LSTM输出会拼接前向 后向的隐藏状态输出形状[batch_size, seq_len, hidden_size*2] [2, 59, 128*2256]图中标注[2, 59, 256]✅4. Dropout 层操作随机让部分神经元失活防止过拟合不改变维度输出形状和输入一样[2, 59, 256]图中标注[2, 59, 256]✅5. 「对位相乘」Attention Mask两个输入Dropout 输出[2, 59, 256]attention_mask形状是[2, 59]0/1 矩阵1 表示有效 token0 表示 padding关键广播机制下的对位相乘attention_mask会被自动扩展为[2, 59, 1]再和[2, 59, 256]逐元素相乘有效位置mask1向量保持不变padding 位置mask0整个 256 维向量全部置 0输出形状还是[2, 59, 256]但 padding 部分的向量全是 06. 线性层linear参数nn.Linear(hidden_dim*2, tag_size)→nn.Linear(256, 12)操作对每个 token 的 256 维特征做线性变换映射到 12 个标签的分数输出形状[batch_size, seq_len, tag_size] [2, 59, 12]图中标注[2, 59, 12]✅总结每一步的维度变化表格层输入形状操作输出形状输入层--[2, 59]词嵌入[2, 59]词索引→300 维向量[2, 59, 300]BiLSTM[2, 59, 300]双向 LSTM隐藏层 128[2, 59, 256]Dropout[2, 59, 256]随机失活[2, 59, 256]对位相乘[2, 59, 256][2, 59]mask广播 逐元素相乘padding 置 0[2, 59, 256]线性层[2, 59, 256]256→12 维线性变换[2, 59, 12]关键补充为什么要做「对位相乘」这一步的核心目的是屏蔽 padding 部分模型对 padding 位置也会输出特征但这些是无效的通过attention_mask的 0 值和这些特征做对位相乘直接把无效位置的特征清 0这样后续计算 loss 或做预测时就不会被 padding 部分干扰五、BILSTM实现NER总共有五个超参需要设置向量化维度、隐藏层维度、随机失活比例、字符数量、标签数量import torch import torch.nn as nn class NERLSTM(nn.Module): def __init__(self, embedding_dim, hidden_dim, dropout, word2id, tag2id): super(NERLSTM, self).__init__() self.name BiLSTM self.embedding_dim embedding_dim self.hidden_dim hidden_dim self.vocab_size len(word2id) self.tag_size len(tag2id) self.word_embeds nn.Embedding(self.vocab_size, self.embedding_dim) self.dropout nn.Dropout(dropout) self.lstm nn.LSTM(self.embedding_dim, self.hidden_dim // 2, bidirectionalTrue, batch_firstTrue) self.hidden2tag nn.Linear(self.hidden_dim, self.tag_size) def forward(self, x, mask): embedding self.word_embeds(x) outputs, hidden self.lstm(embedding) outputs outputs * mask.unsqueeze(-1) # 仅保留有效位置的输出 outputs self.dropout(outputs) outputs self.hidden2tag(outputs) return outputs

相关文章:

知识图谱(BILSTM+CRF项目完整实现)【第六章】

一、代码架构图在data_origin中有两种类型的数据:分别是一般项目和一般项目txtoriginal一般项目中放的是部位、症状、索引;列之间用制表符隔开一般项目txtoriginal放的是原始数据;二、构建序列标注数据要把原始数据转换为目标数据:常用的方式…...

LLM应用缓存设计范式重构,Dify 2026新增Context-Aware TTL引擎与动态驱逐策略

第一章:Dify 2026缓存机制演进与核心设计哲学Dify 2026 的缓存体系并非简单沿袭传统 LRU 或 TTL 模式,而是以“语义感知”与“推理链可追溯”为双支柱重构底层数据生命周期管理。其核心设计哲学强调:缓存不是性能的临时补丁,而是推…...

NativeScript APP 开发备忘

devtools 调试断开 命令ns debug android可以开启浏览器的调试页面,非常方便。一开始使用功能非常完整,包括元素、日志、代码和网络,后来用着用着,发现元素和网络没了,剩下日志和代码可用,再后来用着用着&…...

unity mcp接入 实现一句话生成游戏!

文章目录前言一、MCP 核心包接入 Unity 编辑器1、使用Git URL 安装(可选,最新)2、Unity Asset Store 安装(可选,稳定)2、OpenUPM(可选)二、Python 3.10 与 uv 环境搭建1、安装 Pyth…...

担心2026年数字人直播系统投入过高?五款主流平台落地方案对比评测

一、引文/摘要:投入焦虑下,如何选对数字人直播系统2026年数字人直播持续升温,越来越多商家想借助数字人直播系统降本增效,但“投入高、落地难、性价比低”成为首要顾虑。不少用户困惑,如何在控制成本的同时&#xff0c…...

多态章-虚函数-重写-协变-override/final-重写覆盖隐藏的对比-纯虚函数与抽象类-多态的底层-虚函数表-动态绑定-静态绑定

使用的父类子类 基于继承下的虚函数 调用 ——代码复用。形成条件:1.必须是基类的指针或引用调用虚函数。 2.调用子类中拥有父类的虚函数的重写/覆盖。虚函数:类成员函数前加以virtual就成为了虚函数 注意:非成员函数无法加virtual修饰。cl…...

Phi-3-mini-4k-instruct-gguf多场景应用:写邮件/解题/写SQL/生成测试用例实战演示

Phi-3-mini-4k-instruct-gguf多场景应用:写邮件/解题/写SQL/生成测试用例实战演示 1. 模型简介 Phi-3-Mini-4K-Instruct是一个38亿参数的轻量级开源模型,采用GGUF格式提供。这个模型在Phi-3数据集上训练,该数据集包含合成数据和经过筛选的公…...

Java八股文实战:从原理到代码,解析Pixel Couplet Gen的Java客户端设计

Java八股文实战:从原理到代码,解析Pixel Couplet Gen的Java客户端设计 1. 为什么需要关注Java客户端设计 在分布式系统开发中,客户端设计往往是被忽视的一环。很多开发者更关注服务端实现,却忽略了客户端的健壮性和可维护性。但…...

金融评分卡‌是一种将用户信用风险量化为分数的模型工具,广泛应用于贷款审批、额度定价和风险预警等环节,分数越高代表风险越低

‌金融评分卡‌是一种将用户信用风险量化为分数的模型工具,广泛应用于贷款审批、额度定价和风险预警等环节,分数越高代表风险越低。一、评分卡的核心作用金融机构通过评分卡快速判断:是否授信(如信用卡申请)授信额度与…...

0421晨间日记

- 关键词 - 上午- 吃饭- 从五台山到大同 - 下午- 云冈石窟- 石头要好雕刻,就意味着容易损毁- 国家要统治- 人生来就是苦的,让你接受是苦的- 地主因为信佛,得到了好处的,愿意捐钱修建- 大同古城墙- 这个建立起来确实很壮观- 但是高…...

数据预处理和超范围值处理步骤 18

1 .数据预处理实验(1)导入数据操作步骤:① 从“源”面板拖入“Excel”节点。② 双击节点,选择待处理的数据文件。③ 从“输出”面板拖入“表格”节点,连接至“Excel”节点,右键运行,查看原始数据…...

辅助医生能力成长与患者个体化治疗方案生成系统(上)

摘要 本文档详细阐述了一套面向基层医疗机构的辅助医生能力成长与患者个体化治疗方案生成系统的设计与实现。系统以“规则驱动为基、数据驱动为翼”为核心思想,通过症状-疾病映射、指南依据匹配、用药禁忌筛查、个体化调整与风险预警等模块,为临床医生提供实时、可解释的决策…...

【2026最新】JDK 下载安装与环境配置全教程(Windows/Mac/Linux 三平台,零基础友好)

Java 开发的第一步,就是把 JDK 环境搭好。这一步看着简单,但不少新手会在环境变量配置上踩坑——JAVA_HOME 没设对、javac 报“不是内部或外部命令”、改完变量终端里还是不生效……这些坑我都替你踩过一遍了。 这篇文章就用最直白的方式,手…...

在 Word 中,一个公式就能看出你会不会高效排版

在 Word 中,一个公式就能看出你会不会高效排版 很多人写论文、实验报告或者技术文档时,一碰到公式就习惯打开 MathType,点来点去插入分式、求和、下标,操作不算难,但确实有点慢。 其实,对于很多常见公式&am…...

从零开始:Spring Boot + MyBatis 搭建后端接口完整教程

前言:你是否刚接触 Spring Boot,面对一堆配置不知从何下手?是否看了很多教程,却还是搞不清 Controller、Service、Mapper 到底谁先谁后?本文带你从零开始,手把手搭建一个完整的 Spring Boot MyBatis 项目。…...

当智能眼镜遇上了AI——使用灵珠搭建【镜中食谱】智能体

今天带大家沉浸式体验 Rokid 自研的 AI 开发平台——【灵珠平台】! 🌟 零代码、零门槛,手把手教你搭建一个专属的【镜中食谱】智能体,让 Rokid Glasses 解决你的吃饭难题! 本文智能体基于Rokid AI Glasses和灵珠AI平…...

Pi0视觉-语言-动作流模型科研应用:人类意图识别与机器人行为对齐研究

Pi0视觉-语言-动作流模型科研应用:人类意图识别与机器人行为对齐研究 1. 项目概述与科研价值 Pi0是一个突破性的视觉-语言-动作流模型,专门为通用机器人控制而设计。这个模型的核心价值在于它能够将人类的自然语言指令、视觉感知和机器人动作生成无缝连…...

robot_localization实现imu和odom融合

记录使用robot_localization进行融合下载地址:git clone https://gitee.com/bingshuibuliang/robot_localization.git注意:/odometry/filtered是这个节点发送的融合位姿,修改的话需要在ekf_nodelet_template.launch里,在使用robot…...

从扩频时钟到弹性缓存:一张图看懂PCIe是如何‘容忍’时钟偏差,保证数据不丢的

从水流模型到数据同步:图解PCIe时钟偏差补偿机制 想象一下城市供水系统中两个不同步的水泵——一个抽水快,一个抽水慢。如果没有调节装置,要么水管爆裂,要么用户断水。PCIe总线面临的时钟同步挑战与此惊人相似。本文将用生活化的水…...

《Spring Boot 第一个 REST API 教程》

前置知识:Java 基础、Maven 基础 最终效果:启动一个 Spring Boot 应用,通过浏览器访问 http://localhost:8080/hello 得到 {"msg":"Hello World"} 步骤 1:创建项目 推荐使用 Spring Initializr:…...

ROS2笔记2:使用Topic自定义Messages实现nodes之间通讯

1. Package规划 1.1 自定义消息接口my_interface_pkg DirCommandRequest.msg请求Topic消息 由发起node发起的Topic消息builtin_interfaces/Time stamp # 记录时间戳 string directory # 操作的目录 int8 command # 操作指令. 0:list, 1:re…...

如何3分钟解决百度网盘提取码难题:baidupankey完全指南

如何3分钟解决百度网盘提取码难题:baidupankey完全指南 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 你是否曾因找不到百度网盘提取码而错过重要资源?当朋友分享学习资料、同事发送工作文件&#xff…...

2026年最新好用的WMS仓库管理系统盘点!10款国内外热门WMS系统推荐

面对仓储管理的挑战,越来越多的企业开始关注WMS系统。但在选型时,很多企业面临同样的困惑:市场上WMS系统那么多,到底哪款适合自己?本文盘点2026年国内外10款热门WMS系统,从功能特点、适用场景、性价比等维度…...

3分钟搞定百度网盘提取码:baidupankey智能工具终极指南

3分钟搞定百度网盘提取码:baidupankey智能工具终极指南 【免费下载链接】baidupankey 项目地址: https://gitcode.com/gh_mirrors/ba/baidupankey 你是否曾经遇到过这样的情况:好不容易找到了需要的资源,却被百度网盘提取码挡在门外&…...

打卡信奥刷题(3138)用C++实现信奥题 P7617 [COCI 2011/2012 #2] KOMPIĆI

P7617 [COCI 2011/2012 #2] KOMPIĆI 题目描述 给定 NNN 个正整数 A1,A2,...,ANA_1,A_2,...,A_NA1​,A2​,...,AN​&#xff0c;求有多少整数对 (i,j)(i,j)(i,j)&#xff0c;满足以下条件&#xff1a; 1≤i<j≤N1 \le i < j \le N1≤i<j≤NAiA_iAi​ 和 AjA_jAj​ 至…...

如何让全面战争MOD开发从繁琐变得优雅:RPFM的现代化解决方案

如何让全面战争MOD开发从繁琐变得优雅&#xff1a;RPFM的现代化解决方案 【免费下载链接】rpfm Rusted PackFile Manager (RPFM) is a... reimplementation in Rust and Qt5 of PackFile Manager (PFM), one of the best modding tools for Total War Games. 项目地址: https…...

我第一次做 OData 后端服务时,真正绊住我的,不是代码,而是 Cloud Foundry 里的这些基础坑

最近我给自己加了一条训练线,除了平时在社区里吸收知识、输出知识,我还逼着自己每周完成一个带明确目标的小任务。第二个任务,我挑了一个很适合拿来练基本功的方向,亲手做一个基于 OData 的后端服务。 原本我以为,真正费劲的部分会落在 OData 协议本身,像 entity、servi…...

CSS如何快速获取网页上的标准色值_借助开发者工具的取色器和色彩格式转换功能

Chrome开发者工具中点击Styles面板颜色旁小色块启用取色器&#xff0c;悬停页面实时显示hex/rgb/hsl值&#xff0c;长按可循环切换格式&#xff1b;rgba透明度和色彩空间差异会导致与设计稿不一致。Chrome开发者工具里怎么直接取网页上某个颜色的十六进制值点开 DevTools&#…...

【Linux】进程(2)状态

目录 一、冯诺依曼 二、操作系统 三、进程状态 &#xff08;1&#xff09;运行状态&#xff1a;进程已获得CPU资源&#xff0c;正在执行指令&#xff0c;是进程生命周期中唯一能直接操作硬件、推进任务的阶段。 &#xff08;2&#xff09;阻塞状态&#xff1a;进程因等待特…...

Canny边缘检测的精度天花板在哪里?深入剖析Devernay亚像素校正的误差与优化

Canny边缘检测的精度天花板在哪里&#xff1f;深入剖析Devernay亚像素校正的误差与优化 在工业检测、遥感成像等对精度要求严苛的领域&#xff0c;传统Canny算法提供的像素级边缘定位往往难以满足需求。当测量芯片电路线宽或分析卫星图像中的道路边界时&#xff0c;即使单个像素…...