当前位置: 首页 > news >正文

李宏毅结构化学习 03

文章目录

  • 一、Sequence Labeling 问题概述
  • 二、Hidden Markov Model(HMM)
  • 三、Conditional Random Field(CRF)
  • 四、Structured Perceptron/SVM
  • 五、Towards Deep Learning

一、Sequence Labeling 问题概述

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


二、Hidden Markov Model(HMM)

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
上图 training data 中的黑色字为x,即文字序列。红色字为 y ^ \hat y y^,即词性序列。


在这里插入图片描述
c o u n t ( s ) count(s) count(s)为训练数据中所有 s s s的个数。
c o u n t ( s → s ′ ) count(s \to s') count(ss)为训练数据中所有 s 后面接 s ′ s后面接s' s后面接s的个数。
c o u n t ( s → t ) count(s \to t) count(st)为训练数据中所有word t t t的标签为 s s s的个数。
P ( y 1 ∣ s t a r t ) P(y_1|start) P(y1start)为标签 y 1 y_1 y1在句首出现的个数,除以句子总个数。
P ( e n d ∣ y L ) P(end|y_L) P(endyL)为标签 y L y_L yL在句尾出现的个数,除以 y L y_L yL总个数。


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
这里 N → V → a N \to V \to a NVa并没有在训练数据中出现过,但是计算的概率反而比训练数据中出现过一次的 N → D → a N \to D \to a NDa高。所以HMM会脑补一些没有出现过的数据。


HMM产生这种脑补的情况是因为转移概率和发射概率是相互独立的。解决这个问题的方法是用一个更复杂的模型去处理这个问题。用CRF也可以处理这个问题。
在这里插入图片描述

三、Conditional Random Field(CRF)

在这里插入图片描述
因为 exp ⁡ ( w ⋅ ϕ ( x , y ) ) \exp (w \cdot \phi (x,y)) exp(wϕ(x,y))可能大于1,所以无法把它当成概率,只能说 P ( x , y ) P(x,y) P(x,y)正比于它。
因为 ∑ y ′ ∈ Y exp ⁡ ( w ⋅ ϕ ( x , y ′ ) ) \sum_{y' \in \mathbb{Y}} \exp(w \cdot \phi(x,y')) yYexp(wϕ(x,y))由于和变量 y ′ y' y没有关系,只和 x x x有关系,所以简记为 Z ( x ) Z(x) Z(x)


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
红色的向量中的每一维都依赖于 ( x , y ) (x,y) (x,y),所以可以认为它是这个向量所形成的特征,记为 ϕ ( x , y ) \phi(x,y) ϕ(x,y)


在这里插入图片描述
由于w的元素可正可负,当为正数的时候,求EXP,就会大于1。并且例如,给定s,求和所有的t,我们也无法保证等于1。所以我们说 P ( x , y ) \text P(x,y) P(x,y)正比于 exp ⁡ ( w ⋅ ϕ ( x , y ) ) \exp(w \cdot \phi (x,y)) exp(wϕ(x,y)),而不说等于。


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
Part 2 的维度大小:|S|个tag中的每个tag后面都能再接|S|个tag,所以是|S| × \times ×|S|。然后start后面能接|S|个tag,end前面能接|S|个tag,所以是2|S|。
CRF比HMM强的点在于,可以自己定义 ϕ ( x , y ) \phi(x,y) ϕ(x,y)


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


横轴表示HMM犯错的百分比,纵轴表示CRF犯错的百分比。如果点在 45 ° 45 \degree 45°对角线左侧,表示HMM表现比较好;在 45 ° 45 \degree 45°对角线右侧,表示CRF表现比较好。
在这里插入图片描述


在这里插入图片描述


四、Structured Perceptron/SVM

在这里插入图片描述


在这里插入图片描述
如果CRF中,另学习率为1,那么两者参数迭代的公式是相近的。其中Strucured Perceptron参数迭代公式中,减掉的最后一项 ϕ ( x n , y ~ n ) \phi (x^n, \widetilde y^n) ϕ(xn,y n)是其概率最大的一项。而CRF减掉的最后一项,则是所有 ϕ ( x n , y ′ ) \phi(x^n,y') ϕ(xn,y)与其概率的加权之和。


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


五、Towards Deep Learning

在这里插入图片描述


在这里插入图片描述


可以将 P ( x l , y l ) \text P(x_l,y_l) P(xl,yl)用神经网络,例如RNN的输出进行替换。
在这里插入图片描述
因为用HMM做inference的时候是给定x,看哪一个y可以让这个概率最大。所以x是给定的,不管 P ( x l ) \text P(x_l) P(xl)是多少,都不会影响最后得到的y了。故,不用管 P ( x l ) \text P(x_l) P(xl)了。


也有如下应用:
在这里插入图片描述
上图中的x不再是input的,而是RNN的output。


在这里插入图片描述

相关文章:

李宏毅结构化学习 03

文章目录 一、Sequence Labeling 问题概述二、Hidden Markov Model(HMM)三、Conditional Random Field(CRF)四、Structured Perceptron/SVM五、Towards Deep Learning 一、Sequence Labeling 问题概述 二、Hidden Markov Model(HMM) 上图 training data 中的黑色字为x&#xff…...

java重点学习-总结

十五 总结 https://kdocs.cn/l/crbMWc8xEZda (总结全部的精华) 1.面试准备 企业筛选简历规则简历编写注意事项(亮点)项目怎么找,学习到什么程度面试过程(表达结构、什么样的心态去找工作) 2.redis 缓存相关(缓存击穿、穿透、雪崩、缓存过期淘…...

文件操作

文件的由来:在程序中,之前每一个程序都是需要运行然后输入数据,当程序结束时输入的数据也随之消散,为了下一次运行时不再输入数据就有文件的由来,使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据…...

docker存储

docker分层结构 如图所示,容器是由最上面可读可写的容器层,以及若干个只读镜像层组成,创建容器时,容器中的 数据都来自镜像层。这样的分层机构最大的特点是写时复制: 1、容器中新生成的数据会直接存放在容器层&#xf…...

Ubuntu20.04.6 环境下docker设置proxy

问题背景: 在进行dokcer pull操作的时候,会失败且出现如下提示Error response from daemon: Get "https://registry-1.docker.io/v2/": net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting h…...

如何给文件夹里面的文件批量添加前缀和编号(利用C#写的小工具)

运行结果 将上面的文件编号效果 下载过后启动这个程序即可(这个程序灵感来源是上次给美术资源分类和编号的时候给我干吐了,所以写了这个工具) 体验链接:laozhupeiqia/批处理 --- laozhupeiqia/批处理 (github.com) 如果对你有帮助…...

使用分布式调度框架时需要考虑的问题——详解

引言 随着企业系统的规模不断扩大,特别是在分布式计算和云计算环境下,如何协调多个节点或服务执行任务成为一个关键问题。分布式调度框架在这种背景下应运而生,它可以调度成千上万的任务,在多个节点上分配、执行和监控任务&#…...

C语言编译四大阶段

目录 一、引言 二、预处理阶段 三、编译阶段 四、汇编阶段 五、链接阶段 六、总结 本文将详细介绍C语言编译的四个阶段,包括预处理、编译、汇编和链接。通过学习这些阶段,读者可以更好地理解C语言程序的编译过程,提高编程效率。 一、引…...

C# 关于“您与该网站的连接不是私密连接...”的问题

目录 问题现象 范例运行环境 WebService 类 类介绍 增加参数 实现 小结 问题现象 最近在访问开发的微信支付功能时遇到了无法访问令牌的错误,这个错误是公司内部应用程序接口返回的访问错误。经过排查是访问 HTTPS 站点遇到的错误,提示证书风险…...

【超详细】基于YOLOv8训练无人机视角Visdrone2019数据集

主要内容如下: 1、Visdrone2019数据集介绍 2、下载、制作YOLO格式训练集 3、模型训练及预测 4、Onnxruntime推理 运行环境:Python3.8(要求>3.8),torch1.12.0cu113(要求>1.8)&#xff0c…...

VUE项目在Linux子系统部署

1、导读 环境:Windows 11、python 3.12.3、Django 4.2.11、 APScheduler 3.10.4 vue 背景:换系统需要重新安装,避免后期忘记,此处记录一下啊 事件:20240922 说明:使用node启动,非nginx&…...

开源 | 如何在产品上扩展大储存?合宙LuatOS外挂SPI Flash库轻松搞定

我们都知道芯片的储存都是寸土寸金的,当你的产品需要存储照片、音频、文档等资源的时候,有没有眉头一紧?内部不够只能外扩,但是外扩要编写各种驱动,还有Flash替换,这都要消耗头发啊! 但&#x…...

20 基于STM32的温度、电流、电压检测proteus仿真系统(OLED、DHT11、继电器、电机)

目录 一、主要功能 二、硬件资源 三、程序编程 四、实现现象 一、主要功能 基于STM32F103C8T6 采用DHT11读取温度、滑动变阻器模拟读取电流、电压。 通过OLED屏幕显示,设置电流阈值为80,电流小阈值为50,电压阈值为60,温度阈值…...

spring自定义属性编辑器

文章目录 spring自定义属性编辑器步骤 spring自定义属性编辑器 属性编辑器是用来解析bean的配置文件中的属性标签的,spring的BeanWrapperImpl默认会注册CustomCollectionEditor(集合)、CustomMapEditor(Map)、CurrencyEditor(货币)、ByteArrayPropertyEditor等&…...

在VMware16中安装Windows 10:完整教程

在VMware中安装Windows 10:完整教程 1.安装环境准备2.创建虚拟机 1.安装环境准备 1.虚拟机: VMware-workstation-full-16.2.2-19200509 2.系统镜像:win10 2.创建虚拟机 1.自定义 2.下一步 3.稍后安装系统 3.默认下一步 4.虚拟机取名和选择存放路径(按需更改…...

MATLAB系列09:图形句柄

MATLAB系列09:图形句柄 9. 图形句柄9.1 MATLAB图形系统9.2 对象句柄9.3 对象属性的检测和更改9.3.1 在创建对象时改变对象的属性9.3.2 对象创建后改变对象的属性 9.4 用 set 函数列出可能属性值9.5 自定义数据9.6 对象查找9.7 用鼠标选择对象9.8 位置和单位9.8.1 图…...

把设计模式用起来!(4) 用不好模式?之原理不明

(清华大学出版社 《把设计模式用起来》书稿试读) 上一篇:把设计模式用起来!(3)用不好模式?之时机不对 为什么用不好设计模式?——原理不明 难搞的顾客:“抹这种霜&#…...

安卓13去掉下拉菜单的Dump SysUI 堆的选项 android13删除Dump SysUI 堆

总纲 android13 rom 开发总纲说明 文章目录 1.前言2.问题分析3.代码分析3.1 位置13.2 位置24.代码修改5.编译6.彩蛋1.前言 客户需要去掉下拉菜单里面的Dump SysUI 堆图标,不让使用这个功能。 2.问题分析 android的下拉菜单在systemui里面,这里我们只需要定位到对应的添加代…...

vue3常用的组件间通信

一 props props 可以实现父子组件通信&#xff0c;props数据是只读。 1. 基本用法 在父组件中&#xff0c;你可以这样传递 props&#xff1a; <template><ChildComponent message"Hello, Vue 3!" /> </template><script setup> import C…...

Windows 查找特定进程的ID并杀死

"*分析用户信息.py*" 换为自己的文件名 Get-WmiObject Win32_Process | Where-Object { $_.CommandLine -like "*分析用户信息.py*" } 查找后 内容如下 __GENUS : 2 __CLASS : Win32_Process __SUPERCLASS …...

如何彻底释放华硕笔记本性能:G-Helper轻量控制工具终极指南

如何彻底释放华硕笔记本性能&#xff1a;G-Helper轻量控制工具终极指南 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Zenboo…...

【Midjourney双色调风格终极指南】:20年视觉算法专家亲授3步精准复刻电影级Duotone效果

更多请点击&#xff1a; https://kaifayun.com 第一章&#xff1a;双色调美学的视觉起源与Midjourney适配性解析 双色调&#xff08;Duotone&#xff09;并非现代数字设计的发明&#xff0c;其视觉基因可追溯至19世纪的凹版印刷工艺——通过两块独立印版叠加单色油墨&#xf…...

从零实现一个电商图片下载器:技术方案与核心代码

引言如果你想自己开发一款电商图片下载工具&#xff0c;本文提供完整的技术方案和核心代码参考。一、技术选型组件推荐方案备选方案浏览器内核CEFElectron下载库libcurlrequests界面框架QtElectron跨平台CEF QtElectron二、核心代码实现2.1 浏览器初始化cppCefRefPtr<CefBr…...

N8N + Cherry Studio 本地大模型对接|全踩坑保姆级指南(Docker 版)

标签&#xff1a;#N8N #CherryStudio #本地大模型 #AI自动化 #避坑指南 摘要&#xff1a;本文完整记录 Docker 部署的 N8N 对接 Cherry Studio 本地中转服务&#xff0c;从网络连通、接口鉴权、节点选型、模型命名等多维度&#xff0c;整理所有报错原因与可直接复制的解决方案&…...

为什么你的Jellyfin需要MaxSubtitle:5分钟实现智能字幕匹配的终极指南

为什么你的Jellyfin需要MaxSubtitle&#xff1a;5分钟实现智能字幕匹配的终极指南 【免费下载链接】jellyfin-plugin-maxsubtitle 一个 Jellyfin 中文字幕插件&#xff08;未来可以不局限中文&#xff09; 项目地址: https://gitcode.com/gh_mirrors/je/jellyfin-plugin-maxs…...

3分钟学会B站缓存视频永久保存:m4s-converter完整使用指南

3分钟学会B站缓存视频永久保存&#xff1a;m4s-converter完整使用指南 【免费下载链接】m4s-converter 一个跨平台小工具&#xff0c;将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾经在B站缓存了珍贵…...

如何快速掌握自动化脚本录制:Pulover‘s Macro Creator零代码入门指南

如何快速掌握自动化脚本录制&#xff1a;Pulovers Macro Creator零代码入门指南 【免费下载链接】PuloversMacroCreator Automation Utility - Recorder & Script Generator 项目地址: https://gitcode.com/gh_mirrors/pu/PuloversMacroCreator 你是否厌倦了每天重复…...

智慧树自动刷课插件:5步实现高效学习自动化,节省70%学习时间

智慧树自动刷课插件&#xff1a;5步实现高效学习自动化&#xff0c;节省70%学习时间 【免费下载链接】zhihuishu 智慧树刷课插件&#xff0c;自动播放下一集、1.5倍速度、无声 项目地址: https://gitcode.com/gh_mirrors/zh/zhihuishu 还在为智慧树平台的重复性视频学习…...

思源宋体TTF:7种字重打造专业中文排版的全新体验

思源宋体TTF&#xff1a;7种字重打造专业中文排版的全新体验 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf 还在为中文设计项目的字体选择头疼吗&#xff1f;今天我要分享一个让我工作…...

3分钟上手ncmdumpGUI:网易云音乐NCM文件轻松转换的完整指南

3分钟上手ncmdumpGUI&#xff1a;网易云音乐NCM文件轻松转换的完整指南 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换&#xff0c;Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 还在为网易云音乐的NCM格式文件无法在其…...