当前位置: 首页 > news >正文

09.自注意力机制

文章目录

  • 输入
  • 输出
  • 运行
  • 如何运行
    • 解决关联性
    • attention score
    • 额外的
    • Q K V
  • Multi-head self-attention
  • Positional Encoding
  • Truncated Self-attention
  • 影像处理
  • vs CNN
  • vs RNN
  • 图上的应用

输入

在这里插入图片描述

输出

在这里插入图片描述

运行

在这里插入图片描述
链接(Attention Is All You Need)

如何运行

在这里插入图片描述

解决关联性

在这里插入图片描述

attention score

也可以不用softmax,relu也行。
在这里插入图片描述

额外的

在这里插入图片描述

Q K V

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Multi-head self-attention

在这里插入图片描述
在这里插入图片描述

Positional Encoding

在这里插入图片描述
https://arxiv.org/abs/2003.09229

在这里插入图片描述

Truncated Self-attention

只看一个小范围。
在这里插入图片描述

影像处理

在这里插入图片描述

vs CNN

在这里插入图片描述
在这里插入图片描述

vs RNN

在这里插入图片描述

图上的应用

在这里插入图片描述

相关文章:

09.自注意力机制

文章目录 输入输出运行如何运行解决关联性attention score额外的Q K V Multi-head self-attentionPositional EncodingTruncated Self-attention影像处理vs CNNvs RNN图上的应用 输入 输出 运行 链接(Attention Is All You Need) 如何运行 解决关联性 a…...

时政|杂粮产业

政策支持 《新一轮千亿斤粮食产能提升行动方案(2024—2030年)》明确,按照“巩固提升口粮、主攻玉米大豆、兼顾薯类杂粮”的思路,因地制宜发展马铃薯、杂粮杂豆等品种,根据市场需求优产稳供。 产地发展 河北省石家庄…...

docker 安装 私有云盘 nextcloud

拉取镜像 # 拉取镜像 sudo docker pull nextcloud运行nextcloud 容器 # 内存足够可以不进行内存 --memory512m --memory-swap6g # 桥接网络 --network suixinnet --network-alias nextcloud \ sudo docker run -itd --name nextcloud --restartalways \ -p 9999:80 \ -v /m…...

第十一届蓝桥杯物联网试题(国赛)

国赛题目看着简单其实还是挺复杂的,所以说不能掉以轻心,目前遇到的问日主要有以下几点: 本次题主要注重的是信息交互,与A板通信的有电脑主机和B板,所以处理好这里面的交互过程很重要 国赛中避免不了会收到其他选手的…...

算法金 | Dask,一个超强的 python 库

本文来源公众号“算法金”,仅用于学术分享,侵权删,干货满满。 原文链接:Dask,一个超强的 python 库 1 Dask 概览 在数据科学和大数据处理的领域,高效处理海量数据一直是一项挑战。 为了应对这一挑战&am…...

Java 说唱歌手

Yo yo yo,欢迎来到Java地带,技术的盛宴开启, 从JDK到JVM,我们构建的是数字世界的奇迹。 Spring Boot启动,微服务架构轻盈起舞, IoC解耦依赖,AOP切面如丝般顺滑。 Maven管理依赖,Gra…...

面试-软件工程与设计模式相关,Spring简介

面试-软件工程与设计模式相关,Spring简介 1.编程思想1.1 面向过程编程1.2 面向对象编程1.2.1 面向对象编程三大特征 1.3 面向切面编程1.3.1 原理1.3.2 大白话?1.3.3 名词解释1.3.4 实现 2. 耦合与内聚2.1 耦合性2.2 内聚性 3. 设计模式3.1 设计模型七大原…...

IDEA中一些常见操作【持续更新】

文章目录 前言善用debugidea中debug按钮不显示自动定位文件【始终选择打开的文件】idea注释不顶格【不在行首】快速定位类的位置【找文件非常快】创建文件添加作者及时间信息快速跳转到文件顶端 底端 前言 因为这些操作偶尔操作一次,不用刻意记忆,有个印…...

java继承使用细节二

构造器 主类是无参构造器时会默认调用 public graduate() {// TODO Auto-generated constructor stub也就是说我这里要用构造器会直接调用父类。它是默认看不到的 ,System.out.println("graduate");} 但当主类是有参构造器如 public father_(int s,doubl…...

c++11 标准模板(STL)本地化库 - 平面类别(std::numpunct_byname) 表示系统提供的具名本地环境的 std::numpunct

本地化库 本地环境设施包含字符分类和字符串校对、数值、货币及日期/时间格式化和分析,以及消息取得的国际化支持。本地环境设置控制流 I/O 、正则表达式库和 C 标准库的其他组件的行为。 平面类别 表示系统提供的具名本地环境的 std::numpunct std::numpunct_byn…...

XILINX FPGA DDR 学习笔记(一)

DDR 内存的本质是数据的存储器,首先回到数据的存储上,数据在最底层的表现是地址。为了给每个数据进行存放并且在需要的时候读取这个数据,需要对数据在哪这个抽象的概念进行表述,我们科技树发展过程中把数据在哪用地址表示。一个数…...

vue源码2

vue之mustache库的机理其实是将模板字符串转化为tokens 然后再将 tokens 转化为 dom字符串&#xff0c;如下图 对于一般的将模板字符串转化为dom字符串&#xff0c;这样不能实现复杂的功能 let data {name:小王,age:18 } let templateStr <h1>我叫{{name}},我今年{{ag…...

Android四大组件 Broadcast广播机制

一 概述 广播 (Broadcast) 机制用于进程或线程间通信&#xff0c;广播分为广播发送和广播接收两个过程&#xff0c;其中广播接收者 BroadcastReceiver 是 Android 四大组件之一。BroadcastReceiver 分为两类&#xff1a; 静态广播接收者&#xff1a;通过 AndroidManifest.xm…...

redisson 使用fastJson2序列化

前因&#xff1a;一个项目&#xff1a;有人用redisTemplete存数据&#xff08;使用了fastjson2&#xff09;&#xff0c;使用redisson取的时候就会报错。要让redisTemplete与redisson序列化一致 一、自定义序列化器 import com.alibaba.fastjson2.JSON; import com.alibaba.fa…...

Python数据分析常用函数

Python基础 数字处理函数 Python提供了用于数字处理的内置函数和内置模块(math)&#xff0c;使用内置模块&#xff0c;需要先导入 import math。 内置函数math模块abs(-5)返回绝对值math.ceil(2.3)返回不小于x的最小整数divmod(9,4)返回商和余数math.floor(2.3)返回不大于x的…...

C++ 数据结构算法 学习笔记(32) -五大排序算法

C 数据结构算法 学习笔记(32) -五大排序算法 选择算法 如下若有多个女生的身高需要做排序: 常规思维: 第一步先找出所有候选美女中身高最高的&#xff0c;与最后一个数交换 第二步再找出除最后一位美女外其它美女中的最高者&#xff0c;与倒数第二个美女交换位置 再找出除最…...

从入门到精通:详解Linux进程管理

前言 在这篇文章中&#xff0c;我将带领大家深入学习和理解Linux系统中的进程管理。无论你是初学者还是有一定经验的开发者&#xff0c;相信这篇文章都会对你有所帮助。我们将详细讲解冯诺依曼体系结构、操作系统概念、进程管理、进程调度、进程状态、环境变量、内存管理以及其…...

【Linux】如何在 Linux 系统中使用 envsubst 来处理 Nginx 配置模板

一、创建 nginx.template 模板文件 vim nginx.template复制下面文件内容 server { listen ${BY_PORT}; server_name ${BY_HOST}; location /sys/ { proxy_pass http://${BY_GRAFANA_HOST}:${BY_GRAFANA_PORT}/; } # 其他配置... }这个模板中包含了几个环境变量&#…...

【LeetCode】438.找到字符串中所有字母异位词

找到字符串中所有字母异位词 题目描述&#xff1a; 给定两个字符串 s 和 p&#xff0c;找到 s 中所有 p 的 异位词 的子串&#xff0c;返回这些子串的起始索引。不考虑答案输出的顺序。 异位词 指由相同字母重排列形成的字符串&#xff08;包括相同的字符串&#xff09;。 示…...

力扣96. 不同的二叉搜索树

Problem: 96. 不同的二叉搜索树 文章目录 题目描述思路复杂度Code 题目描述 思路 一个数字做根节点的话可能的结果为&#xff1a;其左边数字做子树的组合数字乘以其右边数字做子树的个数之积 1.创建备忘录memo&#xff1b; 2.递归分别求取当前数字左边和右边数字做子树的数量&…...

3个理由告诉你,为什么Mac用户需要Turbo Boost Switcher这个终极性能控制工具

3个理由告诉你&#xff0c;为什么Mac用户需要Turbo Boost Switcher这个终极性能控制工具 【免费下载链接】Turbo-Boost-Switcher Turbo Boost disabler / enable app for Mac OS X 项目地址: https://gitcode.com/gh_mirrors/tu/Turbo-Boost-Switcher Turbo Boost Switc…...

解决学术文献格式兼容难题:本地CAJ转PDF工具提升研究效率

解决学术文献格式兼容难题&#xff1a;本地CAJ转PDF工具提升研究效率 【免费下载链接】caj2pdf Convert CAJ (China Academic Journals) files to PDF. 转换中国知网 CAJ 格式文献为 PDF。佛系转换&#xff0c;成功与否&#xff0c;皆是玄学。 项目地址: https://gitcode.com…...

数据结构之哈夫曼树(Huffman Tree)

哈夫曼树&#xff08;Huffman Tree&#xff09;详解 概述 哈夫曼树&#xff08;Huffman Tree&#xff09;是一种特殊的二叉树&#xff0c;由David A. Huffman于1952年提出。它是一种最优二叉树&#xff0c;主要用于数据压缩&#xff0c;能够为字符分配可变长度的编码&#xff0…...

【实战】从零构建onnxruntime:源码编译全流程与疑难解析

1. 环境准备&#xff1a;搭建编译基础环境 在开始编译onnxruntime之前&#xff0c;我们需要先准备好基础环境。我选择的是Ubuntu 20.04 LTS系统&#xff0c;这个版本长期支持且稳定性好&#xff0c;实测下来各种依赖库的兼容性也最佳。如果你用的是其他Linux发行版&#xff0c;…...

小白友好!Qwen2.5-7B-Instruct本地部署,实时参数调节实战

小白友好&#xff01;Qwen2.5-7B-Instruct本地部署&#xff0c;实时参数调节实战 1. 为什么选择Qwen2.5-7B-Instruct Qwen2.5-7B-Instruct是阿里通义千问团队推出的旗舰级大语言模型&#xff0c;相比轻量级的1.5B/3B版本&#xff0c;7B参数规模带来了质的飞跃。这个模型在18T…...

如何快速掌握Steam成就管理神器:Steam Achievement Manager终极指南 [特殊字符]

如何快速掌握Steam成就管理神器&#xff1a;Steam Achievement Manager终极指南 &#x1f3ae; 【免费下载链接】SteamAchievementManager A manager for game achievements in Steam. 项目地址: https://gitcode.com/gh_mirrors/st/SteamAchievementManager Steam Achi…...

如何突破信息壁垒?Bypass Paywalls Clean的全方位应用指南

如何突破信息壁垒&#xff1f;Bypass Paywalls Clean的全方位应用指南 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 在信息爆炸的时代&#xff0c;优质内容往往被付费墙层层阻隔。B…...

Synopsys综合指令进阶指南:为什么90%的工程师都用错了full_case?

Synopsys综合指令进阶指南&#xff1a;为什么90%的工程师都用错了full_case&#xff1f; 在数字电路设计领域&#xff0c;Synopsys工具链中的full_case指令就像一把双刃剑——用得好可以优化电路结构&#xff0c;用不好则可能导致仿真与综合结果不一致的灾难性后果。本文将带您…...

千问3.5-2B实战:利用Typora与AI打造智能笔记系统

千问3.5-2B实战&#xff1a;利用Typora与AI打造智能笔记系统 1. 智能笔记系统的价值与痛点 在日常学习和工作中&#xff0c;我们经常面临这样的困境&#xff1a;收集了大量笔记资料&#xff0c;却难以有效组织和利用&#xff1b;记录了许多灵感想法&#xff0c;却无法快速转化…...

Ostrakon-VL终端惊艳效果:像素UI下支持键盘快捷键(F5刷新/F6扫描)

Ostrakon-VL终端惊艳效果&#xff1a;像素UI下支持键盘快捷键&#xff08;F5刷新/F6扫描&#xff09; 1. 像素特工终端概览 这是一个基于Ostrakon-VL-8B多模态大模型开发的Web交互终端&#xff0c;专为零售与餐饮场景优化。与传统工业级UI不同&#xff0c;我们采用了高饱和度…...