【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分!
【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分!
【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分!
文章目录
- 【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分!
- FFN 和 E_FFN 的作用与区别
- 1. FFN(前馈神经网络)
- 功能:
- 过程:
- 使用场景
- 代码示例:
- 2. E_FFN(增强型前馈神经网络)
- 功能:
- 过程:
- 使用场景:
- 代码示例:
- 3. FFN 与 E_FFN 的区别
- 总结
- 交通运输、机电主题会议
- 第六届国际科技创新学术交流大会(IAECST 2024) 暨第四届物流系统与交通运输国际学术会议(LSTT 2024)
- 第四届机电一体化与智能控制国际学术会议(MIC 2024)
- 2024年智能船舶与机电系统国际学术会议(ICISES 2024)
- 测绘遥感、地质主题会议
- 第三届地理信息与遥感技术国际学术会议(GIRST 2024)
- 2024年遥感技术与图像处理国际学术会议(RSTIP 2024)
- 数学、力学、物理主题会议
- 第五届应用力学与机械工程国际学术会议(ICAMME 2024)

欢迎宝子们点赞、关注、收藏!欢迎宝子们批评指正!
祝所有的硕博生都能遇到好的导师!好的审稿人!好的同门!顺利毕业!
大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文:
可访问艾思科蓝官网,浏览即将召开的学术会议列表。会议入口:https://ais.cn/u/mmmiUz
FFN 和 E_FFN 的作用与区别
1. FFN(前馈神经网络)
功能:
FFN 是一种基础的全连接前馈神经网络。它由两层全连接层(Linear Layer)和一个激活函数(GELU)组成,通常用于神经网络的中间层进行非线性变换,增加模型的表达能力。
过程:
- 输入通过第一层全连接层(fc1)将输入的特征维度 in_features 映射 hidden_features。
- 然后经过激活函数(act),此处使用的是 GELU 激活函数,进行非线性变换。
- 然后通过第二层全连接层(fc2)将特征维度从 hidden_features 映射回 out_features。
- 最后,可能会应用 Dropout 来避免过拟合。
使用场景
FFN 在许多深度学习模型中作为基础模块,广泛应用于Transformer架构、MLP(多层感知器)等结构中,主要用于处理非线性关系和高维特征之间的映射。
代码示例:
class FFN(nn.Module):def __init__(self, in_features, hidden_features=None, out_features=None, drop=0.):super(FFN, self).__init__()out_features = out_features or in_featureshidden_features = hidden_features or in_features# 第一层全连接层self.fc1 = nn.Linear(in_features, hidden_features) # in_features = 512, hidden_features = 128# 激活函数 (使用GELU)self.act = nn.GELU()# 第二层全连接层self.fc2 = nn.Linear(hidden_features, out_features) # hidden_features = 128, out_features = 512# Dropout层self.drop = nn.Dropout(drop)def forward(self, x):x = self.fc1(x) # 输入经过第一层x = self.act(x) # 激活函数x = self.fc2(x) # 输入经过第二层x = self.drop(x) # 如果drop值大于0,应用dropoutreturn x
2. E_FFN(增强型前馈神经网络)
功能:
E_FFN 是对 FFN 的增强版本,通过卷积层和批归一化层增强其能力。与 FFN 主要依赖全连接层不同,E_FFN 引入了卷积操作,使其更适合处理空间结构数据(如图像或多维特征)。
过程:
- fc1 是一个卷积操作(ConvBNReLU),通过 1x1 卷积层将输入的通道数 in_channels 映射到 hidden_channels,并进行批归一化和激活。
- conv1 和 conv2 是基于输入特征的卷积操作,使用不同的卷积核大小(ksize 和 3x3)进行处理。
- 最后通过 fc2 将卷积操作的结果映射回 out_features,并通过激活函数(如 ReLU6)进行非线性变换。
使用场景:
E_FFN 是 FFN 的改进版本,特别适用于具有空间特征的任务(如图像处理、语义分割等),因为它使用了卷积操作,可以捕捉空间结构信息和局部特征。
代码示例:
class E_FFN(nn.Module):def __init__(self, in_features, hidden_features=None, out_features=None, ksize=5, act_layer=nn.ReLU6, drop=0.):super(E_FFN, self).__init__()out_features = out_features or in_featureshidden_features = hidden_features or in_featuresself.fc1 = ConvBNReLU(in_channels=in_features, out_channels=hidden_features, kernel_size=1)self.conv1 = ConvBNReLU(in_channels=hidden_features, out_channels=hidden_features, kernel_size=ksize,groups=hidden_features)self.conv2 = ConvBNReLU(in_channels=hidden_features, out_channels=hidden_features, kernel_size=3,groups=hidden_features)self.fc2 = ConvBN(in_channels=hidden_features, out_channels=out_features, kernel_size=1)self.act = act_layer()self.drop = nn.Dropout(drop)def forward(self, x):x = self.fc1(x)x1 = self.conv1(x)x2 = self.conv2(x)x = self.fc2(x1 + x2)x = self.act(x)return x
3. FFN 与 E_FFN 的区别

总结
- FFN 是一个基础的前馈神经网络,适用于处理一般的输入数据,如结构化数据或者经过预处理的特征。
- E_FFN 是对 FFN 的扩展,采用卷积操作使其能够更好地处理具有空间结构的输入数据,适合处理图像、视频或其他具有空间信息的任务。
交通运输、机电主题会议
第六届国际科技创新学术交流大会(IAECST 2024) 暨第四届物流系统与交通运输国际学术会议(LSTT 2024)
- 12月6-8日,广州
- 主办单位:IEEE PES智慧楼宇、负载和客户支持系统卫星技术委员会(中国)、华南理工大学、广东省艾思信息化学术交流研究院、艾思科蓝
- 院士主席团。IEEE出版,IEEE Xplore、EI检索。征集交通运输工程、交通信息与控制、交通规划与管理、载运工具运用工程、隧桥/道路与铁路工程、物流系统与信息化技术、航空/航海/港口水运主题论文
第四届机电一体化与智能控制国际学术会议(MIC 2024)
- 12月27-29日,南昌
- 主办单位:华东交通大学
- 前身为“智慧交通、能源与动力国际学术会议(STEP)”,多位国内外专家报告。多届论文已检索,本届征集机电一体化、智能控制。仪器仪表、电气、航空航天等论文
2024年智能船舶与机电系统国际学术会议(ICISES 2024)
- 12月27-29日,广州
- 主办单位:广州航海学院、广东海洋大学、重庆交通大学、集美大学
- IEEE出版,征集船舶工程、机电工程、控制系统、传感器、3D打印等主题论文。多位学科带头人、学院院长等作主讲报告
测绘遥感、地质主题会议
第三届地理信息与遥感技术国际学术会议(GIRST 2024)
- 11月29日-12月1日,意大利罗马
- 主办单位:罗马第三大学
- 多届IEEE/SPIE出版,完成EI检索。欧洲会议现正征集论文,含地理信息、测量与测绘、遥感等主题论文
2024年遥感技术与图像处理国际学术会议(RSTIP 2024)
- 11月29-12月1日,大理
- 支持单位:浙江海洋大学信息工程学院、苏州科技大学地理科学与测绘工程学院、阿卜杜勒阿齐兹国王大学
- 多位国内外专家报告。征集遥感技术、图像处理技术及其领域应用等主题论文
数学、力学、物理主题会议
第五届应用力学与机械工程国际学术会议(ICAMME 2024)
- 12月20-22日,长沙
- 多位国内外专家报告。征集力学、材料建模、机械工程、智能控制、材料力学、机电一体化等主题论文
欢迎宝子们点赞、关注、收藏!欢迎宝子们批评指正!
祝所有的硕博生都能遇到好的导师!好的审稿人!好的同门!顺利毕业!
相关文章:
【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分!
【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分! 【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神…...
【Qt】控件7
1.QTextEdit的简单使用 使用简单的QTextEdit,获取到的内容显示到标签上 使用textChanged信号 在槽函数中需要获取QTextEdit的内容,对应操作是: QString curorui->textEdit->toPlainText();然后显示到标签上,对应操作是: …...
F12抓包14_修改网页图片网页保存到本地
课程大纲 1、修改网页图片(2种方式二选一) 修改网页图片,需要定位到图片标签,修改<img>标签的属性。2种方法: 1. 修改为网络图片url。缺点:url失效,图片无法显示。 2. 修改为图片base64&a…...
源代码检测,内附实际案例
源代码安全审计是依据国标GB/T 34944-2017、GB/T 34944-2017,结合专业源代码扫描工具对各种程序语言编写的源代码进行安全审计。能够为客户提供包括安全编码规范咨询、源代码安全现状评测、定位源代码中存在的安全漏洞、分析漏洞风险、给出修改建议等一系列服务。 源…...
1138:将字符串中的小写字母转换成大写字母
【题目描述】 给定一个字符串,将其中所有的小写字母转换成大写字母。 【输入】 输入一行,包含一个字符串(长度不超过100,可能包含空格)。 【输出】 输出转换后的字符串。 【输入样例】 helloworld123Ha 【输出样例】…...
《C++ 人工智能模型邂逅云平台:集成之路的策略与要点全解析》
在当今数字化浪潮汹涌澎湃的时代,人工智能无疑是引领技术变革的核心力量。而 C以其卓越的性能和高效的资源利用,成为开发人工智能模型的有力武器。与此同时,云平台所提供的强大计算能力、灵活的存储资源以及便捷的服务部署,为人工…...
【ArcGISPro】Sentinel-2数据处理
错误 默认拉进去只组织了4个波段,但是实际有12个波段 解决方案 数据下载 Sentinel-2 数据下载-CSDN博客 数据处理 数据查看 创建镶嵌数据集 在数据管理工具箱中找到创建镶嵌数据集...
Unity中的简易TCP服务器/客户端
在本文中,我将向你介绍一个在Unity中实现的简单TCP服务器脚本,和一个简单的客户端脚本. 脚本 MyTcpServer 允许Unity应用创建一个TCP服务器,监听客户端的连接、异步处理客户端消息,并通过事件与Unity应用中的其他模块进行通信。 MyTcpServe…...
Spring Boot 3.4 正式发布,结构化日志!
1 从 Spring Boot 3.3 升级到 3.4 1.1 RestClient 和 RestTemplate 新增对 RestClient 和 RestTemplate 自动配置的支持,可用 Reactor Netty 的 HttpClient 或 JDK 的 HttpClient。支持的客户端优先级: Apache HTTP Components (HttpComponentsClient…...
技术文档,they are my collection!
工作 今天这篇文章,献给一直撰写技术文档的自己。我自认为是公司中最爱写文档的人了,我们是一个不到40人的小公司,公司作风没有多么严谨,领导也不会要求我们写技术文档。但是从入职初至今,我一直保持着写技术文档…...
详解Qt之QtMath Qt数学类
文章目录 QtMath详解前言QtMath简介QtMath中的函数1. 三角函数1.1 qSin1.2 qCos 2. 指数与对数函数2.1 qExp2.2 qLn 3. 幂运算与平方根3.1 qPow3.2 qSqrt QtMath的优势1. 一致性与跨平台支持2. 与Qt生态系统集成3. 简洁性 总结 QtMath详解 前言 在C的开发中,数学运…...
人工智能与人类:共创未来的新篇章
数年前,当人工智能还停留在实验室的时候,很少有人能想到它会如此迅速地融入我们的日常生活。如今,从手机上的语音助手,到自动驾驶汽车,从智能家居到医疗诊断,AI的身影无处不在。这让我想起了20世纪初电力普…...
4.6 JMeter HTTP信息头管理器
欢迎大家订阅【软件测试】 专栏,开启你的软件测试学习之旅! 文章目录 前言1 HTTP信息头管理器的位置2 常见的HTTP请求头3 添加 HTTP 信息头管理器4 应用场景 前言 在 JMeter 中,HTTP信息头管理器(HTTP Header Manager)…...
非交换几何与黎曼ζ函数:数学中的一场革命性对话
非交换几何与黎曼ζ函数:数学中的一场革命性对话 非交换几何(Noncommutative Geometry, NCG)是数学的一个分支领域,它将经典的几何概念扩展到非交换代数的框架中。非交换代数是一种结合代数,其中乘积不是交换性的&…...
【设计模式】【行为型模式(Behavioral Patterns)】之观察者模式(Observer Pattern)
1. 设计模式原理说明 观察者模式(Observer Pattern) 是一种行为设计模式,它定义了一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都会得到通知并自动更新。这种模式非常适合处理事件驱动系统&a…...
文件导入-使用java反射修改日期数据
文件导入时,时间类型通常不能直接导出,以下方法为批量处理类中日期类型转字符串类型。 Date/Datetime --> String(yyyy-mm-dd)Field[] declaredFields HrAviationstudentMonitorDTO.class.getDeclaredFields(); for (Field field : declaredFields) …...
【网络安全设备系列】10、安全审计系统
0x00 定义: 网络安全审计系统针对互联网行为提供有效的行为审计、内容审计、行为报警、行为控制及相关审计功能。从管理层面提供互联网的 有效监督,预防、制止数据泄密。满足用户对互联网行为审计备案及 安全保护措施的要求,提供完整的上网记录…...
Apache Maven Assembly 插件简介
Apache Maven Assembly 插件是一个强大的工具,允许您以多种格式(如 ZIP、TAR 和 JAR)创建项目的分发包。 该插件特别适用于将项目与其依赖项、配置文件和其他必要资源一起打包。 通过使用 Maven Assembly 插件,您可以将项目作为…...
ReentrantLock(可重入锁) Semaphore(信号量) CountDownLatch
目录 ReentrantLock(可重入锁) &Semaphore(信号量)&CountDownLatchReentrantLock(可重入锁)既然有了synchronized,为啥还要有ReentrantLock?Semaphore(信号量)如何确保线程安全呢?CountDownLatch ReentrantLock(可重入锁) &Semaphore(信号量…...
计算机网络习题解答--个人笔记(未完)
本篇文章为关于《计算机网络-自顶向下方法第七版》的阅读总结和课后习题解答(未完待续) 第二章: cookie:(这里是比较老版本的HTTP,具体HTTPs是怎么实现的不是很清楚)cookie的原理其实很简单。就是在HTTP消息头上又多…...
后进先出(LIFO)详解
LIFO 是 Last In, First Out 的缩写,中文译为后进先出。这是一种数据结构的工作原则,类似于一摞盘子或一叠书本: 最后放进去的元素最先出来 -想象往筒状容器里放盘子: (1)你放进的最后一个盘子(…...
Leetcode 3576. Transform Array to All Equal Elements
Leetcode 3576. Transform Array to All Equal Elements 1. 解题思路2. 代码实现 题目链接:3576. Transform Array to All Equal Elements 1. 解题思路 这一题思路上就是分别考察一下是否能将其转化为全1或者全-1数组即可。 至于每一种情况是否可以达到…...
Zustand 状态管理库:极简而强大的解决方案
Zustand 是一个轻量级、快速和可扩展的状态管理库,特别适合 React 应用。它以简洁的 API 和高效的性能解决了 Redux 等状态管理方案中的繁琐问题。 核心优势对比 基本使用指南 1. 创建 Store // store.js import create from zustandconst useStore create((set)…...
【HarmonyOS 5.0】DevEco Testing:鸿蒙应用质量保障的终极武器
——全方位测试解决方案与代码实战 一、工具定位与核心能力 DevEco Testing是HarmonyOS官方推出的一体化测试平台,覆盖应用全生命周期测试需求,主要提供五大核心能力: 测试类型检测目标关键指标功能体验基…...
Docker 运行 Kafka 带 SASL 认证教程
Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明:server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...
DAY 47
三、通道注意力 3.1 通道注意力的定义 # 新增:通道注意力模块(SE模块) class ChannelAttention(nn.Module):"""通道注意力模块(Squeeze-and-Excitation)"""def __init__(self, in_channels, reduction_rat…...
JVM垃圾回收机制全解析
Java虚拟机(JVM)中的垃圾收集器(Garbage Collector,简称GC)是用于自动管理内存的机制。它负责识别和清除不再被程序使用的对象,从而释放内存空间,避免内存泄漏和内存溢出等问题。垃圾收集器在Ja…...
使用van-uploader 的UI组件,结合vue2如何实现图片上传组件的封装
以下是基于 vant-ui(适配 Vue2 版本 )实现截图中照片上传预览、删除功能,并封装成可复用组件的完整代码,包含样式和逻辑实现,可直接在 Vue2 项目中使用: 1. 封装的图片上传组件 ImageUploader.vue <te…...
成都鼎讯硬核科技!雷达目标与干扰模拟器,以卓越性能制胜电磁频谱战
在现代战争中,电磁频谱已成为继陆、海、空、天之后的 “第五维战场”,雷达作为电磁频谱领域的关键装备,其干扰与抗干扰能力的较量,直接影响着战争的胜负走向。由成都鼎讯科技匠心打造的雷达目标与干扰模拟器,凭借数字射…...
零基础在实践中学习网络安全-皮卡丘靶场(第九期-Unsafe Fileupload模块)(yakit方式)
本期内容并不是很难,相信大家会学的很愉快,当然对于有后端基础的朋友来说,本期内容更加容易了解,当然没有基础的也别担心,本期内容会详细解释有关内容 本期用到的软件:yakit(因为经过之前好多期…...
