【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分!
【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分!
【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分!
文章目录
- 【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分!
- FFN 和 E_FFN 的作用与区别
- 1. FFN(前馈神经网络)
- 功能:
- 过程:
- 使用场景
- 代码示例:
- 2. E_FFN(增强型前馈神经网络)
- 功能:
- 过程:
- 使用场景:
- 代码示例:
- 3. FFN 与 E_FFN 的区别
- 总结
- 交通运输、机电主题会议
- 第六届国际科技创新学术交流大会(IAECST 2024) 暨第四届物流系统与交通运输国际学术会议(LSTT 2024)
- 第四届机电一体化与智能控制国际学术会议(MIC 2024)
- 2024年智能船舶与机电系统国际学术会议(ICISES 2024)
- 测绘遥感、地质主题会议
- 第三届地理信息与遥感技术国际学术会议(GIRST 2024)
- 2024年遥感技术与图像处理国际学术会议(RSTIP 2024)
- 数学、力学、物理主题会议
- 第五届应用力学与机械工程国际学术会议(ICAMME 2024)

欢迎宝子们点赞、关注、收藏!欢迎宝子们批评指正!
祝所有的硕博生都能遇到好的导师!好的审稿人!好的同门!顺利毕业!
大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文:
可访问艾思科蓝官网,浏览即将召开的学术会议列表。会议入口:https://ais.cn/u/mmmiUz
FFN 和 E_FFN 的作用与区别
1. FFN(前馈神经网络)
功能:
FFN 是一种基础的全连接前馈神经网络。它由两层全连接层(Linear Layer)和一个激活函数(GELU)组成,通常用于神经网络的中间层进行非线性变换,增加模型的表达能力。
过程:
- 输入通过第一层全连接层(fc1)将输入的特征维度 in_features 映射 hidden_features。
- 然后经过激活函数(act),此处使用的是 GELU 激活函数,进行非线性变换。
- 然后通过第二层全连接层(fc2)将特征维度从 hidden_features 映射回 out_features。
- 最后,可能会应用 Dropout 来避免过拟合。
使用场景
FFN 在许多深度学习模型中作为基础模块,广泛应用于Transformer架构、MLP(多层感知器)等结构中,主要用于处理非线性关系和高维特征之间的映射。
代码示例:
class FFN(nn.Module):def __init__(self, in_features, hidden_features=None, out_features=None, drop=0.):super(FFN, self).__init__()out_features = out_features or in_featureshidden_features = hidden_features or in_features# 第一层全连接层self.fc1 = nn.Linear(in_features, hidden_features) # in_features = 512, hidden_features = 128# 激活函数 (使用GELU)self.act = nn.GELU()# 第二层全连接层self.fc2 = nn.Linear(hidden_features, out_features) # hidden_features = 128, out_features = 512# Dropout层self.drop = nn.Dropout(drop)def forward(self, x):x = self.fc1(x) # 输入经过第一层x = self.act(x) # 激活函数x = self.fc2(x) # 输入经过第二层x = self.drop(x) # 如果drop值大于0,应用dropoutreturn x
2. E_FFN(增强型前馈神经网络)
功能:
E_FFN 是对 FFN 的增强版本,通过卷积层和批归一化层增强其能力。与 FFN 主要依赖全连接层不同,E_FFN 引入了卷积操作,使其更适合处理空间结构数据(如图像或多维特征)。
过程:
- fc1 是一个卷积操作(ConvBNReLU),通过 1x1 卷积层将输入的通道数 in_channels 映射到 hidden_channels,并进行批归一化和激活。
- conv1 和 conv2 是基于输入特征的卷积操作,使用不同的卷积核大小(ksize 和 3x3)进行处理。
- 最后通过 fc2 将卷积操作的结果映射回 out_features,并通过激活函数(如 ReLU6)进行非线性变换。
使用场景:
E_FFN 是 FFN 的改进版本,特别适用于具有空间特征的任务(如图像处理、语义分割等),因为它使用了卷积操作,可以捕捉空间结构信息和局部特征。
代码示例:
class E_FFN(nn.Module):def __init__(self, in_features, hidden_features=None, out_features=None, ksize=5, act_layer=nn.ReLU6, drop=0.):super(E_FFN, self).__init__()out_features = out_features or in_featureshidden_features = hidden_features or in_featuresself.fc1 = ConvBNReLU(in_channels=in_features, out_channels=hidden_features, kernel_size=1)self.conv1 = ConvBNReLU(in_channels=hidden_features, out_channels=hidden_features, kernel_size=ksize,groups=hidden_features)self.conv2 = ConvBNReLU(in_channels=hidden_features, out_channels=hidden_features, kernel_size=3,groups=hidden_features)self.fc2 = ConvBN(in_channels=hidden_features, out_channels=out_features, kernel_size=1)self.act = act_layer()self.drop = nn.Dropout(drop)def forward(self, x):x = self.fc1(x)x1 = self.conv1(x)x2 = self.conv2(x)x = self.fc2(x1 + x2)x = self.act(x)return x
3. FFN 与 E_FFN 的区别

总结
- FFN 是一个基础的前馈神经网络,适用于处理一般的输入数据,如结构化数据或者经过预处理的特征。
- E_FFN 是对 FFN 的扩展,采用卷积操作使其能够更好地处理具有空间结构的输入数据,适合处理图像、视频或其他具有空间信息的任务。
交通运输、机电主题会议
第六届国际科技创新学术交流大会(IAECST 2024) 暨第四届物流系统与交通运输国际学术会议(LSTT 2024)
- 12月6-8日,广州
- 主办单位:IEEE PES智慧楼宇、负载和客户支持系统卫星技术委员会(中国)、华南理工大学、广东省艾思信息化学术交流研究院、艾思科蓝
- 院士主席团。IEEE出版,IEEE Xplore、EI检索。征集交通运输工程、交通信息与控制、交通规划与管理、载运工具运用工程、隧桥/道路与铁路工程、物流系统与信息化技术、航空/航海/港口水运主题论文
第四届机电一体化与智能控制国际学术会议(MIC 2024)
- 12月27-29日,南昌
- 主办单位:华东交通大学
- 前身为“智慧交通、能源与动力国际学术会议(STEP)”,多位国内外专家报告。多届论文已检索,本届征集机电一体化、智能控制。仪器仪表、电气、航空航天等论文
2024年智能船舶与机电系统国际学术会议(ICISES 2024)
- 12月27-29日,广州
- 主办单位:广州航海学院、广东海洋大学、重庆交通大学、集美大学
- IEEE出版,征集船舶工程、机电工程、控制系统、传感器、3D打印等主题论文。多位学科带头人、学院院长等作主讲报告
测绘遥感、地质主题会议
第三届地理信息与遥感技术国际学术会议(GIRST 2024)
- 11月29日-12月1日,意大利罗马
- 主办单位:罗马第三大学
- 多届IEEE/SPIE出版,完成EI检索。欧洲会议现正征集论文,含地理信息、测量与测绘、遥感等主题论文
2024年遥感技术与图像处理国际学术会议(RSTIP 2024)
- 11月29-12月1日,大理
- 支持单位:浙江海洋大学信息工程学院、苏州科技大学地理科学与测绘工程学院、阿卜杜勒阿齐兹国王大学
- 多位国内外专家报告。征集遥感技术、图像处理技术及其领域应用等主题论文
数学、力学、物理主题会议
第五届应用力学与机械工程国际学术会议(ICAMME 2024)
- 12月20-22日,长沙
- 多位国内外专家报告。征集力学、材料建模、机械工程、智能控制、材料力学、机电一体化等主题论文
欢迎宝子们点赞、关注、收藏!欢迎宝子们批评指正!
祝所有的硕博生都能遇到好的导师!好的审稿人!好的同门!顺利毕业!
相关文章:
【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分!
【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神经网络)是transformer特征增强的重要组成部分! 【深度学习|特征增强模块】FFN(前馈神经网络)和E_FFN(增强型前馈神…...
【Qt】控件7
1.QTextEdit的简单使用 使用简单的QTextEdit,获取到的内容显示到标签上 使用textChanged信号 在槽函数中需要获取QTextEdit的内容,对应操作是: QString curorui->textEdit->toPlainText();然后显示到标签上,对应操作是: …...
F12抓包14_修改网页图片网页保存到本地
课程大纲 1、修改网页图片(2种方式二选一) 修改网页图片,需要定位到图片标签,修改<img>标签的属性。2种方法: 1. 修改为网络图片url。缺点:url失效,图片无法显示。 2. 修改为图片base64&a…...
源代码检测,内附实际案例
源代码安全审计是依据国标GB/T 34944-2017、GB/T 34944-2017,结合专业源代码扫描工具对各种程序语言编写的源代码进行安全审计。能够为客户提供包括安全编码规范咨询、源代码安全现状评测、定位源代码中存在的安全漏洞、分析漏洞风险、给出修改建议等一系列服务。 源…...
1138:将字符串中的小写字母转换成大写字母
【题目描述】 给定一个字符串,将其中所有的小写字母转换成大写字母。 【输入】 输入一行,包含一个字符串(长度不超过100,可能包含空格)。 【输出】 输出转换后的字符串。 【输入样例】 helloworld123Ha 【输出样例】…...
《C++ 人工智能模型邂逅云平台:集成之路的策略与要点全解析》
在当今数字化浪潮汹涌澎湃的时代,人工智能无疑是引领技术变革的核心力量。而 C以其卓越的性能和高效的资源利用,成为开发人工智能模型的有力武器。与此同时,云平台所提供的强大计算能力、灵活的存储资源以及便捷的服务部署,为人工…...
【ArcGISPro】Sentinel-2数据处理
错误 默认拉进去只组织了4个波段,但是实际有12个波段 解决方案 数据下载 Sentinel-2 数据下载-CSDN博客 数据处理 数据查看 创建镶嵌数据集 在数据管理工具箱中找到创建镶嵌数据集...
Unity中的简易TCP服务器/客户端
在本文中,我将向你介绍一个在Unity中实现的简单TCP服务器脚本,和一个简单的客户端脚本. 脚本 MyTcpServer 允许Unity应用创建一个TCP服务器,监听客户端的连接、异步处理客户端消息,并通过事件与Unity应用中的其他模块进行通信。 MyTcpServe…...
Spring Boot 3.4 正式发布,结构化日志!
1 从 Spring Boot 3.3 升级到 3.4 1.1 RestClient 和 RestTemplate 新增对 RestClient 和 RestTemplate 自动配置的支持,可用 Reactor Netty 的 HttpClient 或 JDK 的 HttpClient。支持的客户端优先级: Apache HTTP Components (HttpComponentsClient…...
技术文档,they are my collection!
工作 今天这篇文章,献给一直撰写技术文档的自己。我自认为是公司中最爱写文档的人了,我们是一个不到40人的小公司,公司作风没有多么严谨,领导也不会要求我们写技术文档。但是从入职初至今,我一直保持着写技术文档…...
详解Qt之QtMath Qt数学类
文章目录 QtMath详解前言QtMath简介QtMath中的函数1. 三角函数1.1 qSin1.2 qCos 2. 指数与对数函数2.1 qExp2.2 qLn 3. 幂运算与平方根3.1 qPow3.2 qSqrt QtMath的优势1. 一致性与跨平台支持2. 与Qt生态系统集成3. 简洁性 总结 QtMath详解 前言 在C的开发中,数学运…...
人工智能与人类:共创未来的新篇章
数年前,当人工智能还停留在实验室的时候,很少有人能想到它会如此迅速地融入我们的日常生活。如今,从手机上的语音助手,到自动驾驶汽车,从智能家居到医疗诊断,AI的身影无处不在。这让我想起了20世纪初电力普…...
4.6 JMeter HTTP信息头管理器
欢迎大家订阅【软件测试】 专栏,开启你的软件测试学习之旅! 文章目录 前言1 HTTP信息头管理器的位置2 常见的HTTP请求头3 添加 HTTP 信息头管理器4 应用场景 前言 在 JMeter 中,HTTP信息头管理器(HTTP Header Manager)…...
非交换几何与黎曼ζ函数:数学中的一场革命性对话
非交换几何与黎曼ζ函数:数学中的一场革命性对话 非交换几何(Noncommutative Geometry, NCG)是数学的一个分支领域,它将经典的几何概念扩展到非交换代数的框架中。非交换代数是一种结合代数,其中乘积不是交换性的&…...
【设计模式】【行为型模式(Behavioral Patterns)】之观察者模式(Observer Pattern)
1. 设计模式原理说明 观察者模式(Observer Pattern) 是一种行为设计模式,它定义了一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都会得到通知并自动更新。这种模式非常适合处理事件驱动系统&a…...
文件导入-使用java反射修改日期数据
文件导入时,时间类型通常不能直接导出,以下方法为批量处理类中日期类型转字符串类型。 Date/Datetime --> String(yyyy-mm-dd)Field[] declaredFields HrAviationstudentMonitorDTO.class.getDeclaredFields(); for (Field field : declaredFields) …...
【网络安全设备系列】10、安全审计系统
0x00 定义: 网络安全审计系统针对互联网行为提供有效的行为审计、内容审计、行为报警、行为控制及相关审计功能。从管理层面提供互联网的 有效监督,预防、制止数据泄密。满足用户对互联网行为审计备案及 安全保护措施的要求,提供完整的上网记录…...
Apache Maven Assembly 插件简介
Apache Maven Assembly 插件是一个强大的工具,允许您以多种格式(如 ZIP、TAR 和 JAR)创建项目的分发包。 该插件特别适用于将项目与其依赖项、配置文件和其他必要资源一起打包。 通过使用 Maven Assembly 插件,您可以将项目作为…...
ReentrantLock(可重入锁) Semaphore(信号量) CountDownLatch
目录 ReentrantLock(可重入锁) &Semaphore(信号量)&CountDownLatchReentrantLock(可重入锁)既然有了synchronized,为啥还要有ReentrantLock?Semaphore(信号量)如何确保线程安全呢?CountDownLatch ReentrantLock(可重入锁) &Semaphore(信号量…...
计算机网络习题解答--个人笔记(未完)
本篇文章为关于《计算机网络-自顶向下方法第七版》的阅读总结和课后习题解答(未完待续) 第二章: cookie:(这里是比较老版本的HTTP,具体HTTPs是怎么实现的不是很清楚)cookie的原理其实很简单。就是在HTTP消息头上又多…...
JavaSec-RCE
简介 RCE(Remote Code Execution),可以分为:命令注入(Command Injection)、代码注入(Code Injection) 代码注入 1.漏洞场景:Groovy代码注入 Groovy是一种基于JVM的动态语言,语法简洁,支持闭包、动态类型和Java互操作性,…...
k8s从入门到放弃之Ingress七层负载
k8s从入门到放弃之Ingress七层负载 在Kubernetes(简称K8s)中,Ingress是一个API对象,它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress,你可…...
k8s业务程序联调工具-KtConnect
概述 原理 工具作用是建立了一个从本地到集群的单向VPN,根据VPN原理,打通两个内网必然需要借助一个公共中继节点,ktconnect工具巧妙的利用k8s原生的portforward能力,简化了建立连接的过程,apiserver间接起到了中继节…...
智能仓储的未来:自动化、AI与数据分析如何重塑物流中心
当仓库学会“思考”,物流的终极形态正在诞生 想象这样的场景: 凌晨3点,某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径;AI视觉系统在0.1秒内扫描包裹信息;数字孪生平台正模拟次日峰值流量压力…...
JVM暂停(Stop-The-World,STW)的原因分类及对应排查方案
JVM暂停(Stop-The-World,STW)的完整原因分类及对应排查方案,结合JVM运行机制和常见故障场景整理而成: 一、GC相关暂停 1. 安全点(Safepoint)阻塞 现象:JVM暂停但无GC日志,日志显示No GCs detected。原因:JVM等待所有线程进入安全点(如…...
JVM 内存结构 详解
内存结构 运行时数据区: Java虚拟机在运行Java程序过程中管理的内存区域。 程序计数器: 线程私有,程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都依赖这个计数器完成。 每个线程都有一个程序计数…...
LangChain知识库管理后端接口:数据库操作详解—— 构建本地知识库系统的基础《二》
这段 Python 代码是一个完整的 知识库数据库操作模块,用于对本地知识库系统中的知识库进行增删改查(CRUD)操作。它基于 SQLAlchemy ORM 框架 和一个自定义的装饰器 with_session 实现数据库会话管理。 📘 一、整体功能概述 该模块…...
Selenium常用函数介绍
目录 一,元素定位 1.1 cssSeector 1.2 xpath 二,操作测试对象 三,窗口 3.1 案例 3.2 窗口切换 3.3 窗口大小 3.4 屏幕截图 3.5 关闭窗口 四,弹窗 五,等待 六,导航 七,文件上传 …...
CppCon 2015 学习:Time Programming Fundamentals
Civil Time 公历时间 特点: 共 6 个字段: Year(年)Month(月)Day(日)Hour(小时)Minute(分钟)Second(秒) 表示…...
SQL进阶之旅 Day 22:批处理与游标优化
【SQL进阶之旅 Day 22】批处理与游标优化 文章简述(300字左右) 在数据库开发中,面对大量数据的处理任务时,单条SQL语句往往无法满足性能需求。本篇文章聚焦“批处理与游标优化”,深入探讨如何通过批量操作和游标技术提…...
