ICLR 2022—你不应该错过的 10 篇论文(下)
CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理
ICLR 2023已经放榜,但是今天我们先来回顾一下去年的ICLR 2022!
ICLR 2022将于2022年 4 月 25 日星期一至 4 月 29 日星期五在线举行(连续第三年!)。它是机器学习研究领域规模最大、最受欢迎的会议之一,它汇集了超过 1000 篇论文、19 个研讨会和 8 个特邀报告。主题涵盖 ML 理论、强化学习 (RL)、计算机视觉 (CV) )、自然语言处理 (NLP)、神经科学等等。如果我们想要对这一庞大的内容阵容有所了解,就必须进行挑选,我们已经根于现有信息,挑选出10篇最能激起我们兴趣的论文。事不宜迟,快来看看吧!
6.Exploring the Limits of Large Scale Pre-training
标题: 探索大规模预训练的极限
作者:Samira Abnar、Mostafa Dehghani、Behnam Neyshabur、Hanie Sedghi
文章链接:https://openreview.net/forum?id=V3C8p78sDa
作者的 TL;DR
我们对具有广泛下游任务的图像识别中的小样本和迁移学习的大规模预训练的局限性进行了系统研究。对具有广泛下游任务的图像识别中的小样本和迁移学习的大规模预训练的局限性进行了系统研究。
关键见解
“As we increase the upstream accuracy, the performance of downstream tasks saturates”研究了上游 (US) 任务(例如大规模 ImageNet 标签)的预训练性能如何转移到下游 (DS) 性能(例如鲸鱼检测)。然后对很多架构和规模做这个实验:很多意思是很多:“在 Vision Transformers、MLP-Mixers 和 ResNets 上进行了 4800 次实验,参数数量从一千万到一百亿不等,在最大规模的可用图像数据上进行了训练”。因此,有趣的图代表了上游性能(美国,预训练)和下游性能(DS,结束任务)之间的关联。几乎全面,它最终会饱和。尽管如此,看到计算机视觉体系结构之间的差异还是非常有趣的!
作者声称,他们的观察总体上似乎对上游数据的大小或训练镜头的数量以及架构选择等选择具有稳健性。他们还探讨了超参数选择的影响:是否有一些超参数对美国非常好但不能很好地转化为 DS?是的!他们在第 4 节中深入研究了这一现象,发现例如,权重衰减是一个特别显着的超参数,它对 US 和 DS 性能的影响不同。在没有人真正从头开始训练模型而是选择预训练模型来引导其应用的情况下,这项研究是关键。这篇论文的内容远远超过几段可以概括的内容,如果您想深入了解,绝对值得一读!
7. Language modeling via stochastic processes
标题: 通过随机过程进行语言建模
作者:Rose E Wang, Esin Durmus, Noah Goodman, Tatsunori Hashimoto
文章链接:https://openreview.net/forum?id=pMQwKL1yctf
作者的 TL;DR
我们介绍了一种通过潜在随机过程隐式计划的语言模型。现代大型生成语言模型非常擅长编写短文本,但当它们生成长文本时,往往会失去全局连贯性,事情就不再有意义了。本文提出了一种缓解这种情况的方法
关键见解
典型语言模型 (LM) 仅在令牌粒度级别生成文本,这严重偏向模型学习短程交互而不是远程交互,这正是实现连贯全局所需的技能叙述。这项工作建议在较粗略的句子层次上对语言进行建模,作为一个随机过程,引导 LM 生成在全球范围内保持一致。所提出的模型称为时间控制,它将句子表示建模为潜在空间中的布朗运动。对于训练,给定两个开始和结束锚句,通过使锚句内的正句子落入潜在空间中锚句表示的“布朗桥”内,然后使用负样本来设置对比损失被推出(图 1)。我之前也不知道布朗桥是什么:起点和终点位置固定的布朗(摇晃)轨迹。为了进行推理,通过从潜在空间中的布朗过程中采样生成句子级别的计划,然后以该高级计划为条件生成标记级别的语言(图 2)。
结果非常有趣,尤其是在话语连贯性准确性方面,时间控制是其中的亮点。这项工作提出了一个有前途的方向,可以让 LM 克服经典限制,而无需进入万亿参数尺度体系。
8. Coordination Among Neural Modules Through Shared Global Workspace
标题: 通过共享的全局工作空间协调神经模块
作者:Anirudh Goyal、Aniket Didolkar、Alex Lamb、Kartikeya Badola
文章链接:https://openreview.net/forum?id=XzTtHjgPDsT
作者的 TL;DR
不同专家之间的交流使用共享工作空间,允许更高阶的交互。受大脑启发的模块化神经架构正在兴起;尽管他们在流行的计算机视觉或自然语言处理基准测试中缺乏成功,但他们在稳健性、域外泛化甚至学习因果机制方面都显示出可喜的成果。
关键见解
全球工作空间理论 (GWT) 是一种拟议的认知架构,用于解释人类有意识和无意识思维过程的表现方式。它的核心假设之一是存在一个所有专业模块都可以访问的共享工作区,从而实现其他孤立模块之间的一致性。本文概念化了一种神经网络架构,其中一组输入由专家神经网络处理,然后写入共享工作区——一组向量——然后再次广播给专家。这听起来可能比实际情况更奇特。例如,想象一个处理输入序列的 Transformer,您可以将位置操作概念化为专家。共享工作区对允许在共享全局工作区中更新多少更新的隐藏状态施加了一个条件,施加了一定程度的稀疏性,这已被证明可以提高稳健性和域外泛化。
与这类作品一样,它们在不太流行的任务和评估模式上表现良好,但在域内评估方面不会优于单体网络,因此它们不会成为许多头条新闻。不过,这是一个非常有趣的工作线,值得关注。
9. Learning Fast, Learning Slow: A General Continual Learning Method based on Complementary Learning System
标题: 学快,学慢:一种基于互补学习系统的通用持续学习方法
作者:Elahe Arani、Fahad Sarfraz 和 Bahram Zonooz
文章链接:https://openreview.net/forum?id=uxxFrDwrE7Y
作者的 TL;DR
一种双重记忆体验重播方法,旨在模仿快速学习和慢速学习机制之间的相互作用,以在 DNN 中实现有效的 CL。丹尼尔·卡尼曼 (Daniel Kahneman) 推广的人类思维模式的二分法——快和慢——是人类思维方式的核心。本文从这个想法中汲取灵感,构建了一个利用快速和慢速学习来改进持续学习的架构。
关键见解
持续学习是一种让模型通过将其暴露于新数据或与动态环境交互来逐渐扩展其知识的方法。举个例子,考虑一个模型,它最初只学习用 0 到 7 的数字对图像进行分类,然后被教导识别数字 8 和 9,而不会忘记前面的数字。目标是能够利用现有知识更有效地学习新事物,就像人类一样。为此,本文提出了一种针对 2 个时间尺度的记忆体验重放系统:长时间和短时间。主要创新之一是语义记忆的使用:两个神经网络代表可塑性和稳定模型。为了实现快速和短期学习,稳定模型由快速模型的指数移动平均值组成:这使得两个模型具有一致的权重,但稳定模型的演化比塑料模型更慢、更平滑,塑料模型对变化更敏感最新数据。该技术已用于其他设置,例如 BYOL⁵ 等对比学习。储存库充当情景记忆,保留数据流样本,从而减轻灾难性遗忘。
实验在 3 个任务上表现出色:
-
类增量学习:在分类设置中逐渐添加新类。
-
域增量学习:在不添加新类的情况下引入数据的分布变化。
-
一般增量学习:将模型暴露给新类实例和数据的快速分布,例如 MNIST 分类任务中的旋转数字。
10. Autonomous Reinforcement Learning: Formalism and Benchmarking
标题: 自主强化学习:形式主义和基准测试
作者:Archit Sharma、Kelvin Xu、Nikhil Sardana、Abhishek Gupta
文章链接:https://openreview.net/forum?id=nkaba3ND7B5
作者的 TL;DR
大多数 RL 基准测试都是偶发的:代理通过在每次代理失败时完全重新启动的环境中执行任务来学习。人类很少在这种情况下学习:当我们重新尝试做某事时,环境不会重新启动!如果机器人注定要出现在现实世界中,为什么我们仍然在情景基准测试中评估大多数 RL 算法?
关键见解
这项工作提出了一个专注于非情景强化学习的基准,作者将其称为自主强化学习环境 (EARL),希望它与现实世界相似。从技术上讲,EARL 是良好的旧 RL 的一个子集,其中环境随着代理与其交互而不断发展,而不是在每一集结束时重置。然而,这在实践中很少完成,因此这项工作通过建立形式主义(例如,学习代理、环境、奖励、政策评估、干预等概念的定义和数学公式)奠定了基础。您可以在他们的项目页面上找到这项工作的概述,并且已经开始使用基准通过从 GitHub 克隆基准存储库来评估您的算法。
更多Ai资讯:公主号AiCharm
相关文章:

ICLR 2022—你不应该错过的 10 篇论文(下)
CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 ICLR 2023已经放榜,但是今天我们先来回顾一下去年的ICLR 2022! ICLR 2022将于2022年 4 月 25 日星期一至 4 月 29 日星期五在线举行(连续第三年!&#x…...
国内外优秀程序员的私域博客大全
文章目录 国内外优秀程序员的私域博客大全**国内的优秀程序员****国外的优秀程序员**结语国内外优秀程序员的私域博客大全 国内的优秀程序员 1、风雪之隅-惠新宸 擅长领域:PHP、PECL等 Laruance惠新宸——国内最有影响力的PHP技术专家,PHP开发组核心成员, Zend顾问, PHP7及…...
【C++ Primer Plus】第六章:分支语句和逻辑运算符
文章目录第六章 分支语句和逻辑运算符6.1 字符函数库cctype6.2 ?:运算符6.3 读取数字的输入6.4 cin的处理过程char类型intdoublechar数组使用char数组来存储输入6.5 写入到文本文件中6.6 读取文本文件6.7 总结第六章 分支语句和逻辑运算符 6.1 字符函数库cctype C从C语言继承…...
堡垒机的主要功能是什么?为什么需要堡垒机?
堡垒机是一种用于管理和控制服务器的工具,其主要功能是为管理人员提供安全、便捷的远程管理和操作方式。为什么需要堡垒机呢?下面我们将详细阐述堡垒机的主要功能和必要性。 一、堡垒机的主要功能: ①、用户认证和授权管理:堡垒机…...
记录spring中Transactional事务注解失效的六个场景
记录spring中Transactional事务注解失效的六个场景 方法内的自调用 原因:通过this内部调用其他带有Transactional注解的方法,是通过this进行调用,并没有通过cglib代理对象进行调用,导致方法未被增强导致无法检测内部事务 解决方…...

【23种设计模式】行为型模式详细介绍(下)
前言 本文为 【23种设计模式】行为型模式 相关内容介绍,下边将对访问者模式,模板模式,策略模式,状态模式,观察者模式,备忘录模式,中介者模式,迭代器模式,解释器模式&…...

dbeaver工具连接达梦数据库
、一 概述 DBeaver 是一个基于 Java 开发,免费开源的通用数据库管理和开发,DBeaver 采用 Eclipse 框架开发,支持插件扩展,并且提供了许多数据库管理工具:ER 图、数据导入/导出、数据库比较、模拟数据生成等࿰…...

比Teambition、Worktile 更适合研发团队的几大工具盘点
Worktile 和 Teambitiom 哪个更好?两个产品各有特点。1.Teambition 优势:操作简单、个人版永不收费、更适合小型团队;2.Teambition 劣势:无法满足中大型团队复杂的项目管理、自定义能力弱、无法与钉钉以外的工具打通等;…...
matlab图像处理常用功能以及函数
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言一、matlab灰度处理相关二、形态学的一些函数1.腐蚀2.膨胀3.开运算4.闭运算三、其他一些可能会用到的方法1.使用hough进行直线检测2.圆检测3.闭合形状检测4.寻找…...
eBPF 之 ProgramType、AttachType和InputContext
1. ProgramType 定义定义在 include/uapi/linux/bpf.h 文件中,不同 Linux 版本会有变化,以下是 Linux 5.19 版本定义:enum bpf_prog_type {BPF_PROG_TYPE_UNSPEC,BPF_PROG_TYPE_SOCKET_FILTER,BPF_PROG_TYPE_KPROBE,BPF_PROG_TYPE_SCHED_CLS,…...
C++运行时类型识别RTTI
C技能 runtime type identification(RTTI) 运行时类型识别在使用多态的时候经常用到。本文将会介绍RTTI的几个特征。1. 运行时类型转换下面的程序模仿了dynamic_cast<type_id>()类型转化符号,根据每个类的id来判断当前的类型,如果id不匹配…...

idea多时编辑多行-winmac都支持
1背景介绍 idea编辑器非常强大,其中一个功能非常优秀,很多程序员也非常喜欢用。这个功能能够大大大提高工作效率-------------多行代码同时编辑 2win 2.1方法1 按住alt鼠标左键上/下拖动即可 这样选中多行后,可以直接多行编辑。 优点&a…...

BI是报表?BI是可视化?BI到底是什么?
很多企业认为只要买一个前端商业智能BI分析工具就可以解决企业级的商业智能BI所有问题,这个看法实际上也不可行的。可能在最开始分析场景相对简单,对接数据的复杂度不是很高的情况下这类商业智能BI分析工具没有问题。但是在企业的商业智能BI项目建设有一…...
Python基础-数据类型之元组
一、元组的定义 nums (1, 2, 3, 4, 5) 元组是序列的其中一种,每个元素都以逗号分隔,用()包围。 当元组中只有一个元素时,需要在元素后面加逗号分隔,nums (1,),否则括号会被当成运算符 nums (1) print(type(nums…...

大数据面试小抄
项目地址:https://github.com/GTyingzi/BigDATA 该项目是自己在学习大数据过程中整理、总结下来的一份面试小抄。涵盖Hadoop、Spark、Flink、Hive、HBae、Kafka、ES、Zookeeper等。 开源给大家,若感觉不错欢迎star~ 摘取Flink部分如下文章目录FlinkFli…...
Vue:(三十一)Vue封装的过度与动画
上一篇订阅与发布不够过瘾,接着再来一篇,come on!!!作用:在插入、更新或移除DOM元素时,在合适的时候给元素添加样式类名写法:过度:元素进入的样式:v-enter&am…...
文本处理:字符串替换
方法1:str.replace str.replace(old, new[, count]) Return a copy of the string with all occurrences of substring old replaced by new. If the optional argument count is given, only the first count occurrences are replaced. 该方法逻辑大致如下所示&am…...

python 调用 dll 出现精度问题
问题:python 在调用dll 的时候出现了精度问题 总结:使用decimal库进行转换就可以正常传递。 ‘ 心急的朋友可以略过下文了。 心急的朋友可以略过下文了。 心急的朋友可以略过下文了。 心急的朋友可以略过下文了。 ’ 遇到的问题具体情况 dll 生成函数…...

STL讲解——模拟实现string
STL讲解——模拟实现string 经典的string类问题 大厂在面试中,面试官总喜欢让学生自己来模拟实现string类,最主要是实现string类的增、删、查、改、构造、拷贝构造、赋值运算符重载以及析构函数。大家看下自己可不可以写一个string类? cla…...

CDH 6.3.2 升级Hive 2.3.9
升级背景 DolphinScheduler 3.1.1安装好后,其源码中集成的是Hive 2.1.1,版本太低,当在数据中心连接Hive数据源时报错,所以升级CDH自带的Hive为2.3.9版本。 一、准备工作 1、下载hive2.3.9并解压 下载地址:http://a…...
conda相比python好处
Conda 作为 Python 的环境和包管理工具,相比原生 Python 生态(如 pip 虚拟环境)有许多独特优势,尤其在多项目管理、依赖处理和跨平台兼容性等方面表现更优。以下是 Conda 的核心好处: 一、一站式环境管理:…...
【Linux】shell脚本忽略错误继续执行
在 shell 脚本中,可以使用 set -e 命令来设置脚本在遇到错误时退出执行。如果你希望脚本忽略错误并继续执行,可以在脚本开头添加 set e 命令来取消该设置。 举例1 #!/bin/bash# 取消 set -e 的设置 set e# 执行命令,并忽略错误 rm somefile…...

边缘计算医疗风险自查APP开发方案
核心目标:在便携设备(智能手表/家用检测仪)部署轻量化疾病预测模型,实现低延迟、隐私安全的实时健康风险评估。 一、技术架构设计 #mermaid-svg-iuNaeeLK2YoFKfao {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg…...
多模态商品数据接口:融合图像、语音与文字的下一代商品详情体验
一、多模态商品数据接口的技术架构 (一)多模态数据融合引擎 跨模态语义对齐 通过Transformer架构实现图像、语音、文字的语义关联。例如,当用户上传一张“蓝色连衣裙”的图片时,接口可自动提取图像中的颜色(RGB值&…...

DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
前一阵子在百度 AI 开发者大会上,看到基于小智 AI DIY 玩具的演示,感觉有点意思,想着自己也来试试。 如果只是想烧录现成的固件,乐鑫官方除了提供了 Windows 版本的 Flash 下载工具 之外,还提供了基于网页版的 ESP LA…...

有限自动机到正规文法转换器v1.0
1 项目简介 这是一个功能强大的有限自动机(Finite Automaton, FA)到正规文法(Regular Grammar)转换器,它配备了一个直观且完整的图形用户界面,使用户能够轻松地进行操作和观察。该程序基于编译原理中的经典…...
在web-view 加载的本地及远程HTML中调用uniapp的API及网页和vue页面是如何通讯的?
uni-app 中 Web-view 与 Vue 页面的通讯机制详解 一、Web-view 简介 Web-view 是 uni-app 提供的一个重要组件,用于在原生应用中加载 HTML 页面: 支持加载本地 HTML 文件支持加载远程 HTML 页面实现 Web 与原生的双向通讯可用于嵌入第三方网页或 H5 应…...
React---day11
14.4 react-redux第三方库 提供connect、thunk之类的函数 以获取一个banner数据为例子 store: 我们在使用异步的时候理应是要使用中间件的,但是configureStore 已经自动集成了 redux-thunk,注意action里面要返回函数 import { configureS…...

NXP S32K146 T-Box 携手 SD NAND(贴片式TF卡):驱动汽车智能革新的黄金组合
在汽车智能化的汹涌浪潮中,车辆不再仅仅是传统的交通工具,而是逐步演变为高度智能的移动终端。这一转变的核心支撑,来自于车内关键技术的深度融合与协同创新。车载远程信息处理盒(T-Box)方案:NXP S32K146 与…...

stm32wle5 lpuart DMA数据不接收
配置波特率9600时,需要使用外部低速晶振...