当前位置: 首页 > news >正文

【讲座分享】| 复旦大学张奇教授——《自然语言发表论文如何打怪升级?NLP顶会论文发表》

文章目录

  • 1 基础关
    • 1.1 基础书籍
    • 1.2 提高书籍
    • 1.3 课程链接
    • 1.4 编程实战
  • 2 阅读关
    • 2.1 分层过滤
    • 2.2 集团作战,信息获取
    • 2.3 论文如何泛读
  • 3 动机 方向关
    • 3.1 快速发论文
    • 3.2 好的研究
  • 4 写作关
    • 4.1 论文写作流程
    • 4.2 从读者角度出发
    • 4.3 每一部分怎么写
      • 4.3.1 Abstract摘要
      • 4.3.2 Introduction 介绍
      • 其他
      • 4.3.3 实验设计

今天听了~复旦大学张奇教授的报告——《自然语言发表论文如何打怪升级?自然语言顶会论文发表》内容,我觉得收获很大,实际上我在听报告之前并不知道张奇教授竟然就是我前段时间阅读的一本自然语言书籍《大规模语言模型,从理论到实践》的作者,听报告的时候才发现,属实有点惊喜哈哈哈

张奇教授将论文最后的成功发表,分为了四关,一路打怪升级,最后达成目标!张奇教授讲述的时候可能是站到自然语言处理的角度,但是我觉得对计算机其他方向也都是适用的

张奇教授提到的四关分别是基础关,阅读关,动机关,写作关

1 基础关

基础需要我们阅读一些经典书籍,系统全面掌握相关知识

经典书籍推荐

1.1 基础书籍

1,2点 感觉做AI的都需要看,3的话做自然语言处理看即可

1 周志华老师的《机器学习》又叫做西瓜书

2 《神经网络与深度学习》

3 《统计自然语言处理》

1.2 提高书籍

1李航老师《统计学习方法》

2《深度学习》Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写的花书

1.3 课程链接

老师推荐了一些课程链接

1 神经网络与深度学习 邱锡鹏 https://www.bilibili.com/video/BV13b4y1177W

2 李宏毅2020机器学习深度学习(完整版)国语 https://www.bilibili.com/video/BV1JE411g7XF

3 斯坦福CS224N《深度学习自然语言处理》课程(2021) by Christopher Manning https://www.bilibili.com/video/BV1nP4y1j7rZ

4 神经网络与深度学习 邱锡鹏 https://www.bilibili.com/video/BV13b4y1177W

上面很多课程我都没看过,但我看了北京邮电大学鲁鹏老师的课程,我觉得对我帮助很大

计算机视觉与深度学习 北京邮电大学 鲁鹏 清晰版合集(完整版)_哔哩哔哩_bilibili

1.4 编程实战

我觉得李沐老师的动手深度学习非常棒,可以来提高代码实战能力

《动手学深度学习》 — 动手学深度学习 2.0.0 documentation (d2l.ai)

张奇老师提到两点

如果可以在一周之内

不看别人的代码手搓实现Transformer等基本架构,R-NET基本架构等就算基本入门了

2 阅读关

每年相关论文有上万篇,arxiv上每天也放出很多相关论文,怎么阅读?

老师给出的建议是分层过滤,集团作战,公众号热点,一些文章核心看motivation,一些文章重点看

2.1 分层过滤

从各大会议筛选出一万多篇

每个会议的Best Paper,oral(口头报告论文),Session,重点单位论文筛选出两千多篇

然后根据title,自己做的方向筛选出一千多篇

然后再阅读摘要Abstract和Introduction筛选出五百篇

2.2 集团作战,信息获取

筛选出五百篇还是很多,所以要和组内同学相互分享(集团作战)

每人精读一百多篇左右,主题分享阅读

从各大公众号上获取论文热门信息,核心要看论文的motivation是什么

在筛选过程中,如何泛读呢?

2.3 论文如何泛读

1 题目是什么

2 做的Motivation是什么,motivation可以理解为左这个研究的动机,即做这个研究的目的,出发点

3 大致用了什么方法,看重点的图

4 在什么数据集上面做了测试,结果怎么样

那么在阅读了大量论文之后,就要提出自己的研究动机和方向了

3 动机 方向关

研究方向怎么选?是否应该选择热门方向呢?还是选一些冷门方向

这得看自身情况?如果着急发论文,可以选一些热门的容易录取,但是如果打算长时间做研究,可以静下心来好好做自己真正感兴趣的

3.1 快速发论文

快速发论文可以用棋盘法

在这里插入图片描述

3.2 好的研究

好的研究的特点

  1. 做了的话,可以辅助很多的任务,有明显的益处
  2. 描述简单,如信息抽取,关系抽取,倾向性分析
  3. 研究问题尚且不具备明确的解法
  4. 解决方案具备可测试性,大问题可以拆解成多个子问题,能观察每个子问题的进程。怎么测试呢?
  5. 要确保研究中数据的可靠性以及足够数量

有一个经典的motivation 非常反面的例子——之前的方法精度低,本文提出的方法提升了精度,是不行的

精度低不是motivation,而是要讲明白为什么精度低,对于精度低,我们找到为什么会精度低,提出自己的方法,从而最后取得了哪些进步,解决的初衷才是motivation

比较好的motivation还有比如别人做的工作没注意到什么点,没有关注什么信息,我们充分利用了这些信息等等

4 写作关

4.1 论文写作流程

核心让读者读懂,降低读者的难度,尽量让读者提升他的愉悦感

这里,老师提到了清华大学刘洋老师的报告——论文发表流程

大致分为

1 确定方向

2 确定问题

3 确定思路

4 确定方法

5 实验验证

6 撰写论文

详细可看

刘洋:如何撰写高质量科技论文-清华大学智能产业研究院 (tsinghua.edu.cn)

4.2 从读者角度出发

1 信息的呈现符合读者的认知惯性,深入浅出,引人入胜,让读者快速找到想要的信息

2 尽量降低读者的理解难度 合理地综合使用信息元素:图>曲线>表>正文>公式

3 尽量提高读者阅读时的愉悦感 思想新颖、组织合理、逻辑严密 论证充分、文笔优美、排版美观

我们要核心理解审稿人的审稿一般也是赶DDL,所以我们要在五分钟之内打动审稿人

在这里插入图片描述

4.3 每一部分怎么写

4.3.1 Abstract摘要

两个都可以

在这里插入图片描述

在这里插入图片描述

4.3.2 Introduction 介绍

相当于是把Abstract的每一句话变成一段话详细阐述,中间加上现有的方法有哪些(最好分一下类)现有方法有什么问题

最后阐明自己的Contribution贡献,1,2,3分条列出来

一般在第一页右上部分加一个图说明自己的motivation

不要一上来就描述你的工作,可以先介绍背景知识(往往就是baseline)

• 有利于降低初学者或其他领域学者的理解难度

• 有利于对introduction中的论文做更详细的解释

• 有利于对比baseline和你的方法

其他

多用例子

4.3.3 实验设计

1 公认的标准数据和state-of-the-art系统

2 实验先主后辅

  • 主实验(测试集):证明显著超过baseline
  • 辅实验:参数的影响

不辞辛劳,做到极致

最后,老师寄语

在这里插入图片描述

相关文章:

【讲座分享】| 复旦大学张奇教授——《自然语言发表论文如何打怪升级?NLP顶会论文发表》

文章目录 1 基础关1.1 基础书籍1.2 提高书籍1.3 课程链接1.4 编程实战 2 阅读关2.1 分层过滤2.2 集团作战,信息获取2.3 论文如何泛读 3 动机 方向关3.1 快速发论文3.2 好的研究 4 写作关4.1 论文写作流程4.2 从读者角度出发4.3 每一部分怎么写4.3.1 Abstract摘要4.3…...

面试八股文(3)

文章目录 1.HashSet如何检查重复2.comparable和Comparator区别3.ConcurrentHashMap和Hashtable区别4.线程和进程5.并发与并行的区别6.为什么使用多线程7.使用多线程可能带来问题8.线程的生命周期和状态9.什么是上下文切换10.线程死锁11.产生死锁四个条件12.如何避免死锁 1.Hash…...

Kubernetes WebHook 入门 -- 入门案例: apiserver 接入 github

博客原文 文章目录 k8s 集群配置介绍Admission WebhookWebHook 入门实践: github 认证接入web 服务器Dockerfile 镜像制作amd64x86_64构造镜像检验镜像 Makefilewebhook 接入 apiserverwebhook.yamlapiserver 挂载 webconfig在 github 中创建认证 token将 token 添加到 kubecon…...

办公软件巨头CCED、WPS面临新考验,新款办公软件异军突起

办公软件巨头CCED、WPS的成长经历 众所周知,CCED和WPS在中国办公软件领域树立了两大知名品牌的地位。然而,它们的成功并非一朝一夕的成就,而是历经了长时间的发展与积淀。 在上世纪80年代末至90年代初,CCED作为中国大陆早期的一款…...

unity角色触摸转向

1、挂载脚本到角色的父物体A上 2 、以屏幕左边的触摸为移动,右边为转向操作 3、加载角色时,将角色的父物体设置为A,须将角色的位置和角度置0 using System; using System.Collections; using System.Collections.Generic; using UnityEngin…...

世界顶级汽车品牌源代码遭泄露 详解源代码凭据安全解决方案

源代码凭据安全,您别忽视 !!! 一、事件回顾 2024年1月29日,RedHunt 实验室的研究员Lohit爆料:某世界顶级的豪华汽车品牌源代码面临泄露风险!人为错误致GitHub令牌事故引发重大安全担忧。 RedHunt Labs在一次互联网扫描时&#x…...

Mysql-备份与恢复

目录 一、备份表 1.无需备份表结构 2.备份表结构 3.mysqldump方式备份表 二、备份库 一、备份表 1.无需备份表结构 CREATE TABLE a_bak as select * from a;#备份表(不包含表结构)TRUNCATE TABLE a;#清空表 INSERT INTO a SELECT * FROM a_bak;#插…...

基于STM32的UART/USART数据传输的错误检测和纠错机制研究

在STM32的UART/USART数据传输过程中,为了确保数据的可靠性,通常需要使用错误检测和纠错机制。常见的错误检测和纠错技术包括奇偶校验、循环冗余校验(CRC)、硬件流控制和重发机制等。本文将重点介绍这些技术在STM32上的应用&#x…...

「优选算法刷题」:计算布尔二叉树的值

一、题目 给你一棵 完整二叉树 的根,这棵树有以下特征: 叶子节点 要么值为 0 要么值为 1 ,其中 0 表示 False ,1 表示 True 。非叶子节点 要么值为 2 要么值为 3 ,其中 2 表示逻辑或 OR ,3 表示逻辑与 AND…...

A系统数据表同步到B系统数据表

一、 事务操作 (小量数据) 事务操作通常用于确保数据的一致性和完整性。以下是一些常见的应用场景: 银行转账:当从一个账户向另一个账户转账时,需要确保两个操作(从一个账户扣款和向另一个账户存款&#x…...

Qt实现类似ToDesk顶层窗口 不规则按钮

先看效果: 在进行多进程开发时,可能会遇到需要进行全局弹窗的需求。 因为平时会使用ToDesk进行远程桌面控制,在电脑被控时,ToDesk会在右下角进行一个顶层窗口的提示,效果如下: 其实要实现顶层窗口&#xf…...

发布4-运行JRT程序

到了本章节,你需要准备好JDK17的环境和idea环境。并且安装好选择的数据库软件。这章将正式开始JRT的程序开发。 首先获取程序,我会给下载地址 下载后解压会得到下图目录的文件结构,DBFile放IRIS和PG的数据库文件,JRTClient放打包…...

利用VPN设备漏洞入侵!新型勒索软件CACTUS攻击手法分析

近期,亚信安全应急响应中心截获了利用VPN设备已知漏洞传播的新型勒索软件CACTUS,该勒索于2023年3月首次被发现,一直保持着活跃状态。CACTUS勒索软件通过Fortinet VPN的已知漏洞进行入侵(黑客首先获取到VPN账号,再通过V…...

第7章 SpringBoot安全管理

学习目标 了解SpringSecurity安全管理的功能 掌握SpringSecurity的安全配置 掌握SpringSecurity自定义用户认证的实现方法 掌握SpringSecurity自定义用户授权管理的实现方法 掌握如何使用SpringSecurity实现页面控制 实际开发中,一些应用通常要考虑到安全性问题。例如,对于一…...

【QT+QGIS跨平台编译】之二十二:【FontConfig+Qt跨平台编译】(一套代码、一套框架,跨平台编译)

文章目录 一、FontConfig介绍二、文件下载三、文件分析四、pro文件五、编译实践 一、FontConfig介绍 FontConfig 是一个用于配置和定制字体的库,广泛应用于基于X Window系统的操作系统中,尤其是在Linux和Unix-like系统中。它为应用程序提供了一种统一的…...

echarts中绘制3D三维地球

简介 echarts中的三维地球,需要用到世界地图json数据,我把json文件放到我的资源中,有需要的自行下载。 安装插件 // 安装echats npm install echarts --save npm install echarts-gl --save 项目中引用 1,引入安装的echarts…...

go grpc高级用法

文章目录 错误处理常规用法进阶用法原理 多路复用元数据负载均衡压缩数据 错误处理 gRPC 一般不在 message 中定义错误。毕竟每个 gRPC 服务本身就带一个 error 的返回值,这是用来传输错误的专用通道。gRPC 中所有的错误返回都应该是 nil 或者 由 status.Status 产…...

Redis实现登录的优化

目录 1 前言 2 实现步骤 2.1 软件环境准备 2.1.1 Redis的安装 2.1.2 在pom.xml中添加依赖 2.1.3 在application.yml中进行相关配置 2.2 StringRedisTemplate的常用方法 2.2.1 获取operations 2.2.2 主要方法 2.3 令牌主动失效机制 2.3.1 登录时将令牌存入Redis 2.…...

ROS方向第二次汇报(5)

文章目录 1.本方向内学习内容:1.1.自定义msg:1.1.1.定义msg文件:1.1.2.编辑配置文件: 1.2.自定义srv:1.2.1.定义srv文件:1.2.2.编辑配置文件: 1.3.服务通信案例实现:1.3.1.服务端实现…...

C# 浅克隆与深克隆

在C#中,浅克隆(Shallow Clone)和深克隆(Deep Clone)是两种常见的对象克隆技术,用于创建对象的新副本。 它们的主要区别在于复制对象的层次和属性的处理方式。 浅克隆(Shallow Copy)…...

大话软工笔记—需求分析概述

需求分析,就是要对需求调研收集到的资料信息逐个地进行拆分、研究,从大量的不确定“需求”中确定出哪些需求最终要转换为确定的“功能需求”。 需求分析的作用非常重要,后续设计的依据主要来自于需求分析的成果,包括: 项目的目的…...

MMaDA: Multimodal Large Diffusion Language Models

CODE : https://github.com/Gen-Verse/MMaDA Abstract 我们介绍了一种新型的多模态扩散基础模型MMaDA,它被设计用于在文本推理、多模态理解和文本到图像生成等不同领域实现卓越的性能。该方法的特点是三个关键创新:(i) MMaDA采用统一的扩散架构&#xf…...

初学 pytest 记录

安装 pip install pytest用例可以是函数也可以是类中的方法 def test_func():print()class TestAdd: # def __init__(self): 在 pytest 中不可以使用__init__方法 # self.cc 12345 pytest.mark.api def test_str(self):res add(1, 2)assert res 12def test_int(self):r…...

Linux 内存管理实战精讲:核心原理与面试常考点全解析

Linux 内存管理实战精讲:核心原理与面试常考点全解析 Linux 内核内存管理是系统设计中最复杂但也最核心的模块之一。它不仅支撑着虚拟内存机制、物理内存分配、进程隔离与资源复用,还直接决定系统运行的性能与稳定性。无论你是嵌入式开发者、内核调试工…...

人工智能(大型语言模型 LLMs)对不同学科的影响以及由此产生的新学习方式

今天是关于AI如何在教学中增强学生的学习体验,我把重要信息标红了。人文学科的价值被低估了 ⬇️ 转型与必要性 人工智能正在深刻地改变教育,这并非炒作,而是已经发生的巨大变革。教育机构和教育者不能忽视它,试图简单地禁止学生使…...

tomcat入门

1 tomcat 是什么 apache开发的web服务器可以为java web程序提供运行环境tomcat是一款高效,稳定,易于使用的web服务器tomcathttp服务器Servlet服务器 2 tomcat 目录介绍 -bin #存放tomcat的脚本 -conf #存放tomcat的配置文件 ---catalina.policy #to…...

redis和redission的区别

Redis 和 Redisson 是两个密切相关但又本质不同的技术,它们扮演着完全不同的角色: Redis: 内存数据库/数据结构存储 本质: 它是一个开源的、高性能的、基于内存的 键值存储数据库。它也可以将数据持久化到磁盘。 核心功能: 提供丰…...

Docker拉取MySQL后数据库连接失败的解决方案

在使用Docker部署MySQL时,拉取并启动容器后,有时可能会遇到数据库连接失败的问题。这种问题可能由多种原因导致,包括配置错误、网络设置问题、权限问题等。本文将分析可能的原因,并提供解决方案。 一、确认MySQL容器的运行状态 …...

云原生周刊:k0s 成为 CNCF 沙箱项目

开源项目推荐 HAMi HAMi(原名 k8s‑vGPU‑scheduler)是一款 CNCF Sandbox 级别的开源 K8s 中间件,通过虚拟化 GPU/NPU 等异构设备并支持内存、计算核心时间片隔离及共享调度,为容器提供统一接口,实现细粒度资源配额…...

Sklearn 机器学习 缺失值处理 获取填充失值的统计值

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖 本博客的精华专栏: 【自动化测试】 【测试经验】 【人工智能】 【Python】 使用 Scikit-learn 处理缺失值并提取填充统计信息的完整指南 在机器学习项目中,数据清…...