科研人必看入门攻略(收藏版)
来源:投稿 作者:小灰灰
编辑:学姐
本文主要以如何做科研,日常内功修炼,常见科研误区,整理日常‘好论文’四个部分做以介绍,方便刚入门的科研者进行很好的规划。
1.如何做科研
1.1 选方向
当我们刚步入科研的第一步时,首选就要选择课题和方向,那么面对实验室很多项目和课题,一般选择方向需要一定的积累,而且很多题目风险性很高,所以要做的就有两个点,一个是多跟老师讨论,还有一个笨方法就是关注一下目前最顶级的研究机构,关注目前的主流模型,他们在做什么,那么我们就可以选择这个方向,并且实时监控他们的科研进展。
那么方向有了,那么就可以关注一些顶级会议的方向:
-
IR(信息检索):人工智能领域智能信息检索方向最权威的顶级国际会议(SIGUIR),国际计算机学会信息与知识管理大会(CIKM)
-
NLP(自然语言处理):ACL,NAACL,EMNLP,IJCNLP
-
ML&AI:NeurIPS
-
DM(数据挖掘):知识发现与数据挖掘顶级会议(SIGKDD)
-
CV(计算机视觉):ICCV、CVPR、 AAAI
-
……
1.2 查找文献
知道了顶级会议的方向,那么就是如何找参考文献了,选择好方向之后,想要更快的知道本领域的研究内容:
-
可以先从中文综述入手找到合适的英文论文
-
对知识点的理解,可以借助知乎,csdn等平台巩固知识点
-
文献的下载可以使用google scholar,百度学术去查找,一般最新的论文一般百度学术检索不到
-
从论文找论文
-
从被引论文找相关论文
一般推荐几个网站:
https://paperswithcode.com/ ---查看论文是否有代码的网站
https://www.aminer.cn/ ---由清华大学计算机科学与技术系建立,收录了sci,ccf优秀论文
https://www.semanticscholar.org/ ---语义学者(Semantic Scholar)是由微软联合创始人 Paul Allen 做的免费学术搜索引擎。
当然也可以从本校的图书馆进去查找相关文献。
1.3 读文献
1.那么我们查找了好多文献,下载了很多,读不懂怎么办呢,首先可以和师兄,老师整理一下,本领域的单词,同时也可以看下b站上,有关读论文的一些视频,比如李沐的视频:https://www.bilibili.com/video/BV1H44y1t75x/?spm_id_from=333.337.search-card.all.click
2.平时不断积累本领域的一些方法,模型
3.从论文中找到本论文中是根据哪篇论文中的研究点,解决了哪些问题。
1.4 建立模型
那么论文大概读懂了,怎么落实行动,依靠代码实现出来呢?就要建立模型。初学者建议从工具使用入手熟悉模型的输入输出,逐渐了解模型背后的原理,对于特定的问题进行整理代码。
那么拿到一篇论文,我们要做好复现,对于初学者就是找到有代码的论文,理清从数据到模型一系列的输入输出数据流,选择自己的工具(pytorch,tensorflow)搭建简单的模型框架,这个过程一定要亲自动手,进行搭积木,从而了解模型背后的数学原理,尤其对一些常用的模型了解背后的数学原理,做到魔改,尤其是本方向的特定任务,要非常熟悉,从而进行创新。
1.5 设计实验
一般读论文开始要格外关注实验的设计,评测指标是否选择合理,在跑实验的时候,发现效果不好,要思考,为什么不好,是什么原因导致这种效果,你选择的模型的假设是否和数据有什么冲突,特别是面对效果很好的时候要稍加注意。
不要放弃,如果做不下去,说不定可以找到一些衍生的点。一定要总结,发现问题。
1.6 如何写论文
那么实验有了,要整理实验,准备写论文,写好论文
-
首先要逻辑过关,保证基本的语法,找出研究领域内的高频词,常用词和通用词,可以做一次系统性的语法学习
-
大量阅读论文,摘抄经典句子,通用句子,优美句子,可以先不要看摘要,练习复写摘要
-
可以先给老师讲清楚创新点,防止出现逻辑的一些突然转折,不清楚的问题。
2.日常内功修炼
2.1 读论文
从大量的论文中,分析出粗读论文和精读论文,一般每周精读3-5篇相关论文。那么要读到什么地步呢,就要从一篇论文回答以下的内容:
-
记住作者的名字,进而follow
-
记住题目,主要是为了防止可以尽快找到
-
要非常容易的说出本篇论文有什么缺点,毛病
-
很容易用一句话说出本篇论文为什么新,很容易发表,他的贡献点是什么。
-
可以很容易说出和这篇论文有类似的若干篇论文
-
很容易说出本篇论文的技术细节
-
很容易说出本篇论文的实验细节
-
最难的是怎么想着把本篇论文的创新点应用到本方向。
2.2 学机器学习
-
没事可以学习机器学习的东西,决策树,SVM,了解其中的背后的数学原理,
-
经常参加学术报告
-
系统上过一门机器学习公开课
-
数学推导写出简单的笔记当作是最终的理解,可以用白板推导。
-
以代码实现为最终掌握
2.3 写代码
-
必须掌握一门语言,一般难度的模型应该三天左右可以复现
-
找一个成熟的工具包或者代码库入手进行拓展,而且练习时要做到良好的代码风格。
-
做到复用
-
一定要做到代码开源,结果能够复现就好,平时多做积累
2.4 观察数据,收集数据
-
可以清晰准确快速的了解一个数据集合和自己当前任务的关系,比如有100个实验,那么就要做100次实验吗,如果能够做到对数据了解,那么里面有的方法可以推翻,不需要做实验,或者做实验的过程中,就可以判断这个方法的好坏,清晰预判一个方法在一个数据上的正确结果,哪些方法可以适用,哪些不适应,自己一定要清楚。
-
能够发现实验结果中的一些问题,进而总结实验中的一些规律,多看一些bad case,总结规律。 总结一下,在三年或者四年的学习中,你是否具备了以下条件:
1.掌握一门编程语言,可以自己动手完成一个模型的主干框架的开发。
2.熟悉基本的机器学习基础,要做到能够白板推导出来。
3.掌握自己本方向自己之前从未做过的任务
4.能够独立发表一篇本方向的相关论文,做到独立科研
5.能够带领低年级同学做科研。
3.常见科研误区
-
不要认为ccf-a,一区的论文就是最好的,要辩证的看法,不要在于来源,学会找准创新点
-
不要认为调参能找到好结果,如果是好的方法,调参不应该很艰难
-
如果有一组参数效果很好,但是其他组参数都不太好,需要高度注意
-
不要把模型弄的过于复杂,要想办法提取核心的创新点。
-
不要搭积木,一个好的创新点要好于三个分散的创新点。
-
在投稿前都应该问一下,本文在这个工作中解决了什么问题,技术创新是什么,别人读了会有什么收获。
-
学会讲故事,营造问题。
4.赏析好论文
可以以Language Models are Unsupervised Multitask Learners 和 Language Models are Few-Shot Learners 这两篇论文自己赏析一下,找到好的句子,温故知新。
关注下方《学姐带你玩AI》🚀🚀🚀
论文资料+比赛方案+面试经验all in
码字不易,欢迎大家点赞评论收藏!
相关文章:

科研人必看入门攻略(收藏版)
来源:投稿 作者:小灰灰 编辑:学姐 本文主要以如何做科研,日常内功修炼,常见科研误区,整理日常‘好论文’四个部分做以介绍,方便刚入门的科研者进行很好的规划。 1.如何做科研 1.1 选方向 当我…...
第5章 循环和关系表达式
1. strcmp()//比较字符串数组是否相等| string 可以直接用“”来判断 char word[5] "aaaa"; strcmp(word,"aaab");//相同输出0,不同输出1; 2. 延时函数 #include<ctime>float sec 2.3;long delay sec*CLOCKS_PER_SEC;long start c…...
Scalable Vector Graphics (SVG)中的svg、clipPath、mask元素
Scalable Vector Graphics (SVG)是一种用于描述二维向量图形的XML基础标记语言。使用SVG可以实现丰富的图形效果,而不需要像使用位图那样考虑分辨率和像素密度的问题,可以在不同设备上展示出相同的高质量图像。 在SVG中,除了基本形状如circl…...

Java基础(十五)集合框架
1. 集合框架概述 1.1 生活中的容器 1.2 数组的特点与弊端 一方面,面向对象语言对事物的体现都是以对象的形式,为了方便对多个对象的操作,就要对对象进行存储。另一方面,使用数组存储对象方面具有一些弊端,而Java 集合…...
安装gitea
1、安装包(gitea-1.13.1-linux-amd64)上传到服务器,并添加执行权限 链接:https://pan.baidu.com/s/1SAxko0RhVmmD21Ev_m5JFg 提取码:ft07 chmod x gitea-1.13.1-linux-amd64 2、执行 ./gitea-1.13.1-linux-amd64 web…...

Java异常处理传递规范总结
java 异常分类 Thorwable类(表示可抛出)是所有异常和错误的超类,两个直接子类为Error和Exception,分别表示错误和异常。其中异常类Exception又分为运行时异常(RuntimeException)和非运行时异常, 这两种异常有很大的区别…...

2d俯视视角游戏,可以切换多种枪械
文章目录 一、 介绍二、 人物移动、鼠标控制转向三、子弹脚本四、子弹随机抛壳五、 爆炸特效六、 发射子弹七、 子弹、弹壳对象池八、 散弹枪九、 火箭弹、发射火箭十、 下载工程文件 一、 介绍 2d俯视视角游戏。 人物视角跟随鼠标移动 多种枪械 抛壳效果 多种设计效果 对象池…...

大四的告诫
保研/考研方向就绩点,(各种)比赛,(考研)刷题为主 工作就算法(比赛),项目,实习为主 👂 LOCK OUT - $atori Zoom/KALONO - 单曲 - 网易云音乐 &…...

滚珠螺杆在设备上的应用
滚珠螺杆跟直线导轨一样,是很多机械设备上不可或缺的重要部件,它是确保机器能够具备高加工精度的前提条件,因此本身对于精度的要求也相当地高。今天,我们就来了解一下滚珠螺杆在不同设备上的应用吧! 1、大型的加工中心…...
Day41线程同步
线程同步 案例:三个窗口卖100张票 //定义一个类SellTicket实现Runnable接口,定义成员变量100张票 public class SellTicket implements Runnable{private int tickets 100;//重写run方法Overridepublic void run(){while (true){ //没有票后&…...
设计模式之享元模式
参考资料 曾探《JavaScript设计模式与开发实践》;「设计模式 JavaScript 描述」享元模式设计模式之享元模式Javascript 设计模式 - 享元模式 定义 享元模式的英文叫:Flyweight Design Pattern。享元设计模式是用于性能优化的模式,这种设计…...

【GAMES101】05 Rasterization(Triangles)
光栅化过程:将一系列变换后的三角形转换为像素的过程。 三角形在图形学中得到很多的应用。 最基础的多边形(边数最少)。任何多边形都可以拆成三角形。性质:三角形内部一定是平面的。三角形内外部定义非常清楚。定义三个顶点后&a…...
13. Pod 从入门到深入理解(二)
本章讲解知识点 Pod 容器共享 VolumeConfigMapSecretDownward APIEmptyDir VolumeHostPath Volume1. Pod 容器共享 Volume 1.1. Volume 的背景及需要解决的问题 存储是必不可少的,对于服务运行产生的日志、数据,必须有一个地方进行保存,但是我们的容器每一次重启都是“恢复…...

ORBBEC(奥比中光)AstraPro相机在ROS2下的标定与D2C(标定与配准)
文章目录 1.rgb、depth相机标定矫正1.1.标定rgb相机1.2.标定depth相机1.3.rgb、depth相机一起标定(效果重复了,但是推荐使用)1.4.取得标定结果1.4.1.得到的标定结果的意义 1.5.IR、RGB相机分别应用标定结果1.5.1.openCV应用标定结果1.5.2.ros…...
常量与变量:编程中重要的两种数据类型
常量与变量 在编程中,我们常常需要存储一些数据。这些数据有些是恒定不变的,有些却是可以随时变化的。对于恒定不变的数据,我们称之为常量;对于可以变化的数据,我们则称之为变量。这两种数据类型在程序中非常重要&…...

( 数组和矩阵) 287. 寻找重复数 ——【Leetcode每日一题】
❓287. 寻找重复数 难度:中等 给定一个包含 n 1 个整数的数组 nums ,其数字都在 [1, n] 范围内(包括 1 和 n),可知至少存在一个重复的整数。 假设 nums 只有 一个重复的整数 ,返回 这个重复的数 。 你…...
【学习笔记】「JOISC 2022 Day2」复制粘贴 3
看了正解。我觉得很厉害。虽然用减枝水过去了。 区间 d p dp dp。但是这个转移怎么看都不是 O ( 1 ) O(1) O(1)的。 border \text{border} border 那么 trick \text{trick} trick应该都能看出来。能进行剪切操作当且仅当 s [ l , p ] s [ q , r ] s_{[l,p]}s_{[q,r]} s[l,p]…...

武忠祥老师每日一题||定积分基础训练(三)
常用的基本不等式: sin x < x < t a n x , x ∈ ( 0 , π 2 ) \sin x<x<\ tan x,x\in(0,\frac{\pi}{2}) sinx<x< tanx,x∈(0,2π) e x ≥ 1 x , x ∈ ( − ∞ , ∞ ) e^x\ge1x,x\in(-\infty,\infty) ex≥1x,x∈(−∞,∞) x 1 x ≤ ln …...

Docker安装常用软件-Apollo(有问题)
零:apollo概念介绍 官网网站:GitHub - apolloconfig/apollo: Apollo is a reliable configuration management system suitable for microservice configuration management scenarios. gitee网址:mirrors / ctripcorp / apollo GitCode …...

f(x)与|f(x)|,f ‘ (x),F(x)常见关系。
1.f(x)与|f(x)|关系。 1.连续关系。(f(x)在"[a,b]上连续" > |f(x)|在"[a,b]连续") ①如果f(x)在[a,b]上连续。则|f(x)|在[a,b]上连续. (因为f(x)在x0的连续点>x0必为|f(x)|的连续点) 注:”[a,b]连续“包括&#…...

深入剖析AI大模型:大模型时代的 Prompt 工程全解析
今天聊的内容,我认为是AI开发里面非常重要的内容。它在AI开发里无处不在,当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗",或者让翻译模型 "将这段合同翻译成商务日语" 时,输入的这句话就是 Prompt。…...

iOS 26 携众系统重磅更新,但“苹果智能”仍与国行无缘
美国西海岸的夏天,再次被苹果点燃。一年一度的全球开发者大会 WWDC25 如期而至,这不仅是开发者的盛宴,更是全球数亿苹果用户翘首以盼的科技春晚。今年,苹果依旧为我们带来了全家桶式的系统更新,包括 iOS 26、iPadOS 26…...
DockerHub与私有镜像仓库在容器化中的应用与管理
哈喽,大家好,我是左手python! Docker Hub的应用与管理 Docker Hub的基本概念与使用方法 Docker Hub是Docker官方提供的一个公共镜像仓库,用户可以在其中找到各种操作系统、软件和应用的镜像。开发者可以通过Docker Hub轻松获取所…...

页面渲染流程与性能优化
页面渲染流程与性能优化详解(完整版) 一、现代浏览器渲染流程(详细说明) 1. 构建DOM树 浏览器接收到HTML文档后,会逐步解析并构建DOM(Document Object Model)树。具体过程如下: (…...

Cloudflare 从 Nginx 到 Pingora:性能、效率与安全的全面升级
在互联网的快速发展中,高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司,近期做出了一个重大技术决策:弃用长期使用的 Nginx,转而采用其内部开发…...

html-<abbr> 缩写或首字母缩略词
定义与作用 <abbr> 标签用于表示缩写或首字母缩略词,它可以帮助用户更好地理解缩写的含义,尤其是对于那些不熟悉该缩写的用户。 title 属性的内容提供了缩写的详细说明。当用户将鼠标悬停在缩写上时,会显示一个提示框。 示例&#x…...

ABAP设计模式之---“简单设计原则(Simple Design)”
“Simple Design”(简单设计)是软件开发中的一个重要理念,倡导以最简单的方式实现软件功能,以确保代码清晰易懂、易维护,并在项目需求变化时能够快速适应。 其核心目标是避免复杂和过度设计,遵循“让事情保…...

AI,如何重构理解、匹配与决策?
AI 时代,我们如何理解消费? 作者|王彬 封面|Unplash 人们通过信息理解世界。 曾几何时,PC 与移动互联网重塑了人们的购物路径:信息变得唾手可得,商品决策变得高度依赖内容。 但 AI 时代的来…...

HashMap中的put方法执行流程(流程图)
1 put操作整体流程 HashMap 的 put 操作是其最核心的功能之一。在 JDK 1.8 及以后版本中,其主要逻辑封装在 putVal 这个内部方法中。整个过程大致如下: 初始判断与哈希计算: 首先,putVal 方法会检查当前的 table(也就…...
MySQL 8.0 事务全面讲解
以下是一个结合两次回答的 MySQL 8.0 事务全面讲解,涵盖了事务的核心概念、操作示例、失败回滚、隔离级别、事务性 DDL 和 XA 事务等内容,并修正了查看隔离级别的命令。 MySQL 8.0 事务全面讲解 一、事务的核心概念(ACID) 事务是…...