2023实习面经
实习面经
秋招笔试面试全记录
字节-电商
字节实习一面:
- 二分类的损失函数是什么,怎么算?
- 多分类的损失函数怎么算?
- 如果文本分类的标签有多个,比如一个文本同时属于多个label那怎么办?
- 如果文本分类里面的有的数据就是错的,label标注就是错的,应该怎么clean
- 简述一下lstm的结构
- lstm的每个cell之间怎么传的,是怎么算的
- Layer norm怎么做的?详细说一下,可以举例子
- Layer norm和Batch norm的区别
- multi-head多头的作用是什么?
- multi-head与单头相比,哪个参数会更多
- 加入一个全连接神经网络,权重参数初始化全部为1的话,会怎么样,最开始的输入层会有什么问题吗,隐层呢?
- BERT的输入输出
- 假如让你做一个开放式的文本分类任务,你应该从特征工程,模型构建,预测各个阶段具体怎么做?
- 介绍自己做的工作
算法题,
- 两数之和,返回列表中所有满足和为target的下标二元组,输入数据会有重复数字
- 正则表达式,匹配【space】【char】*3之后的数字,并加一
- 如’ abc1236 abcd124 abn12368‘ 返回[’ abc1237’,’ abn12369’]
def add(temp):#int()参数必须是字符串,类似字节的对象或数字,而不是“re.Match”strNum = temp.group() num = int(strNum) + 1return str(num)
import re
input_str=" abc123 anv1234 abnd179"
ret=re.findall(' [A-z]{3}\d+',input_str)
res=[]
for s in ret:rest=re.sub('\d+', add, s, count=0)res.append(rest)
print(res)
百度-NLP
百度实习一面
- malloc和new的区别?
- lamda和map
- 合并两个python数组,有几种方法,从内存的角度说
- linux基本命令,把一整个目录的文件复制到其他目录下
- shell基本命令,如果一个文件,有很多行,选出出现abc的所有行
- transformer的优缺点?对比CNN和RNN
算法题:
- 旋转数组中查找一个数字target(二分)
- 二叉树后序遍历
百度实习二面
先算法题:
- 最长公共子序列,返回序列
- 问答:发报器敲击发出0和1的概率不同,请问怎么封装使得可以出现0和1的概率相同?
做完开始问 - transformer的优点缺点?
- 场景题:如果让你对40亿url中选择出现重复次数最高的10条,要怎么做?
- url数据太大,怎么解决内存问题。
- 介绍工作
- BERT的预训练任务,输入输出
- self-attention怎么算的,后面具体细节
百度实习三面
- 自我介绍
- 介绍项目
- 遇到过最难的问题,怎么解决的?
- 场景题:比如现在有微博的评论,问你怎么检测其中违规的不良言论。
相关文章:
2023实习面经
实习面经 秋招笔试面试全记录 字节-电商 字节实习一面: 二分类的损失函数是什么,怎么算?多分类的损失函数怎么算?如果文本分类的标签有多个,比如一个文本同时属于多个label那怎么办?如果文本分类里面的…...
linux shell 入门学习笔记2shell脚本
什么是shell脚本 当命令或者程序语句写在文件中,我们执行文件,读取其中的代码,这个程序就称之为shell脚本。 有了shell脚本肯定是要有对应的解释器了,常见的shell脚本解释器有sh、python、perl、tcl、php、ruby等。一般这种使用文…...
Android稳定性系列-01-使用 Address Sanitizer检测原生代码中的内存错误
前言想必大家曾经被各种Native Crash折磨过,本地测试没啥问题,一到线上或者自动化测试就出现各种SIGSEGV、SIGABRT、SIGILL、SIGBUS、SIGFPE异常,而且堆栈还是崩溃到libc.so这种,看起来跟我们的代码没啥关系,关键还不好…...
HyperOpt-quniform 范围问题
在使用 quniform 的时候,可能会出现超出指定范围的值,例如对于 GBDT 设置参数空间为 learning_rate:hp.quniform(learning_rate,0.05,2.05,0.2),但是仍然会报错 ValueError: learning_rate must be greater than 0 but was 0.0,但…...
Pycharm搭建一个Django项目
File->new project 点击create, 等待一下即可 查看安装 Django 版本: 在 Pycharm 底部选择 Terminal 然后在里面输入:python -m django --version 启动项目: 在 Terminal 里面输入: python manage.py runserver 查看文件目…...
浅析前端工程化中的一部曲——模块化
在日益复杂和多元的 Web 业务背景下,前端工程化经常会被提及。工程化的目的是高性能、稳定性、可用性、可维护性、高效协同,只要是以这几个角度为目标所做的操作,都可成为工程化的一部分。工程化是软件工程中的一种思想,当下的工程…...
新版bing(集成ChatGPT)申请通过后在谷歌浏览器(Chrome)上的使用方法
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,科大讯飞比赛第三名,CCF比赛第四名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…...
Time-distributed 的理解
前言 今天看到论文中用到 Time-distributed CNN,第一次见到 Time-distributed,不理解是什么含义,看到代码实现也很懵。不管什么网络结构,外面都能套一个TimeDistributed。看了几个博客,还是不明白,问了问C…...
matlab 计算矩阵的Moore-Penrose 伪逆
目录 一、Moore-Penrose 伪逆1、主要函数2、输入输出参数二、代码示例使用伪逆求解线性方程组一、Moore-Penrose 伪逆 Moore-Penrose 伪逆是一种矩阵,可在不存在逆矩阵的情况下作为逆矩阵的部分替代。此矩阵常被用于求解没有唯一解或有许多解的线性方程组。 对于任何矩阵…...
简历制作方面的经验与建议
专栏推荐:2023 数字IC设计秋招复盘——数十家公司笔试题、面试实录 专栏首页:2023 数字IC设计秋招复盘——数十家公司笔试题、面试实录 专栏内容: 笔试复盘篇 2023秋招过程中整理的笔试题,来源包括我自己求职笔试以及整理其他同学的笔试。包含华为、中兴、联发科、AMD、大…...
C语言--static、const、volatile关键字
Static static修饰局部变量改变了变量的生命周期,让静态局部变量出了作用域依然存在,到程序结束,生命周期才结束。 static 修饰局部变量 改变局部变量的生命周期,本质上是改变了局部变量的存储位置,让局部变量不再是…...
Rust学习入门--【18】Rust结构体
系列文章目录 Rust 语言是一种高效、可靠的通用高级语言,效率可以媲美 C / C 。本系列文件记录博主自学Rust的过程。欢迎大家一同学习。 Rust学习入门–【1】引言 Rust学习入门–【2】Rust 开发环境配置 Rust学习入门–【3】Cargo介绍 Rust学习入门–【4】Rust 输…...
LeetCode142 环形链表Ⅱ
题目: 给定一个链表的头节点 head ,返回链表开始入环的第一个节点。 如果链表无环,则返回 null。 如果链表中有某个节点,可以通过连续跟踪 next 指针再次到达,则链表中存在环。 为了表示给定链表中的环,评…...
JavaScript刷LeetCode拿offer-高频链表题
首先需要了解链表的概念 先把 next 记录下来 无论是插入,删除,还是翻转等等操作,先把 next 指针用临时变量保存起来,这可以解决 90% 重组链表中指向出错的问题, 如果不知道什么时候需要用到守卫,那就都用…...
linux系统编程2--网络编程
在linux系统编程中网络编程是使用socket(套接字),socket这个词可以表示很多概念:在TCP/IP协议中,“IP地址TCP或UDP端口号”唯一标识网络通讯中的一个进程,“IP地址端口号”就称为socket。在TCP协议中&#…...
Allegro如何重命名光绘操作指导
Allegro如何重命名光绘操作指导 在做PCB设计的时候,光绘设置是输出生产文件必要的流程,设置好光绘之后,如何对光绘重新命名,如下图 如何把L1改成TOP,L6改成BOTTOM,具体操作步骤如下 点击Manufacture选择Artwork...
[PMLR 2018] Hyperbolic entailment cones for learning hierarchical embeddings
Contents IntroductionEntailment Cones in the Poincar BallConvex cones in a complete Riemannian manifoldAngular cones in the Poincar ballfour intuitive propertiesClosed form expression of the optimal ψ \psi...
2023春季露营投影怎么选?轻薄投影极米Z6X Pro值得推荐
近年来,露营经济在多重因素的共同助推下快速发展,精致露营的攻略开始占据小红书、微博、朋友圈等各类社交平台,吸引着更多用户种草并加入到露营大军中,而露营经济的强势“破圈”给家用智能投影带来了更多的发展契机。凭借着小巧的…...
收藏,核心期刊的投稿、审稿、出刊流程详解
学术期刊论文(核心和普刊)的发表流程总的来说其实是一样的,整个流程包括:1写作-2选择刊物-3投稿-4审稿-5返修或拒稿-6录用-7出刊-8上网检索。 其中1和2其实顺序是可以调换的,可以选择好刊物再写作,根据刊物…...
JVM类加载子系统
1、类加载子系统在内存结构中所处的位置通过内存结构图,我们先知道类加载子系统所处的位置,做到心中有图。2、类加载器作用类加载器子系统负责从文件系统或者网络中加载Class文件,class文件在文件开头有特定的文件标识。ClassLoader只负责cla…...
claw-code 源码详细分析:Parity Audit——如何用工程对比把「像不像」从口水战变成可重复报告?
涉及源码:src/parity_audit.py、src/reference_data/archive_surface_snapshot.json、commands_snapshot.json、tools_snapshot.json,src/main.py,tests/test_porting_workspace.py。1. 要解决什么问题 大型移植里,「我们已经很像…...
TVA在汽车零部件焊接点检测中的实操启示录(3)
TVA系统在汽车零部件焊接点检测的落地,并非简单的“设备安装调试”,而是一个涉及流程优化、人员适配、技术衔接的系统工程。不少企业技术主管因忽视落地全流程管控,出现“系统安装后无法正常运行”“员工不会操作”“检测流程与生产流程脱节”…...
5G时代下,MEC如何让无人驾驶不再‘卡顿’?——边缘计算实战解析
5G时代下,MEC如何让无人驾驶不再‘卡顿’?——边缘计算实战解析 当一辆无人驾驶汽车以60公里时速行驶时,每100毫秒的延迟就会导致1.67米的制动距离差异。这正是边缘计算技术(MEC)在智能交通领域大显身手的核心场景——…...
2025届学术党必备的十大降AI率工具推荐
Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 对于知网AI检测系统来讲,要降低生成文本的可识别性,得从词汇层面施展…...
突破语言壁垒:XUnity Auto Translator全场景应用指南
突破语言壁垒:XUnity Auto Translator全场景应用指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 当玩家面对一款画面精美却语言不通的Unity游戏时,那种渴望深入剧情却受制于语…...
2026届学术党必备的六大AI写作网站推荐榜单
Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 削减AIGC率,这意味着要去降低文本之中,那些可被辨别为系人工智能生成…...
2025届学术党必备的五大AI论文工具推荐
Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 学术写作时,查重报告里高重复率常成为成果发表关键阻碍,对于此。专业…...
ncmdumpGUI:彻底解决网易云音乐NCM格式限制的图形化工具
ncmdumpGUI:彻底解决网易云音乐NCM格式限制的图形化工具 【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换,Windows图形界面版本 项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否曾经遇到这样的情况:在网…...
告别手动配置,用快马平台实现openclaw多环境高效部署
最近在折腾openclaw项目部署时,发现环境配置真是个让人头疼的问题。每次切换开发、测试、生产环境都要手动改配置,不仅容易出错,还特别浪费时间。后来尝试用InsCode(快马)平台的自动化部署功能,终于找到了高效的解决方案。 环境配…...
GEO单细胞数据读取避坑指南:Read10X的正确打开方式(附完整代码)
GEO单细胞数据读取避坑指南:Read10X的正确打开方式(附完整代码) 单细胞测序技术正在重塑我们对生命微观世界的认知,而GEO数据库作为生物医学研究的宝库,每天新增数百个单细胞数据集。但许多刚踏入单细胞分析领域的研究…...
