知识积累(三):深度学习相关概念(查看检索时看到)
文章目录
- 1. 知识蒸馏
- 2. 可微搜索索引(DSI)
- 参考资料
在找论文时,发现的相关概念。
1. 知识蒸馏
知识蒸馏(knowledge distillation)是模型压缩的一种常用的方法,不同于模型压缩中的剪枝和量化,知识蒸馏是通过构建一个轻量化的小模型,利用性能更好的大模型的监督信息,来训练这个小模型,以期达到更好的性能和精度。最早是由Hinton在2015年首次提出并应用在分类任务上面,这个大模型我们称之为teacher(教师模型),小模型我们称之为Student(学生模型)。来自Teacher模型输出的监督信息称之为knowledge(知识),而student学习迁移来自teacher的监督信息的过程称之为Distillation(蒸馏)。
2. 可微搜索索引(DSI)
DSI主要有两个部分,分别是
(1)索引(Indexing)—给定文件,输出文件的docid
(2)检索(Retrieval)—根据给定的查询x,输出docid整体流程如下
query -》docid 《- documents
查询到docid称为检索,documents到docid称为索引
参考资料
【1】知识蒸馏:https://zhuanlan.zhihu.com/p/258390817
【2】DSI:https://zhuanlan.zhihu.com/p/665924073
相关文章:
知识积累(三):深度学习相关概念(查看检索时看到)
文章目录 1. 知识蒸馏2. 可微搜索索引(DSI)参考资料 在找论文时,发现的相关概念。 1. 知识蒸馏 知识蒸馏(knowledge distillation)是模型压缩的一种常用的方法,不同于模型压缩中的剪枝和量化,知…...
计算机专业必看的几部电影
目录 编辑 1. 《第九区》(District 9,2009) 2. 《谍影重重》(The Bourne Identity,2002) 3. 《源代码》(Source Code,2011) 4. 《她》(Her,…...
工业人工智能需要注意的10件事
我们无法逃避人工智能这个风口,宣传人工智能软件的广告铺天盖地,似乎每个供应商都在推出最新的工具包,每天都有关于 ChatGPT、Bard 等新用例的文章。似乎全世界都在说:你现在需要人工智能! 人工智能确实正在成为自动化…...
软考-系统集成项目管理中级-信息系统建设与设计
本章重点考点 1.信息系统的生命周期 信息系统建设的内容主要包括设备采购、系统集成、软件开发和运维服务等。信息系统的生命周期可以分为四个阶段:立项、开发、运维和消亡。 2.信息系统开发方法 信息系统常用的开发方法有结构化方法、原型法、面向对象方法等 1)结构化方法 …...
C++从零开始的打怪升级之路(day39)
这是关于一个普通双非本科大一学生的C的学习记录贴 在此前,我学了一点点C语言还有简单的数据结构,如果有小伙伴想和我一起学习的,可以私信我交流分享学习资料 那么开启正题 今天分享的是关于模板的知识点 1.非类型模板参数 模板参数分为…...
Java面试题之并发
并发 1.并发编程的优缺点?2.并发编程三要素?3.什么叫指令重排?4.如何避免指令重排?5.并发?并行?串行?6.线程和进程的概念和区别?7.什么是上下文切换?8.守护线程和用户线程的定义?9.什么是线程死锁?10.形成死锁的四个条件?11.怎么避免死锁?12.创建线程的四种方式?…...
Python GUI自动化定位代码参考
一、pyautogui原始逻辑 import pyautogui # 获取指定图片在屏幕上的位置 image_path path/to/image.png target_position pyautogui.locateCenterOnScreen(image_path) if target_position is not None: # 获取偏移量 offset_x 10 offset_y 10 # 计算实际点…...
11.网络游戏逆向分析与漏洞攻防-游戏网络架构逆向分析-接管游戏接收网络数据包的操作
内容参考于:易道云信息技术研究院VIP课 上一个内容:接管游戏发送数据的操作 码云地址(master 分支):https://gitee.com/dye_your_fingers/titan 码云版本号:8256eb53e8c16281bc1a29cb8d26d352bb5bbf4c 代…...
特斯拉一面算法原题
来自太空的 X 帖子 埃隆马斯克(Elon Musk)旗下太空探索技术公司 SpaceX 于 2 月 26 号,从太空往社交平台 X(前身为推特,已被马斯克全资收购并改名)发布帖子。 这是 SpaceX 官号首次通过星链来发送 X 帖子&a…...
【Leetcode每日一题】二分查找 - 山脉数组的峰顶索引(难度⭐⭐)(23)
1. 题目解析 Leetcode链接:852. 山脉数组的峰顶索引 这个问题的理解其实相当简单,只需看一下示例,基本就能明白其含义了。 核心在于找到题目中所说的峰值所在的下标并返回他们的下标即可。 2. 算法原理 峰顶及两侧数据特点分析 峰顶数据…...
Linux添加用户分组练习
一、复制/etc/skel目录为/home/tuser1(/home/tuser1及其内部文件的属组和其它用户均没有任何访问权限)。 cp -a /etc/skel /home/tuser1 chown -R tuser1:tuser1 /home/tuser1 chmod -R 700 /home/tuser1 二、编辑/etc/group文件,添加组h…...
云快充充电桩系统设计书
充电桩系统设计书 一、系统设计概述 随着新能源汽车市场的快速发展,充电桩作为电动汽车的重要配套设施,其市场需求日益增长。本系统旨在提供一套稳定、高效、易用的充电桩解决方案,以满足市场上新能源充电桩的主流需求。通过实现云快充V1.6协…...
oracle DG 原理
在Oracle中,什么是DG?DG有哪些优缺点? DG(Data Guard,数据卫士)不是一个备份恢复的工具,然而,DG却拥有备份的功能,在物理DG下它可以和主库一模一样,但是它存…...
MySQL篇—持久化和非持久化统计信息介绍(第一篇,总共三篇)
☘️博主介绍☘️: ✨又是一天没白过,我是奈斯,DBA一名✨ ✌✌️擅长Oracle、MySQL、SQLserver、Linux,也在积极的扩展IT方向的其他知识面✌✌️ ❣️❣️❣️大佬们都喜欢静静的看文章,并且也会默默的点赞收藏加关注❣…...
Leetcode—65. 有效数字【困难】
2024每日刷题(118) Leetcode—65. 有效数字 实现代码 class Solution { public:bool isNumber(string s) {if(s.empty()) {return false;}bool seenNum false;bool seenE false;bool seenDot false;for(int i 0; i < s.size(); i) {switch(s[i]…...
【Java程序设计】【C00322】基于Springboot的高校竞赛管理系统(有论文)
基于Springboot的高校竞赛管理系统(有论文) 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于Springboot的高校竞赛管理系统,本系统有管理员、老师、专家以及用户四种角色; 管理员:首页、个人中心、管…...
41、网络编程/TCP.UDP通信模型练习20240301
一、编写基于TCP的客户端实现以下功能: 通过键盘按键控制机械臂:w(红色臂角度增大)s(红色臂角度减小)d(蓝色臂角度增大)a(蓝色臂角度减小)按键控制机械臂 1.基于TCP服务器的机械臂…...
Python中操作MySQL和SQL Server数据库的基础与实战【第97篇—MySQL数据库】
Python中操作MySQL和SQL Server数据库的基础与实战 在Python中,我们经常需要与各种数据库进行交互,其中MySQL和SQL Server是两个常见的选择。本文将介绍如何使用pymysql和pymssql库进行基本的数据库操作,并通过实际代码示例来展示这些操作。…...
【兔子机器人】五连杆运动学解算与VMC(virtual model control)
VMC (virtual model control,虚拟模型控制) 是一种直觉控制方式,其关键是在每个需要控制的自由度上构造恰当的虚拟构件以产生合适的虚拟力。虚拟力不是实际执行机构的作用力或力矩,而是通过执行机构的作用经过机构转换而成。对于一些控制问题…...
学习鸿蒙基础(6)
一、Prop属性 父——>子 单向同步 Prop装饰的变量可以和父组件建立单向的同步关系。Prop装饰的变量是可变的,但是变化不会同步回其父组件。Prop装饰的变量和父组件建立单向的同步关系。Prop变量允许在本地修改,但修改后的变化不会同步回父组件。当父组…...
通义千问2.5-7B本地部署实战:4GB显存低成本运行方案
通义千问2.5-7B本地部署实战:4GB显存低成本运行方案 1. 引言 在AI大模型应用日益普及的今天,如何在有限的硬件资源上高效运行中等规模语言模型成为许多开发者和企业关注的重点。通义千问2.5-7B-Instruct作为阿里云最新发布的70亿参数指令微调模型&…...
AIAgent目标分解实战手册(工业级SOP首次公开):从模糊意图到可执行子任务的7步原子化流程
第一章:目标分解在AIAgent架构中的核心定位与演进脉络 2026奇点智能技术大会(https://ml-summit.org) 目标分解是AIAgent实现复杂任务自主执行的逻辑基石,它将高层语义目标(如“为用户规划一次低碳商务差旅”)逐层拆解为可调度、…...
3步搭建专业缠论可视化分析平台:告别复杂软件,实现个人定制化交易分析
3步搭建专业缠论可视化分析平台:告别复杂软件,实现个人定制化交易分析 【免费下载链接】chanvis 基于TradingView本地SDK的可视化前后端代码,适用于缠论量化研究,和其他的基于几何交易的量化研究。 缠论量化 摩尔缠论 缠论可视化 …...
THE LEATHER ARCHIVE实战:3步生成赛博都市风皮衣大片,效果惊艳
THE LEATHER ARCHIVE实战:3步生成赛博都市风皮衣大片,效果惊艳 关键词:AI时尚设计、皮衣生成、赛博都市风、Stable Diffusion、LoRA模型 摘要:本文将手把手教你使用THE LEATHER ARCHIVE镜像,通过3个简单步骤生成专业级…...
GPU算力适配进阶:Lychee-Rerank在vLLM框架下实现PagedAttention加速部署
GPU算力适配进阶:Lychee-Rerank在vLLM框架下实现PagedAttention加速部署 1. 引言:当相关性评分遇上性能瓶颈 如果你用过本地部署的检索排序工具,大概率遇到过这样的场景:输入一个查询语句和几十条候选文档,然后看着进…...
IndexTTS 2.0问题解决:多音字发音不准?用拼音标注一键搞定
IndexTTS 2.0问题解决:多音字发音不准?用拼音标注一键搞定 1. 多音字问题:语音合成的常见痛点 在中文语音合成领域,多音字问题一直是个令人头疼的技术难点。想象一下,当你用AI生成"银行行长在银行门口行走"…...
Qwen3.5-4B模型处理数据库课程设计报告自动生成
Qwen3.5-4B模型处理数据库课程设计报告自动生成 1. 效果展示:从ER图到完整报告的一键生成 最近测试了Qwen3.5-4B模型在学术辅助方面的表现,特别是在数据库课程设计报告自动生成这个场景下,效果让人惊喜。只需要输入ER图、关系模式和查询需求…...
别再烧芯片了!手把手教你搞懂STM32 GPIO的过压保护二极管(附实测数据)
STM32 GPIO保护二极管实战指南:从原理到实测的完整避坑手册 刚拿到STM32开发板的新手们,总会遇到这样的灵魂拷问:为什么我的芯片又冒烟了?上周实验室里,小王同学用5V的超声波模块直接接到STM32的GPIO上,结果…...
安防监控国际物联卡:全球部署合规实战与选型指南
在全球安防产业数字化转型的浪潮中,跨境安防监控已成为企业全球化布局、公共安全防控的重要组成部分。从海外园区、跨境工程到城市安防、偏远区域监测,安防监控设备的稳定联网的核心,离不开国际物联卡的支撑。但当前海外安防部署中࿰…...
从理论到实践:傅里叶变换、DFT与FFT的数学原理与代码实现
1. 傅里叶变换:从物理现象到数学表达 第一次接触傅里叶变换时,我盯着那堆积分符号看了整整一个下午。直到某天深夜调试音频处理程序时突然顿悟:原来它就像音乐的"成分分析仪"。想象你面前有杯混合果汁,傅里叶变换能告诉…...
