当前位置：首页 > news >正文

相关教程test

news 2026/2/9 8:15:09

第一天

主题：LLM初体验

上午：

一，大模型的发展背景和模型演进

数据增长和算力提升
LSTM到BERT到LLM的参数巨变
最新paper解读（根据授课时间，选择最近的核心paper进行解读）

二，大模型核心阶段的认识和理解

预训练（CLM，Scaling Law等）
对齐（SFT，RW，RLHF）
微调（p-tuning，p-tuningV2，Lora等）

下午：

三，大模型核心架构详解Transformer

基本组成部分
self-attention中的QKV的含义
self-attention中scale的作用
self-attention的时间复杂度问题

四，业界为何使用LLM，应该具备的条件？

传统bert-fintuning模式的典型弊端
离线需求场景下的llm提示工程
什么数据规模可以考虑微调
什么阶段应该考虑预训练和对齐工程

第二天

主题：必要的提示工程

上午：

一，为什么提示工程是必要的？

探索chatGPT的能力上限
构建领域能力测试模块（术语解释，常识理解，逻辑逻辑，业务问题退化）
提示工程中大模型的指令测试，稳定性测试，准确率测试目的与方法

二，提示工程的标准设计方案

基本结构组成（角色，问题，示例，输出格式，注意点）
与业务结合的CoT badcase分析方法
基于RAG的业务知识注入
基于reAct的相关工具使用
Agent的适应场景和设计方案

下午：

三，提示工程案例剖析：

《领域知识注入的常见问题和解决方案》

如何选择知识库的embedding方法
如何设计业务上的“相似度度量”

四，前沿提示工程的paper深入解读：

THE UNLOCKING SPELL ON BASE LLMS: RETHINKING ALIGNMENT VIA IN-CONTEXT LEARNING （来自艾伦实验室）
Automatic Prompt Optimization with “Gradient Descent” and Beam Search（来自微软研究院）

第三天

主题：大模型微调

上午：

一，常见微调方法的技术原理解析：

p-tuning，p-tuningv2
lora，adalora，qlora等

二，微调数据的分布控制和增强方法

如何进行微调数据的分布控制
基于CoT的数据逻辑增强
将self-instruct应用于微调数据

下午：

三，大模型微调案例剖析

《微调过程的常见问题和解决方案》

幻觉问题划分和对应的解决方案
复读机问题的本质原因和解决方案

四，前沿微调技术paper的深入解读：

SLoRA: Federated Parameter Efficient Fine-Tuning of Language Models （来自南加州大学）
A Comparative Study between Full-Parameter and LoRA-based Fine-Tuning on Chinese Instruction Data for Instruction Following Large Language Model（ Lora技术在中文语料下的对比报告）

第四天

主题：大模型的评估与推理加速

上午：

一，大模型的评估指标与方法

算法角度的效果和效率评估指标
业务指标的设计融合与正相关
多层次指标设计的重要性

二，大模型分布式方法与工具

数据并行，模型并行，流水线并行，序列并行
工具：Deepspeed，Accelerate，Triton

下午：

三，大模型训练平台设计的重要性

数据处理流程和算力调度
算法团队整体效率提升的关键

四，总结与展望

整体总结
未来大模型技术展望（架构改进，多模态等）

Monarch Mixer: A Simple Sub-Quadratic GEMM-Based Architecture （来自neurIPS2023 斯坦福大学）
Retentive Network: A Successor to Transformer for Large Language Models（来自微软研究院）

互动讨论

讲师介绍：

周老师

LLM实战专家，8年算法从业经历，曾就职于字节，快手，宜信等互联网公司，主导算法团队AIGC方向的探索和落地，对大模型预训练，对齐，微调具有丰富工程实践经验。

mysql知识分享（包含安装卸载）（一）

如果博客有错误，请佬指正。目录注意：打开cmd时要有管理员身份打开，重要为何使用数据库？ 数据库的相关概念关系型数据库关系型数据库设计规则表，记录，字段表的关联关系一对一关联一对多关系 …...

编程日记 2023/12/7 13:43:35

Google Guava 反射工具使用详解

文章目录反射类操作方法操作字段操作获取注解反射在 Guava 中，反射（Reflection）模块提供了一些用于简化反射操作的工具类和方法。通过 Guava 的反射模块，您可以方便地进行类、方法、字段的操作、获取注解信息等。下面详细介绍…...

编程日记 2023/12/7 13:42:34

MySql MVCC 详解

注意以下操作都是以InnoDB引擎为操作基准。一，前置知识准备 1，MVCC简介 MVCC 是多版本并发控制（Multiversion Concurrency Control）的缩写。它是一种数据库事务管理技术，用于解决并发访问数据库的问题。MVCC 通过创…...

编程日记 2023/12/7 13:39:31

工业机器视觉megauging（向光有光）使用说明书（三，轻量级的visionpro）

下来我们说说第二个相机的添加： 第一步，点击相机二，如下： 第二步，点击：加载工具组.xml，加载toolgroupxml2目录下的：工具组.xml 注意，一个相机只能用一个toolgroupxml,第…...

编程日记 2023/12/7 13:38:31

Linux 环境下，jdbc连接mysql问题

1. 下载MySQL的JDBC驱动： 从MySQL官网下载最新的MySQL Connector/J，并将其解压到某个目录，比如/usr/local/mysql/。 2. 将JDBC驱动添加到类路径： 将JDBC驱动添加到类路径，可以使用以下命令： export CLA…...

编程日记 2023/12/7 13:34:26

Python读写txt文件数据

🎈 博主：一只程序猿子 🎈 博客主页：一只程序猿子博客主页 🎈 个人介绍：爱好(bushi)编程！ 🎈 创作不易：如喜欢麻烦您点个👍或者点个⭐！ &#x1f…...

编程日记 2023/12/7 13:33:25

Linux虚假唤醒

为什么会有虚假唤醒一说。Linux内核这么强大，怎么会出现这样的情况？一直以来也很困惑，看了下文链接中的介绍后，豁然开朗。从计算机设计的角度，如果一层解决不了，那就再多加一层。推算到这里，就…...

编程日记 2023/12/7 13:31:23

倒计时模块复习

经典回顾倒计时倒计时的基本布局介绍。一个内容区域和一个输入区域，内容区域进行划分直接使用flex布局会更快一点。 js代码我们利用一下模块化思想，直接把获得时间这个功能写成一个函数。方便后续的调用 function getTime() {const date new Date…...

编程日记 2023/12/7 13:30:22

k8s(三): 基本概念-ReplicaSet与Deployment

PeplicaSet ReplicaSet 的目的是维护一组在任何时候都处于运行状态的 Pod 副本的稳定集合，通常用来保证给定数量的、完全相同的 Pod 的可用性。最佳实践 Deployment 是一个可以拥有 ReplicaSet 并使用声明式方式在服务器端完成对 Pod 滚动更新的对象。尽管 Rep…...

编程日记 2023/12/7 13:28:21

Linux 的介绍和云服务器上web 程序部署

目录一.linux的介绍 1.1linux是什么 1.2linux的发展历程 1.3linux发行版二.Linux环境搭建 2.1阿里云-云服务器配置 2.2使用终端软件连接Linux 三.操作Linux，部署web程序 3.1Linux指令 3.2部署web程序第一步：认识yum 第二步：安装…...

编程日记 2023/12/7 13:27:20

Oauth2.0 学习

OAuth 2.0 服务器端通常通过验证每次请求中的访问令牌（access token）的方式来确保其合法性和有效性。以下是一些通常采用的验证方法： Token Validation Endpoint: OAuth 2.0 规范允许实现一个专门的令牌验证端点，称为 Token Valid…...

编程日记 2023/12/7 13:25:18

Elasticsearch：什么是向量数据库？

向量数据库定义向量数据库是将信息存储为向量的数据库，向量是数据对象的数值表示，也称为向量嵌入。它利用这些向量嵌入的强大功能来对非结构化数据和半结构化数据（例如图像、文本或传感器数据）的海量数据集进行索引和搜索。向…...

编程日记 2023/12/7 13:24:17

rename--统一的PRF

基本概念将ARF/PRF进行合并，合同之后的不见，称之为统一的PRF(Physical Register File);存储的是speculative的，以及正确的（retire）寄存器值； 使用free list，存储PRF中，哪些寄存器是…...

编程日记 2023/12/7 13:22:16

查看字符串使用rabin2 -z /home/burning/010editor/010editor | tee 22.txt 查看字符串。 6698 0x003ba380 0x007ba380 68 69 .rodata ascii The password you entered is for an earlier version of this program. 6699 0x003ba3c8 0x007ba3c8 70 71 .rodata ascii You will…...

编程日记 2023/12/7 13:18:11

Ubuntur编译ROS报错：error PCL requires C++14 or above

ubuntu20.04 编译ROS包报错： error： PCL requires C14 or above： 修改Cmakelists.txt文件： set（CMAKE_CXX_STANDARD 14） 再次编译成功....

编程日记 2023/12/7 13:16:09

17.认识下Docker之docker的核心原理（2）

1.容器-我的小世界不知道大家看没看过小说《完美时间》，里面石昊经常进入一个小世界在里面与世隔绝的修炼或者战斗，总之就是在一个完全封闭的空间里做他想做的事情而与外界隔离，不受侵扰。通过前面的分析我们知道，Namepace让应用…...

编程日记 2023/12/7 13:14:08

【EasyExcel实践】万能导出，一个接口导出多张表以及任意字段（可指定字段顺序）

文章目录前言正文一、POM依赖二、核心Java文件2.1 自定义表头注解 ExcelColumnTitle2.2 自定义标题头的映射接口2.3 自定义有序map存储表内数据2.4 表头工厂2.5 表flag和表头映射枚举2.6 测试用的实体2.6.1 NameAndFactoryDemo2.6.2 StudentDemo 2.7 启动类2.8 测试控制器三、…...

编程日记 2023/12/7 13:12:06

代码随想录算法训练营第四十二天 _ 动态规划_01背包问题、416.分割等和子集。

学习目标： 动态规划五部曲： ① 确定dp[i]的含义 ② 求递推公式 ③ dp数组如何初始化 ④ 确定遍历顺序 ⑤ 打印递归数组 ---- 调试引用自代码随想录！ 60天训练营打卡计划！ 学习内容： 二维数组处理01背包问题听起来…...

编程日记 2023/12/7 13:10:05

市场上好用的aspera替代方案，你知道哪些

Aspera作为一个高速文件传输方案曾经非常受欢迎，但是其昂贵的价格却限制了许多用户的选择，因此市场上出现了众多Aspera替代方案，本文将会介绍市场上最好的Aspera替代方案。最近几年，网络传输已成为现代商业运作中必不可少的一部…...

编程日记 2023/12/7 13:06:01

微信小程序之bind和catch

这两个呢，都是绑定事件用的，具体使用有些小区别。官方文档： 事件冒泡处理不同 bind：绑定的事件会向上冒泡，即触发当前组件的事件后，还会继续触发父组件的相同事件。例如，有一个子视图绑定了b…...

编程新知 2026/2/5 5:05:56

React hook之useRef

React useRef 详解 useRef 是 React 提供的一个 Hook，用于在函数组件中创建可变的引用对象。它在 React 开发中有多种重要用途，下面我将全面详细地介绍它的特性和用法。基本概念 1. 创建 ref const refContainer useRef(initialValue);initialValu…...

编程新知 2025/6/11 15:21:26

IGP（Interior Gateway Protocol，内部网关协议）

IGP（Interior Gateway Protocol，内部网关协议） 是一种用于在一个自治系统（AS）内部传递路由信息的路由协议，主要用于在一个组织或机构的内部网络中决定数据包的最佳路径。与用于自治系统之间通信的 EGP&…...

编程新知 2025/10/12 11:54:26

数学建模-滑翔伞伞翼面积的设计，运动状态计算和优化！

我们考虑滑翔伞的伞翼面积设计问题以及运动状态描述。滑翔伞的性能主要取决于伞翼面积、气动特性以及飞行员的重量。我们的目标是建立数学模型来描述滑翔伞的运动状态，并优化伞翼面积的设计。一、问题分析滑翔伞在飞行过程中受到重力、升力和阻力的作用。升力和阻力与伞翼面…...

编程新知 2026/2/6 5:55:05

如何配置一个sql server使得其它用户可以通过excel odbc获取数据

要让其他用户通过 Excel 使用 ODBC 连接到 SQL Server 获取数据，你需要完成以下配置步骤： ✅ 一、在 SQL Server 端配置（服务器设置） 1. 启用 TCP/IP 协议打开 “SQL Server 配置管理器”。导航到：SQL Server 网络配…...

编程新知 2025/8/25 19:37:12

【java面试】微服务篇

【java面试】微服务篇一、总体框架二、Springcloud（一）Springcloud五大组件（二）服务注册和发现1、Eureka2、Nacos （三）负载均衡1、Ribbon负载均衡流程2、Ribbon负载均衡策略3、自定义负载均衡策略4、总结 …...

编程新知 2026/1/26 19:23:29

python打卡day49@浙大疏锦行

知识点回顾： 通道注意力模块复习空间注意力模块CBAM的定义作业：尝试对今天的模型检查参数数目，并用tensorboard查看训练过程一、通道注意力模块复习 & CBAM实现 import torch import torch.nn as nnclass CBAM(nn.Module):def __init__…...

编程新知 2026/1/13 23:29:26

【学习记录】使用 Kali Linux 与 Hashcat 进行 WiFi 安全分析：合法的安全测试指南

文章目录 📌 前言🧰 一、前期准备✅ 安装 Kali Linux✅ 获取支持监听模式的无线网卡 🛠 二、使用 Kali Linux 进行 WiFi 安全测试步骤 1：插入无线网卡并确认识别步骤 2：开启监听模式步骤 3：扫描附近的 WiFi…...

编程新知 2025/10/16 12:28:55

【向量库】Weaviate 搜索与索引技术：从基础概念到性能优化

文章目录零、概述一、搜索技术分类1. 向量搜索：捕捉语义的智能检索2. 关键字搜索：精确匹配的传统方案3. 混合搜索：语义与精确的双重保障二、向量检索技术分类1. HNSW索引：大规模数据的高效引擎2. Flat索引：小规模数据…...

编程新知 2025/12/17 8:38:45

DL00871-基于深度学习YOLOv11的盲人障碍物目标检测含完整数据集

基于深度学习YOLOv11的盲人障碍物目标检测：开启盲人出行新纪元在全球范围内，盲人及视觉障碍者的出行问题一直是社会关注的重点。尽管技术不断进步，许多城市的无障碍设施依然未能满足盲人出行的实际需求。尤其是在复杂的城市环境中&#xff…...

编程新知 2026/2/3 22:52:23

第一天