当前位置：首页 > news >正文

大语言模型微调框架Unsloth：简化模型微调流程，提升模型性能

news 2026/5/25 15:48:28

在这里插入图片描述
Unsloth 将 Llama-3、Mistral、Phi-3 和 Gemma 等大型语言模型的微调速度提高了 2 倍，内存使用量减少了 70%，而且准确性不会降低！

特点

通过手动派生所有计算繁重的数学步骤和手写 GPU 内核，unsloth 可以在不更改任何硬件的情况下神奇地使训练更快。
与 Flash Attention 2 （FA2）相比，在单个 GPU 上快 10 倍，在多个 GPU 系统上快 32 倍。
我们支持从 Tesla T4 到 H100 的 NVIDIA GPU，并且可以移植到 AMD 和 Intel GPU。

支持模型

可以看到主流的开源模型基本都有支持，Llama、Qwen、Mistral、Gemma、Phi等等
在这里插入图片描述

版本

本身开源（Free），同样也支持企业级操作，费用见下图
在这里插入图片描述

Google Colab支持

Unsloth 开源版本可以安装在本地或像 Google Colab 这样的其他 GPU 服务中。大多数人通过 Google Colab 界面使用 Unsloth，它提供了一个免费的 GPU 来训练。

链接地址：https://docs.unsloth.ai/get-started/unsloth-notebooks
在这里插入图片描述
开源地址：https://github.com/unslothai/unsloth

可以点击里面的“start for free"直接开始你的微调工作。
在这里插入图片描述

大语言模型微调框架Unsloth：简化模型微调流程，提升模型性能

Unsloth 将 Llama-3、Mistral、Phi-3 和 Gemma 等大型语言模型的微调速度提高了 2 倍，内存使用量减少了 70%，而且准确性不会降低！ 特点通过手动派生所有计算繁重的数学步骤和手写 GPU 内核，unsloth 可以在不更改任何硬件的情况…...

编程日记 2024/8/17 4:30:16

IPD-华为研发之道分析与理解

关于西方众多优秀的管理模式、理论我们学习过，也借鉴以及实践过，拿到《IPD-华为研发之道》通读研习后，正如书中所述，IPD是一套产品开发的模式、理念与方法，IPD思想，流程和方法是诸多成功企业优秀实践的经验…...

编程日记 2024/8/17 4:29:15

时空序列顶会文章

ICLR 2024 时间序列（Time Series）高分论文 - 知乎 (zhihu.com) ICML2024全部论文 icml.cc/virtual/2024/papers.html...

编程日记 2024/8/17 4:28:13

C语言-使用指针数组作为函数参数，实现对10个字符串进行排序

使用指针数组作为函数参数，实现对10个字符串进行排序 1.输入 lisi hahaha hehehe helloa leihoua lisi nihaoa wangwu ajax bureau2.输出 ajax bureau hahaha hehehe helloa leihoua lisi lisi nihaoa wangwu3.程序： #define _CRT_SECURE_NO_WARNING…...

编程日记 2024/8/17 4:27:12

？？？ABC366:F - Maximum Composition（dp，无序：贪心排序）

问题陈述给你 NN 个线性函数 f1,f2,…,fNf1,f2,…,fN ，其中 fi(x)AixBifi(x)AixBi . 求由 KK 组成的序列 p(p1,p2,…,pK)p(p1,p2,…,pK) 中 fp1(fp2(…fpK(1)…))fp1(fp2(…fpK(1)…)) 的最大可能值。介于 11 和 NN (含)之间的个不…...

编程日记 2024/8/17 4:24:08

unity项目打包为webgl后应用于vue项目中（iframe模式）的数据交互

参考文章： 1.Unity打包WebGL: 导入Vue 2.unity文档-WebGL：与浏览器脚本交互 3.unity与vue交互(无第三方插件） 目录一、前期工作1.新建.jslib文件2.新建.cs脚本3. 新建一个Text对象和button按钮对象4.添加脚本空对象UIEvent5.导出unity为w…...

编程日记 2024/8/17 4:19:01

【数据结构与算法 | 图篇】Bellman-Ford算法（单源最短路径算法）

1. 前言前文的迪杰斯特拉算法不能求解有负边的图的最短路径的问题。而此文的Bellman-Ford可以处理含负权边的图算法，并且能检测出图中是否存在负环（权重和为负数的环）. 2. 基本思想 1. 初始化： 对于所有顶点 v ∈ V \ {s}&am…...

编程日记 2024/8/17 4:18:00

Python | Leetcode Python题解之第336题回文对

题目： 题解： class Solution:def palindromePairs1(self, words: List[str]) -> List[List[int]]:# 核心思想--枚举前缀和后缀# 如果两个字符串k1，k2组成一个回文字符串会出现三种情况# len(k1) len(k2),则需要比较k1 k2[::-1]# len(k1…...

编程日记 2024/8/17 4:16:58

C语言家教记录（六）

导语本次授课的内容如下：指针，指针和数组辅助教材为《C语言程序设计现代方法（第2版）》指针指针变量计算机按字节划分地址，每个地址访问一个字节指针变量指向变量的地址，指的是变量第一个字节的…...

编程日记 2024/8/17 4:12:55

C++竞赛初阶L1-11-第五单元-for循环(25~26课)519: T454430 人口增长问题

题目内容假设目前的世界人口有 x 亿，按照每年 0.1% 的增长速度，n 年后将有多少人？ 输入格式一行两个正整数 x 和 n，之间有一个空格。其中，1≤x≤100,1≤n≤100。输出格式一行一个数，表示答案。以亿…...

编程日记 2024/8/17 4:09:52

demo测试

目录接口commonCodeGenerator entityuser mapperUserMapper controllerUserController serviceUserServiceimplUserServiceImpl mapper.xmlpom.xmlapplication.yml 接口 common CodeGenerator package com.llz.demo.common;import com.baomidou.mybatisplus.core.exceptions…...

编程日记 2024/8/17 4:08:51

TinTinLand Web3 + DePIN 共学月｜深入探索 DePIN 项目，全景分析去中心化网络未来

「TinTinLand Web3 主题共学月」是由 TinTinLand 每月发起的主题学习活动，携手知名项目共同打造一个系统化、互动性强的学习平台，帮助开发者不断提升技能，紧跟 Web3 技术的前沿发展。活动通过演示视频、学习打卡、模拟环境、实际操作等多种方…...

编程日记 2024/8/17 4:07:49

Java并发编程（六）

1、java 中有几种方法可以实现一个线程继承 Thread 类实现 Runnable 接口实现 Callable 接口，需要实现的是 call() 方法 2、如何停止一个正在运行的线程使用共享变量的方式在这种方式中，之所以引入共享变量，是因为该变量可以被多个执行…...

编程日记 2024/8/17 4:05:47

k8s对外服务之Ingress

目录 1.Ingress 简介 2.Ingress 组成 3.Ingress-Nginx 工作原理 4.部署 nginx-ingress-controller 5.总结 1.Ingress 简介 service的作用体现在两个方面，对集群内部，它不断跟踪pod的变化，更新endpoint中对应pod的对象，提供了…...

编程日记 2024/8/17 4:04:46

使用Python+moviepy在视频画面上绘制边框

一、使用VideoFileClip对象的的fx函数设置vfx.margin，在视频画面上绘制边框 from moviepy.editor import * mvVideoFileClip(/home/Download/leaves.mp4) mv2mv.fx(vfx.margin,mar3,color(0,0,255),opacity0.5) # 绘制边框# mar3 ：边框宽度3像素&#…...

编程日记 2024/8/17 4:03:45

灵办AI探索之旅：颠覆传统的代码开发工具

前言灵办AI是一个先进的人工智能工具，专注于提高软件开发和项目管理的效率。其核心功能包括代码生成、优化、评估和自动化修复，旨在帮助开发者和团队提升开发速度和代码质量。体验地址：https://ilingban.com/browser_extension/?fromjj …...

编程日记 2024/8/17 4:02:43

【Redis】Redis 数据类型与结构—（二）

Redis 数据类型与结构一、值的数据类型二、键值对数据结构三、集合数据操作效率一、值的数据类型 Redis “快”取决于两方面，一方面，它是内存数据库，另一方面，则是高效的数据结构。 Redis 键值对中值的数据类型，也…...

编程日记 2024/8/17 4:01:41

Tomcat初篇

目录 Tomcat主要特点Tomcat的核心组件Tomcat使用安装Tomcat配置Tomcat启动和停止Tomcat Tomcat工作原理目录结构配置文件性能优化策略 Tomcat Apache Tomcat是一个开源的Servlet容器和Web服务器，广泛用于运行基于Java的Web应用程序。它实现了Java Servlet和JavaSer…...

编程日记 2024/8/17 4:00:39

机器学习（2）-- KNN算法之手写数字识别

KNN算法 KNN（K-Nearest Neighbor，K最近邻）算法是一种用于分类和回归的非参数统计方法，尤其在分类问题中表现出色。在手写数字识别领域，KNN算法通过比较测试样本与训练样本之间的距离，找到最近的K个邻居&am…...

编程日记 2024/8/17 3:54:32

【机器人】关于钉钉机器人如何进行自定义开发问答【详细清晰】

目标：当用户输入问题并钉钉机器人，钉钉机器人进行相应的回答，达到一种交互问答的效果开发文档参考：https://open.dingtalk.com/document/orgapp/robot-overview 首先进行登录企业，后面如果没有进行登录，会…...

编程日记 2024/8/17 3:51:27

告别手动标注！用SAM（Segment Anything）和Python脚本，5分钟批量生成你的分割数据集

5分钟批量生成分割数据集：SAM自动化标注全流程实战在计算机视觉领域，数据标注一直是制约模型开发效率的瓶颈。传统手工标注不仅耗时费力，还容易引入人为误差。Meta开源的Segment Anything Model（SAM）彻底改变了这一局…...

编程新知 2026/5/25 15:45:48

四大桌面云品牌评测：从安全、体验到性价比

桌面云不再是大型企业的专属，它已成为各行各业实现数据安全、混合办公和IT降本增效的“标准配置”。经过对市场主流方案的全面评估，我们认为，深信服（Sangfor）aDesk桌面云因其在安全内生化、传输协议自研化、运维管理智…...

编程新知 2026/5/25 15:01:19

【Midjourney霓虹效果终极指南】：20年AI视觉工程师亲授5大参数组合+3类光源建模公式，97%新手一周内复刻赛博朋克海报

更多请点击： https://kaifayun.com 第一章：霓虹美学的视觉原理与Midjourney适配性解析霓虹美学源于20世纪都市夜景中的荧光灯管、电子广告与赛博朋克文化，其核心视觉特征包括高饱和度冷暖对比、边缘辉光（glow）、深色…...

编程新知 2026/5/25 14:59:02

游戏开发/机器人导航必看：极坐标到底比XY坐标强在哪？Unity/ROS中的实战案例

你的输出 (必须严格遵循以下YAML格式，无需任何分析过程)相关性: ... 改写后查询: ... 企业名称: ... 基础信息: ... 职位: ... json {"business_segment": "礼品","main_product": "百度电商","reason": "用…...

编程新知 2026/5/25 12:42:37

番茄小说下载器：三步打造你的离线阅读自由王国

番茄小说下载器：三步打造你的离线阅读自由王国【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 你是否曾在通勤路上读到精彩章节时突然断网？是否在长途旅…...

编程新知 2026/5/25 12:40:26

ChartGPT深度解析：基于AI的自然语言图表生成架构设计与企业级应用

ChartGPT深度解析：基于AI的自然语言图表生成架构设计与企业级应用【免费下载链接】chart-gpt AI tool to build charts based on text input 项目地址: https://gitcode.com/gh_mirrors/ch/chart-gpt ChartGPT是一款创新的AI驱动图表生成工具，通…...

编程新知 2026/5/25 12:36:02

SharpKeys终极指南：Windows键盘重映射的专业解决方案

SharpKeys终极指南：Windows键盘重映射的专业解决方案【免费下载链接】sharpkeys SharpKeys is a utility that manages a Registry key that allows Windows to remap one key to any other key. 项目地址: https://gitcode.com/gh_mirrors/sh/sharpkeys 在…...

编程新知 2026/5/25 12:22:23

SISSO符号回归算法：革命性可解释AI模型的3大技术突破

SISSO符号回归算法：革命性可解释AI模型的3大技术突破【免费下载链接】SISSO A data-driven method combining symbolic regression and compressed sensing for accurate & interpretable models. 项目地址: https://gitcode.com/gh_mirrors/si/SISSO 在…...

编程新知 2026/5/25 10:41:52

UniversalUnityDemosaics：Unity游戏马赛克移除技术的深度解析与实践指南

UniversalUnityDemosaics：Unity游戏马赛克移除技术的深度解析与实践指南【免费下载链接】UniversalUnityDemosaics A collection of universal demosaic BepInEx plugins for games made in Unity3D engine 项目地址: https://gitcode.com/gh_mirrors/un/Univers…...

编程新知 2026/5/25 10:04:22

为什么你的Mac鼠标和触控板总在“打架“？Scroll Reverser终结滚动方向混乱

为什么你的Mac鼠标和触控板总在"打架"？Scroll Reverser终结滚动方向混乱【免费下载链接】Scroll-Reverser Per-device scrolling prefs on macOS. 项目地址: https://gitcode.com/gh_mirrors/sc/Scroll-Reverser 在Mac生态系统中，有一…...

编程新知 2026/5/25 9:34:17

特点

支持模型

版本

Google Colab支持

相关文章：