一文读懂大模型文件后缀名,解锁 AI 世界的密码
在大模型的世界里,各种文件后缀名就像一把把钥匙,打开通往不同应用和功能的大门。今天,咱们就来聊聊那些常见又重要的大模型文件后缀名。
safetensors:安全与高效的守护者
safetensors 是一种基于 Python 的序列化格式,专为机器学习模型设计。它最大的特点就是安全,在保存和加载模型时,能够有效防止潜在的代码执行风险,保障数据安全。同时,其读写速度快,占用内存少,使得模型的存储和传输都更加高效。比如在一些对数据安全要求极高的金融领域大模型中,safetensors 格式就得到了广泛应用,既能保证模型数据安全,又能快速响应业务需求。
gguf:轻量化推理的利器
gguf 格式是专门为在 CPU 和移动设备上进行高效推理而设计的。它对模型进行了优化,使得模型在运行时占用更少的资源,却能保持相当不错的推理性能。像在一些移动端 AI 应用,如智能图像识别 APP 中,使用 gguf 格式的模型,就能在手机等设备上流畅运行,快速给出识别结果,让用户获得良好的体验。
ckpt:深度学习训练的关键
ckpt 是 Checkpoint 的缩写,常用于深度学习训练过程中。它保存了模型在训练过程中的参数、优化器状态等信息。这意味着,如果训练因为某些原因中断,我们可以从对应的 ckpt 文件中恢复训练,而无需从头开始,大大节省了时间和资源。在大规模图像分类模型训练中,ckpt 文件发挥着重要作用,帮助研究者不断优化模型。
pth:PyTorch 的专属
pth 是 PyTorch 框架常用的模型保存格式。PyTorch 凭借其动态图机制在深度学习领域备受青睐,而 pth 格式文件则很好地适配了 PyTorch 的特性。它可以方便地保存和加载模型,无论是模型的训练、验证还是部署,pth 文件都能顺畅完成任务,许多基于 PyTorch 开发的 NLP 模型都以 pth 格式保存。
新增文件格式介绍
bin:二进制的高效存储
bin 是一种二进制文件格式 ,不同的深度学习框架可能会有自己的 bin 文件格式用于保存模型参数或模型结构等信息。通常它是经过优化的二进制格式,被 Hugging Face Transformers 库广泛使用。其以二进制形式存储数据,读写效率高,文件体积较小,但可读性差,并且不同框架之间的 bin 文件格式可能不兼容,需要相应的框架或工具来解析和加载。在一些需要高效存储和传输模型的场景中,bin 格式就派上了用场。
h5:灵活的数据存储
HDF5(.h5)是一种灵活的数据存储格式,支持大量的数据和复杂的数据组织形式。在深度学习中,尤其是使用 Keras 框架时,模型经常以 HDF5 格式存储。它能很好地管理大规模的数据,比如在图像识别大模型中,大量的图像数据及其标注信息可以通过 h5 文件有序存储,方便模型训练时读取。
pb:跨平台的结构化数据
Protocol Buffers(.pb)是 Google 开发的一种语言无关、平台无关的可扩展机制,用于序列化结构化数据。TensorFlow 通常使用这种格式来保存和加载模型。凭借其跨平台特性,pb 格式的模型可以在不同的系统和设备上运行,在一些需要广泛部署模型的场景中较为常用。
onnx:模型移植的桥梁
Open Neural Network Exchange(ONNX,.onnx)是一个开放格式,用于表示深度学习模型。ONNX 旨在使模型可以在不同的深度学习框架之间轻松移植。比如,一个在 PyTorch 框架下训练好的模型,可以转换为 onnx 格式,然后在其他支持 ONNX 的框架中使用,为模型的跨框架应用提供了便利。
相关文章:
一文读懂大模型文件后缀名,解锁 AI 世界的密码
在大模型的世界里,各种文件后缀名就像一把把钥匙,打开通往不同应用和功能的大门。今天,咱们就来聊聊那些常见又重要的大模型文件后缀名。 safetensors:安全与高效的守护者 safetensors 是一种基于 Python 的序列化格式ÿ…...
探索 Peewee:轻量级 Python ORM 简明指南
文章目录 探索 Peewee:轻量级 Python ORM 简明指南主要特点:安装:使用示例:1. 定义模型:2. 初始化数据库:3. 数据操作(增、查、改、删):4. 查询构建器:5. 迁移…...
生产者标签(Producer Tag) 和 普通连接(显式或隐式连接)的区别:
在 EtherNet/IP 的通信架构中,生产者标签(Producer Tag) 和 普通连接(显式或隐式连接)的区别主要体现在 通信模式、实时性、数据流向 和 资源管理 上。以下是详细对比: 1. 定义与用途 类型生产者标签&…...
【速写】解码与kv-cache的简单细节
问题:在使用transformers调用huggingface生成式模型时,我们可以通过model.generate_ids来获取模型生成的若干id,那么我应该如何查看这些生成id对应的logits大小(即生成概率) 在Hugging Face的Transformers库中&#x…...
Mac【卸载 Python】 - 3.12.2
一、若使用官方安装包安装 1. 删除 Python 框架 Python 官方安装包会将 Python 安装到 /Library/Frameworks/Python.framework/Versions/3.12 目录下。你可以在终端中使用以下命令删除该目录: sudo rm -rf /Library/Frameworks/Python.framework/Versions/3.12 …...
自学Java-AI结合GUI开发一个石头迷阵的游戏
自学Java-AI结合GUI开发一个石头迷阵的游戏 准备环节1、创建石头迷阵的界面2、打乱顺序3、控制上下左右移动4、判断是否通关5、统计移动步骤,重启游戏6、拓展问题 准备环节 技术: 1、GUI界面编程 2、二维数组 3、程序流程控制 4、面向对象编程 ∙ \bulle…...
Liunx(CentOS-6-x86_64)系统安装MySql(5.6.50)
一:安装Liunx(CentOS-6-x86_64) 安装Liunx(CentOS-6-x86_64) 二:下载MySql(5.6.50) MySql下载官网 二:安装MySql 2.1 将mysql上传到Liunx 文件地址 /usr/local/ 2…...
Java Web开发实战与项目——开发一个在线论坛系统
在线论坛系统是一个常见的Web应用,通常具有用户注册、帖子发布、评论互动、消息推送等基本功能。开发这样一个系统,既涉及到前后端的技术栈选择,也需要考虑性能、扩展性等实际问题。本文将从设计论坛模块、实现消息推送与实时更新功能、以及优…...
ubuntu24.04无法安装向日葵,提示依赖libgconf-2-4怎么办?
在向日葵官方下载的deb包,目前是SunloginClient_15.2.0.63062_amd64.deb,执行安装代码,如下: sudo < /span > dpkg< /span > -i< /span > SunloginClient_15< /span >.2< /span >.0< /span >…...
C++ 设计模式-访问者模式
C++访问者模式 一、模式痛点:当if-else成为维护噩梦 开发动物园管理系统,最初的需求很简单: class Animal {}; class Cat : public Animal {}; class Dog : public Animal {};// 处理动物叫声 void makeSound(Animal* a) {if (auto c = dynamic_cast<Cat*>(a)) {st…...
Kubernetes 使用 Kube-Prometheus 构建指标监控 +飞书告警
1 介绍 Prometheus Operator 为 Kubernetes 提供了对 Prometheus 机器相关监控组件的本地部署和管理方案,该项目的目的是为了简化和自动化基于 Prometheus 的监控栈配置,主要包括以下几个功能: Kubernetes 自定义资源:使用 Kube…...
《Operating System Concepts》阅读笔记:p62-p75
《Operating System Concepts》学习第 10 天,p62-p75 总结,总计 14 页。 一、技术总结 1. system call (1) 定义 The primary interface between processes and the operating system, providing a means to invoke services made available by th…...
Node.js中不支持require和import两种导入模块的混用
最近在整理Node.js相关的知识点,发现通过Node.js支持的两个模块导入语句require和import在同时使用时会发生错误,而且错误非常诡异。 例如,在先使用require导入模块,在使用import导入模块时,出现require无法识别&#…...
WPF的页面设计和实用功能实现
目录 一、TextBlock和TextBox 1. 在TextBlock中实时显示当前时间 二、ListView 1.ListView显示数据 三、ComboBox 1. ComboBox和CheckBox组合实现下拉框多选 四、Button 1. 设计Button按钮的边框为圆角,并对指针悬停时的颜色进行设置 一、TextBlock和TextBox…...
window安装MySQL5.7
1、下载MySQL5.7.24 浏览器打开: https://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-5.7.24-winx64.zip 2、解压缩 下载下来的是一个压缩包,解压到你想放到的目录下面,我放的是“C:\MySQL” 3、配置MySQL环境变量 计算机右键 - 属性 …...
数据结构:哈希表(二)
目录 一、哈希表 1、概念 二、哈希冲突 1、概念 2、冲突避免 (1)哈希函数设计 (2)负载因子调节 3、冲突解决 (1)闭散列 1、线性探测 2、二次探测 (2)开散列 4、哈希桶实…...
blender笔记2
一、物体贴地 物体->变换->对齐物体 ->对齐弹窗(对齐模式:反方,相对于:场景原点,对齐:z)。 之后可以设置原点->原点--3d游标 二、面上有阴影 在编辑模式下操作过后,物体面有阴影。 数据-&g…...
1.21作业
1 unserialize3 当序列化字符串中属性个数大于实际属性个数时,不会执行反序列化 外部如果是unserialize()会调用wakeup()方法,输出“bad request”——构造url绕过wakeup 类型:public class&…...
深入浅出:理解闭包在JavaScript中的应用
什么是闭包 闭包(Closure)是 JavaScript 中的一个重要概念,也是函数式编程中的核心特性之一。简单来说,闭包是指一个函数能够访问并记住其词法作用域(Lexical Scope),即使这个函数在其词法作用…...
【Quest开发】全身跟踪(一)
软件:Unity 2022.3.51f1c1、vscode、Meta XR All in One SDK V72 硬件:Meta Quest3 最终效果:能像meta的操作室沉浸场景一样根据头盔移动来推断用户姿势,实现走路、蹲下、手势匹配等功能 需要借助UnityMovement这个包 GitHub …...
【QT中的一些高级数据结构,持续更新中...】
QT中有一些很精妙、便捷的设计,在了解这些数据的同时,我们可以学到如何更好的设计代码。本贴持续更新中,欢迎关注和收藏 一 QScopedPointer主要特点:示例代码 二 Q_DISABLE_COPY 一 QScopedPointer QScopedPointer 是 Qt 中的一种…...
最新版本Exoplayer扩展FFmpeg音频软解码保姆级教程
ExoPlayer 是一个开源的 Android 媒体播放库,由 Google 开发和维护,用于替代 Android 系统自带的 MediaPlayer。它提供了更强大的功能、更好的性能和更高的灵活性,适用于各种复杂的媒体播放场景。所以被广泛用于各种播放器场景。 最近项目中…...
JS:页面事件
文章目录 一、页面加载事件二、页面滚动事件三、页面尺寸事件总结 一、页面加载事件 有时候我们会把script的内容放在body前,这时候代码的执行在元素的加载之前,会导致页面元素未加载而报错 解决办法是调用Window的load加载事件,将所有操作放…...
✨ 索引有哪些缺点以及具体有哪些索引类型
索引的定义与原理 索引是数据库中用于提高数据检索效率的数据结构。它就像是书籍的目录,通过目录可以快速定位到所需内容的页码,而在数据库中,索引可以帮助数据库系统快速找到符合查询条件的数据行,而不必对整个表进行扫描。 其…...
C++ ——继承
体现的是代码复用的思想 1、子类继承父类,子类就拥有了父类的特性(成员方法和成员属性) 2、已存在的类被称为“基类”或者“父类”或者“超类”;新创建的类被称为“派生类”或者“子类” 注意: (1&#…...
vue,vue3 keepalive没有效果,无法缓存页面include无效,keep-alive
keepalive没有效果,无法缓存页面? 问题大概是组件的name值不对应,vue2修改组件文件的name值,vue3保持组件文件名称和路由页面配置的name一致就可以了,如果vue3不想保持一致,必须手动在文件后面添加export..…...
DeepSeek智能测试知识库助手PRO版:多格式支持+性能优化
前言 测试工程师在管理测试资产时,需要面对多种文档格式、大量文件分类及知识库的构建任务。为了解决这些问题,我们升级了 DeepSeek智能测试知识库助手,不仅支持更多文档格式,还加入了 多线程并发处理 和 可扩展格式支持,大幅提升处理性能和灵活性。 主要功能亮点: 多格…...
【ELK】【Elasticsearch】数据查询方式
1. 简单查询(URI Search) 通过 URL 参数直接进行查询,适合简单的搜索场景。 示例: bash 复制 GET /index_name/_search?qfield_name:search_value 说明: index_name:索引名称。 field_name…...
Kotlin 优雅的接口实现
1. 日常遇到的冗余的接口方法实现 日常开发中,经常会要实现接口,但是很多场景中,只需要用到其中一两个方法,例如 ActivityLifecycleCallbacks,它有很多个接口需要实现,但是很多时候我们只需要用到其中的一…...
go 通过ssh连接linux golang.org/x/crypto/ssh
ssh.Dial golang.org/x/crypto/ssh package mainimport ("bytes""log""os""strings""golang.org/x/term""golang.org/x/crypto/ssh" )// go ssh 连接ssh // 参考blog: // // https://www.cnblogs.c…...
