加载模型时出现 OSError: Unable to load weights from pytorch checkpoint file 报错的解决
加载模型时出现 OSError: Unable to load weights from pytorch checkpoint file 报错的解决
- 报错信息
- 原因查明
- 网传解决措施
- 好消息
- 我的解决措施
报错信息
- 查了下,在网上还是个比较常见的报错
一般为加载某模型时突然报错

原因查明
- 一般为下载某个
XXX_model.bin的时候下载报错了
而下载源可以看到为 HuggingFace
网传解决措施
- 首先得看看你是下载哪个模型报错了。像我这里有一个中间模型,所以不知道是哪个低层模型下载报错了。
打开~/.cache/huggingface/hub,这里~表示本机用户名
若有多个模型,你可以看一下修改日期是今天的为哪个

这里发现,是模型potsawee--t5-large-generation-squad-QuestionAnswer
去HuggingFace上搜索相应模型,自行下载,比如我这里即为 网址

该文件下载到刚刚那个缓存文件夹中对应的放那些files的文件夹。 - 做法二:删除该缓存文件夹中所有东西,再运行一遍代码。
好消息
- 虽然貌似没有报错,但是加载
selfcheck_mqag模型的时候内存完全吃完了,卡到死机也没跑完初始化,可能是没问题了只是太吃内存了
对于一般的小模型该报错可能可以直接解决了。
我的解决措施
-
既然本机实在是跑不了,大不了不跑本机,去
Colab上跑
见我的博客,关于Colab的简单应用 -
首先代码放进去,然后先跑个
install包命令

-
然后再运行代码

-
发现对于所有的文件,包括
bin文件都成功安装。
初始化成功,且不吃本机资源,nicenicenice

-
yy:
MQAG也太tm吃资源了
相关文章:
加载模型时出现 OSError: Unable to load weights from pytorch checkpoint file 报错的解决
加载模型时出现 OSError: Unable to load weights from pytorch checkpoint file 报错的解决报错信息原因查明网传解决措施好消息我的解决措施报错信息 查了下,在网上还是个比较常见的报错 一般为加载某模型时突然报错 原因查明 一般为下载某个 XXX_model.bin 的…...
sessionStorage , localStorage 和cookie的区别
一.sessionStorage(临时存储)sessionStorage是HTML5中新增的Web Storage API之一,用于在浏览器中存储键值对数据,与localStorage类似,但是sessionStorage存储的数据在会话结束时会被清除。可以通过以下方式使用sessionStorage:存储…...
C# 实例详解委托之Func、Action、delegate
委托是.NET编程的精髓之一,在日常编程中经常用到,在C#中实现委托主要有Func、Action、delegate三种方式,这个文章主要就这三种委托的用法通过实例展开讲解。 【Func】:Func是带返回值的委托: 原型函数如下(以下展示的…...
如何选电脑
1、CPU(中央处理器) 怎么看CPU型号:CPU:系列-代数等级核心显卡型号电压后缀 例如CPU:i7-10750H : 1、系列:Intel的酷睿i3、i5、i7、i9这四个系列的CPU,数字越大就代表越高端。 2、代数:代表…...
SpringBoot项目创建
如果使用spring的源地址创建项目失败,就使用 阿里云的springBoot项目创建地址:https://start.aliyun.com/ 1.new 一个新的项目: 2.选择合适的版本java的JDK和maven项目 3.选择spring web依赖 4.直接finish 5. 删除无用的包,然后…...
神经衰弱该如何判断?确诊为神经衰弱,日常要做好这7大护理!
神经衰弱是由于长时间处于紧张或者压力的情况下导致精神出现兴奋或者疲乏现象而伴随着一系列症状。如情绪烦恼、容易激怒、睡眠障碍、肌肉出现紧张性疼痛等,生活中有很多人在自己的不到休息或者遇到强大打击时就会嘲笑自己患上神经衰弱。甚至一些会盲目采取措施&…...
Linux之进程替换
进程替换1.什么是进程替换2.替换函数2.1 execl函数2.2 execv函数2.3 execlp函数2.4 execvp函数2.5 在自己的C程序上如何运行其他语言的程序?2.6 execle 函数2.7 小结3.一个简易的shell1.什么是进程替换 fork()之后,父子各自执行父进程代码的一部分&…...
关于清除浮动
浮动最早是用来做图文排版,为了让块级元素同行显示,而html中块元素是有自己的排列规则,一般独占一行。所以有了浮动元素,一旦元素浮动了就会脱离文档流,产生问题。怎么去清除浮动:(1)…...
Uber H3 index 地图索引思考
H3 是 uber 设计的六边形空间索引,go 语言操作包是 h3-go,可以通过经纬度获取所在的 h3 六边形边界,每个经纬度对应的六边形都是确定的,每个六边形唯一对应了一个 h3index。在业务开发中,我们可以通过 h3index 来对地理…...
多线程的几种状态
Java-多线程的几种状态🔎1.NEW( 系统中线程还未创建,只是有个Thread对象)🔎2.RUNNABLE( (就绪状态. 又可以分成正在工作中和即将开始工作)🔎3.TERMINATED(系统中的线程已经执行完了,Thread对象还在)🔎4.TIMED_WAITING(指定时间等待…...
【算法题】1574. 删除最短的子数组使剩余数组有序
题目: 给你一个整数数组 arr ,请你删除一个子数组(可以为空),使得 arr 中剩下的元素是 非递减 的。 一个子数组指的是原数组中连续的一个子序列。 请你返回满足题目要求的最短子数组的长度。 示例 1: …...
理解对数——金融问题中的自然对数(以e为底的对数)
第3章 金融问题(Financial Matters)——金融问题中的自然对数If thou lend moneyto any ofMy people. ...thou shalt not beto him as a creditor;neither shall yelay upon him interest.(如果你借钱给我的任何人。 ……你不应该是他的债权人;也不可向他加息。)——…...
vue2进阶学习之路
HTML、CSS和JavaScript基础 在学习Vue2之前,需要掌握HTML、CSS和JavaScript的基础知识。包括HTML的标签、CSS的布局和样式、JavaScript的变量类型、条件语句、循环语句等。 Vue2的基础知识 掌握Vue2的基本概念和语法,包括Vue2实例、数据绑定、指令、组件…...
决策树ID3算法
1. 决策树ID3算法的信息论基础 机器学习算法其实很古老,作为一个码农经常会不停的敲if, else if, else,其实就已经在用到决策树的思想了。只是你有没有想过,有这么多条件,用哪个条件特征先做if,哪个条件特征后做if比较优呢&#…...
C++模板基础(一)
函数模板(一) ● 使用 template 关键字引入模板: template void fun(T) {…} – 函数模板的声明与定义 – typename 关键字可以替换为 class ,含义相同 – 函数模板中包含了两对参数:函数形参 / 实参;模板形…...
生产者消费者模型线程池(纯代码)
目录 生产者消费者模型 条件变量&&互斥锁(阻塞队列) makefile Task.hpp BlockQueue.hpp BlockQueueTest.cc 信号量&&互斥锁(环形队列) makefile RingQueue.hpp RingQueueTest.cc 线程池(封…...
K8s 应用的网络可观测性: Cilium VS DeepFlow
随着分布式服务架构的流行,特别是微服务等设计理念在现代应用普及开来,应用中的服务变得越来越分散,因此服务之间的通信变得越来越依赖网络,很有必要来谈谈实现微服务可观测性中越来越重要的一环——云原生网络的可观测。K8s 是微服务设计理念能落地的最重要的承载体,本文…...
3.29面试题
文章目录内存内存管理执行过程要点面试题内存 内存管理 由JVM管理 堆:new出来的对象(包括成员变量、数组元素、方法的地址)栈:局部变量(包括方法的参数)方法区:.class字节码文件(…...
操作系统漏洞发现
操作系统漏洞发现前言一、操作系统漏洞发现1.1 namp2. Goby3. Nessus二,进行渗透测试2.1 使用工具进行渗透1. metasploit2.2 EXP2.3 复现文章三,操作系统漏洞修复前言 不管是对于App来说,还是web站点来说,操作系统是必须的&#x…...
Linux gdb调试底层原理
TOC 前言 linux下gdb调试程序操作过程参考本人文章:gdb调试操作; 这里不再叙述; 本文主要内容是介绍GDB本地调试的底层调试原理,我们来看一下GDB是通过什么机制来控制被调试程序的执行顺序; 总结部分是断点调试的底层原理,可以直接跳转过去先看看大概…...
Cursor Pro功能解锁技术解析与实践指南
Cursor Pro功能解锁技术解析与实践指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your trial request limit. / Too m…...
BetterGI 0.38.1版本安装失败终极解决方案:从诊断到修复的完整指南
BetterGI 0.38.1版本安装失败终极解决方案:从诊断到修复的完整指南 【免费下载链接】better-genshin-impact 🍨BetterGI 更好的原神 - 自动拾取 | 自动剧情 | 全自动钓鱼(AI) | 全自动七圣召唤 | 自动伐木 | 自动派遣 | 一键强化 - UI Automation Testi…...
百川2-13B量化版性能实测:OpenClaw长任务下的Token消耗与稳定性
百川2-13B量化版性能实测:OpenClaw长任务下的Token消耗与稳定性 1. 测试背景与动机 上周在尝试用OpenClaw自动化处理一个包含2000多份PDF的文献库时,遇到了令人头疼的Token消耗问题。原本计划让AI助手完成"读取PDF标题-提取关键词-分类归档"…...
14届蓝桥杯省赛Java B 组Q1+Q3+Q10
题目链接: Q1 蓝桥云课:幸运数字 洛谷:P12324 [蓝桥杯 2023 省 Java B] 幸运数字 Q3 蓝桥云课:矩形总面积 洛谷:P12326 [蓝桥杯 2023 省 Java B] 矩形总面积 Q10 蓝桥云课:阶乘求和 洛谷ÿ…...
终极桌面伴侣BongoCat:让键盘鼠标操作变得生动有趣的虚拟猫咪
终极桌面伴侣BongoCat:让键盘鼠标操作变得生动有趣的虚拟猫咪 【免费下载链接】BongoCat 让呆萌可爱的 Bongo Cat 陪伴你的键盘敲击与鼠标操作,每一次输入都充满趣味与活力! 项目地址: https://gitcode.com/gh_mirrors/bong/BongoCat …...
MobaXterm配置教程:Chord视频时空理解工具远程开发
MobaXterm配置教程:Chord视频时空理解工具远程开发 1. 为什么需要MobaXterm来开发Chord视频时空理解工具 在AI视频理解领域,Chord这类工具通常部署在高性能服务器或云环境中,本地开发机往往难以承载其计算需求。这时候,远程开发…...
AI超清画质增强镜像使用技巧:避免移动端适配的3个坑
AI超清画质增强镜像使用技巧:避免移动端适配的3个坑 1. 理解镜像的核心能力与限制 在移动端使用AI超清画质增强镜像前,必须清楚了解它能做什么、不能做什么。这个基于OpenCV EDSR模型的镜像,本质上是一个专注图像重建的轻量级服务。 1.1 核…...
一款强大的音视频转字幕工具,完全免费、无广告!
聊一聊有些人你让他上镜,他不习惯。你让他写,他觉得太麻烦。但你让他说,那是头头是道。这个时候,语音输入,语音转文字工具就很实用。今天给大家分享一款,语音输入工具。感觉在使用过程中,有一点…...
2026最新:宁波高新区代理记账收费标准公布,科技企业月均300元起
上周一位在高新区软件园创业的李总问我:"我们公司刚成立,就3个人,找一个代理记账一个月要花多少钱?"这个问题几乎是每个高新区创业者都会问的。作为在宁波服务了15年的财税机构,今天我就给大家说个明白。高新…...
Realistic Vision V5.1 复古与未来风碰撞:赛博朋克城市中的古典人物肖像
Realistic Vision V5.1 复古与未来风碰撞:赛博朋克城市中的古典人物肖像 最近在玩Realistic Vision V5.1这个模型,突发奇想,想试试看它能不能理解一些“矛盾”的指令。比如,让一个穿着精致古典服饰的人物,站在霓虹闪烁…...
