当前位置: 首页 > article >正文

在本地Windows机器加载大模型并生成内容

本篇演示在本地机器下载和加载大模型并获取AI产生的内容。简单起见,使用的大模型是Qwen2.5-0.5B-Instruct,整个模型的所有文件不到1G。

Qwen2.5-0.5B-Instruct 是阿里巴巴云 QWen 团队基于 Transformer 架构开发的轻量级指令调优语言模型,专为资源有限场景设计。

环境准备

  • OS: Windows 10
  • 开发IDE : VS Code
  • Python: 3.11

Python库安装步骤:

  1. 安装TensorFlow
pip install tensorflow

TensorFlow 是 Google 开发的开源深度学习框架,提供灵活高效的模型构建、训练与部署能力,支持多平台应用与大规模机器学习任务。

  1. 安装PyTorch
pip install torch

PyTorch 是由 Facebook 人工智能研究院(FAIR)研发的开源深度学习框架,以动态计算图、易用接口和强大的自动求导功能为核心,助力快速迭代研究与灵活模型开发。

  1. 安装accelerate
pip install accelerate

Accelerate 是 Hugging Face 推出的深度学习优化库,通过简化分布式训练、混合精度计算及硬件加速(如 GPU/TPU)的集成,显著提升模型训练效率与资源利用率。

  1. 安装modelscope

ModelScope 的 Python 库是阿里开发的一个功能强大的工具,旨在帮助开发者更方便地使用和管理机器学习模型,尤其是预训练模型。

编写代码

这里的代码是让 Qwen2.5-0.5B-Instruct 完成一个Java的闰年计算的编码任务:

from modelscope import AutoModelForCausalLM, AutoTokenizermodel_name = "Qwen/Qwen2.5-0.5B-Instruct"model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto",device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)input_text = "请完成一个Java的计算闰年的函数,不需要任何解释性的内容,只需要输出代码就可以"
messages = [{"role": "system", "content": "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."},{"role": "user", "content": input_text}
]
text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)# Use `max_new_tokens` to control the maximum output length.
generated_ids = model.generate(model_inputs.input_ids, max_new_tokens=1024, do_sample=False)[0]
# The generated_ids include prompt_ids, so we only need to decode the tokens after prompt_ids.
output_text = tokenizer.decode(generated_ids[len(model_inputs.input_ids[0]):], skip_special_tokens=True)print(f"Prompt: {input_text}\n\nGenerated text: {output_text}")
  • 代码运行首先会下载模型文件
  • 下载完成之后就会加载模型并且生成结果了。

执行后的结果如下:

问题解决

如果不是严格按照上述步骤执行的话,运行过程的可能会有如下问题,可以参照解决。

1 . cannot import name ‘AutoModelForCausalLM’ from ‘modelscope’

详细的错误信息如下:

PS D:\devworkspace\vs\ai_ency\ai_python_ency> & d:/devworkspace/vs/ai_ency/ai_python_ency/.conda/python.exe d:/devworkspace/vs/ai_ency/ai_python_ency/qwen/quickstart/Qwen2.5-Coder-0.5B.py
Traceback (most recent call last):File "d:\devworkspace\vs\ai_ency\ai_python_ency\qwen\quickstart\Qwen2.5-Coder-0.5B.py", line 1, in <module>from modelscope import AutoModelForCausalLM, AutoTokenizer
ImportError: cannot import name 'AutoModelForCausalLM' from 'modelscope' (D:\devworkspace\vs\ai_ency\ai_python_ency\.conda\Lib\site-packages\modelscope\__init__.py)    

这个问题比较难发现,错误信息的提示比较不明确, 原因其实是没有安装 TensorFlow 或者TensorFlow 的版本过低。

解决方法,安装会升级TensorFlow

2.None of PyTorch, TensorFlow >= 2.0, or Flax have been found.
PS D:\devworkspace\vs\ai_ency\ai_python_ency> & d:/devworkspace/vs/ai_ency/ai_python_ency/.conda/python.exe d:/devworkspace/vs/ai_ency/ai_python_ency/qwen/quickstart/Qwen2.5-Coder-0.5B.py
None of PyTorch, TensorFlow >= 2.0, or Flax have been found. Models won't be available and only tokenizers, configuration and file/data utilities can be used.
None of PyTorch, TensorFlow >= 2.0, or Flax have been found. Models won't be available and only tokenizers, configuration and file/data utilities can be used.
Traceback (most recent call last):File "d:\devworkspace\vs\ai_ency\ai_python_ency\qwen\quickstart\Qwen2.5-Coder-0.5B.py", line 2, in <module>from modelscope import AutoModelForCausalLM, AutoTokenizer
ImportError: cannot import name 'AutoModelForCausalLM' from 'modelscope' (D:\devworkspace\vs\ai_ency\ai_python_ency\.conda\Lib\site-packages\modelscope\__init__.py)   

这里同样是有 ImportError: cannot import name ‘AutoModelForCausalLM’ 的提示,但是同时会提示 None of PyTorch, 很明显就是缺少了PyTorch。

注意,安装的命令是:

pip install torch
3.ImportError: Using low_cpu_mem_usage=True, a device_map or a tp_plan requires Accelerate: pip install 'accelerate>=0.26.0'
Downloading Model from https://www.modelscope.cn to directory: D:\ai\modelscope\cache\models\Qwen\Qwen2.5-0.5B-Instruct
2025-03-25 21:11:49,487 - modelscope - WARNING - Using branch: master as version is unstable, use with caution
2025-03-25 21:11:49,961 - modelscope - INFO - Creating symbolic link [D:\ai\modelscope\cache\models\Qwen\Qwen2.5-0.5B-Instruct].
2025-03-25 21:11:49,962 - modelscope - WARNING - Failed to create symbolic link D:\ai\modelscope\cache\models\Qwen\Qwen2.5-0.5B-Instruct for D:\ai\modelscope\cache\models\Qwen\Qwen2.5-0.5B-Instruct\Qwen\Qwen2___5-0___5B-Instruct.
Traceback (most recent call last):File "d:\devworkspace\vs\ai_ency\ai_python_ency\qwen\quickstart\Qwen2.5-Coder-0.5B.py", line 6, in <module>model = AutoModelForCausalLM.from_pretrained(^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\devworkspace\vs\ai_ency\ai_python_ency\.conda\Lib\site-packages\modelscope\utils\hf_util\patcher.py", line 230, in from_pretrainedmodule_obj = module_class.from_pretrained(^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\devworkspace\vs\ai_ency\ai_python_ency\.conda\Lib\site-packages\transformers\models\auto\auto_factory.py", line 573, in from_pretrainedreturn model_class.from_pretrained(^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\devworkspace\vs\ai_ency\ai_python_ency\.conda\Lib\site-packages\transformers\modeling_utils.py", line 272, in _wrapperreturn func(*args, **kwargs)^^^^^^^^^^^^^^^^^^^^^File "D:\devworkspace\vs\ai_ency\ai_python_ency\.conda\Lib\site-packages\transformers\modeling_utils.py", line 4203, in from_pretrainedraise ImportError(
ImportError: Using `low_cpu_mem_usage=True`, a `device_map` or a `tp_plan` requires Accelerate: `pip install 'accelerate>=0.26.0'`

这个提示也很明显,安装accelerate 就可以了。


相关文章:

在本地Windows机器加载大模型并生成内容

本篇演示在本地机器下载和加载大模型并获取AI产生的内容。简单起见&#xff0c;使用的大模型是Qwen2.5-0.5B-Instruct&#xff0c;整个模型的所有文件不到1G。 Qwen2.5-0.5B-Instruct 是阿里巴巴云 QWen 团队基于 Transformer 架构开发的轻量级指令调优语言模型&#xff0c;专…...

热门面试题第14天|Leetcode 513找树左下角的值 112 113 路径总和 105 106 从中序与后序遍历序列构造二叉树 (及其扩展形式)以一敌二

找树左下角的值 本题递归偏难&#xff0c;反而迭代简单属于模板题&#xff0c; 两种方法掌握一下 题目链接/文章讲解/视频讲解&#xff1a;https://programmercarl.com/0513.%E6%89%BE%E6%A0%91%E5%B7%A6%E4%B8%8B%E8%A7%92%E7%9A%84%E5%80%BC.html 我们来分析一下题目&#…...

shopify跨境电商行业前景与规模

Shopify跨境电商行业前景与规模分析 一、行业背景 Shopify 是一个全球知名的电子商务平台&#xff0c;它为小型企业到大型企业提供了创建和管理在线商店的工具。近年来&#xff0c;随着全球化进程的加快以及互联网技术的发展&#xff0c;跨境电商已经成为国际贸易的重要组成部…...

【计算机网络】-计算机网络期末复习题复习资料

一、计算机网络体系结构&#xff08;800字&#xff09; 1. OSI参考模型 七层结构&#xff1a;物理层→数据链路层→网络层→传输层→会话层→表示层→应用层 各层核心功能&#xff1a; 物理层&#xff1a;比特流传输&#xff08;如RJ45、光纤接口&#xff09; 数据链路层&…...

游戏中的碰撞检测算法

参考博客Sort, sweep, and prune: Collision detection algorithms...

批归一化(Batch Normalization)与层归一化(Layer Normalization)的区别与联系

文章目录 一、Batch normalization 理论与应用1. 理论解释2. 数值例子 二、Layer normalization 理论与应用1. 理论解释2. 数值例子 三、Layer Normalization 和 Batch Normalization 的区别四、《Transformers without Normalization》笔记 一、Batch normalization 理论与应用…...

12届蓝桥杯—货物摆放

货物摆放 题目描述 小蓝有一个超大的仓库&#xff0c;可以摆放很多货物。 现在&#xff0c;小蓝有 nn 箱货物要摆放在仓库&#xff0c;每箱货物都是规则的正方体。小蓝规定了长、宽、高三个互相垂直的方向&#xff0c;每箱货物的边都必须严格平行于长、宽、高。 小蓝希望所…...

c++进阶--哈希表的实现

大家好&#xff0c;今天我们来学习ubordered_set和unordered_map的底层哈希表。 目录 哈希表实现 1. 哈希概念 1.1 直接定址法 1.2 哈希冲突 1.3 负载因⼦ 1.4 将关键字转为整数 1.5 哈希函数 下面我们介绍几种哈希函数&#xff1a;1.5.1 除法散列法/除留余数法 1.…...

颠覆传统:SaaS 品牌如何通过 SEO 策略引爆市场!

SaaS 商业模式提供了令人难以置信的可扩展性和盈利能力——但前提是与正确的营销增长策略相结合。 SaaS 品牌知道&#xff0c;托管基于云的应用程序的成本会随着用户量的增加而降低&#xff0c;因此必须专注于订阅者的快速增长&#xff0c;以保持竞争力并降低成本。 许多 CMO…...

【数据库发展史】

数据库的发展历史可以追溯到20世纪50年代&#xff0c;随着计算机技术的进步和数据管理需求的演变&#xff0c;数据库系统经历了多个阶段的变革。以下是数据库技术的主要发展阶段&#xff1a; 1. 前数据库时代&#xff08;1950年代前&#xff09; 手工管理&#xff1a;数据通过…...

HTTP 核心知识点整理

1. HTTP 基础 ​定义&#xff1a;HTTP&#xff08;HyperText Transfer Protocol&#xff09;是应用层协议&#xff0c;基于 ​请求-响应模型&#xff0c;用于客户端&#xff08;浏览器&#xff09;与服务器之间的通信。​特点&#xff1a; ​无状态&#xff1a;每次请求独立&a…...

从AEC-Q100看车规芯片的可靠性设计要点

引言 随着汽车电子化、智能化的飞速发展&#xff0c;汽车电子控制系统对芯片的可靠性提出了极为严苛的要求。AEC-Q100是汽车电子委员会&#xff08;Automotive Electronics Council&#xff09;制定的车规级芯片可靠性标准&#xff0c;旨在确保芯片能够在复杂多变的汽车环境中…...

陕西安全员A证考试的报名流程是什么?

陕西安全员 A 证考试报名流程如下&#xff1a; 进入报名系统&#xff1a;登录陕西省建筑工程施工企业安全管理人员及特种作业人员考试报名系统。首次使用需点击 “特种作业人员注册”&#xff0c;进入个人注册界面。注册账号&#xff1a;输入身份证号、登录密码&#xff0c;并…...

特殊行车记录仪DAT视频丢失的恢复方法

行车记录仪是一种常见的车载记录仪&#xff0c;和常见的“小巧玲珑”的行车记录仪不同&#xff0c;一些特种车辆使用的记录仪的外观可以用“笨重”来形容。下边我们来看看特种车载行车记录仪删除文件后的恢复方法。 故障存储: 120GB存储设备/文件系统:exFAT /簇大小:128KB 故…...

PAT乙级1007

常规解法 #include <iostream> using namespace std;// 判断一个数是否为素数的函数 bool isprime(int a) {// 遍历 2 到 sqrt(a) 之间的数&#xff0c;判断 a 是否能被它们整除for (int i 2; i * i < a; i) {if (a % i 0) // 如果能整除&#xff0c;说明 a 不是素…...

数据库中不存在该字段

mybatisplus 定义的类中某些字段是数据库里面没有的&#xff0c;我们可用tablefield(existfalse)来注解&#xff0c;演示如下&#xff1a;...

吾爱出品,文件分类助手,高效管理您的 PC 资源库

在日常使用电脑的过程中&#xff0c;文件杂乱无章常常让人感到困扰。无论是桌面堆积如山的快捷方式&#xff0c;还是硬盘中混乱的音频、视频、文档等资源&#xff0c;都急需一种高效的整理方法。文件分类助手应运而生&#xff0c;它是一款文件管理工具&#xff0c;能够快速、智…...

关于瑞芯微开发工具(RKDevTool)刷机下载Boot失败原因的研究

昨天发了文章《网心云OEC/OEC-turbo刷机问题——刷机教程、救砖方法、技术要点及下载boot失败异常解决尝试》&#xff0c;其中有关于刷机各种问题的一些解决方法。 网心云OEC/OEC-turbo刷机问题——刷机教程、救砖方法、技术要点及下载boot失败异常解决尝试-CSDN博客文章浏览阅…...

web爬虫笔记:js逆向案例十一 某数cookie(补环境流程)

web爬虫笔记:js逆向案例十一 某数cookie(补环境流程) 一、获取网页数据请求流程 二、目标网址、cookie生成(逐步分析) 1、目标网址:aHR0cHM6Ly9zdWdoLnN6dS5lZHUuY24vSHRtbC9OZXdzL0NvbHVtbnMvNy9JbmRleC5odG1s 2、快速定位入口方法 1、通过脚本监听、hook_cookie等操作可…...

浅谈 Vue3 中的设计模式

设计模式是软件开发中的一种最佳实践&#xff0c;它提供了解决特定问题的通用解决方案。通过合理运用设计模式&#xff0c;可以提高代码的可维护性、可扩展性和可读性。在 Vue3 的源码中&#xff0c;设计模式被广泛应用于各个模块中&#xff0c;充分体现了其在现代前端框架中的…...

Unix Domain Socket、IPC、RPC与gRPC的深度解析与实战

Unix Domain Socket、IPC、RPC与gRPC的深度解析与实战 引言 在分布式系统和本地服务通信中&#xff0c;进程间通信&#xff08;IPC&#xff09;与远程过程调用&#xff08;RPC&#xff09;是核心能力。本文将深入剖析 Unix Domain Socket&#xff08;UDS&#xff09;、IPC、RP…...

07_JavaScript函数作用域_递归

目录 一、作用域&#xff08;重点&#xff09; 二、变量的使用规则 &#xff08;重点&#xff09; 2.1 访问规则 2.2 赋值规则 三、递归函数 &#xff08;难点&#xff09; 了解 四、对象 4.1 对象的创建 一、作用域&#xff08;重点&#xff09; 什么是作用域 ? 作用…...

.gitignore使用指南

.gitignore使用指南 目录 什么是.gitignore为什么需要.gitignore如何创建.gitignore文件.gitignore文件的语法规则 忽略单个文件忽略目录忽略特定类型的文件不忽略特定文件或目录递归匹配 示例.gitignore文件注意事项更多特殊场景匹配规则 忽略多个特定后缀的文件忽略特定目录…...

Excel多级联动下拉菜单的自动化设置(使用Python中的openpyxl模块)

1 主要目的 在Excel中&#xff0c;经常会遇到需要制作多级联动下拉菜单的情况&#xff0c;要求单元格内填写的内容只能从指定的多个选项中进行选择&#xff0c;并且需要设置多级目录&#xff0c;其中下级目录的选项内容要根据上级目录的填写内容确定&#xff0c;如下图所示&am…...

深入解析 Spring Framework 5.1.8.RELEASE 的源码目录结构

深入解析 Spring Framework 5.1.8.RELEASE 的源码目录结构 1. 引言 Spring Framework 是 Java 领域最流行的企业级开发框架之一&#xff0c;广泛用于 Web 开发、微服务架构、数据访问等场景。本文将深入解析 Spring Framework 5.1.8.RELEASE 的源码目录结构&#xff0c;帮助开…...

excalidraw画图工具——背景画布有无格子设置

服啦找了大半天&#xff0c;愣是没找到 toggle grid &#xff1a; 切换格子… Excalidraw的背景格子 只要右键&#xff0c;将这个勾取消就好了&#xff1f;...

计算机组成原理———I\O系统精讲<1>

本篇文章主要介绍输入输出系统的发展概况 一.输入输出系统的发展概况 1.早期阶段 该阶段的特点是I/O设备与主存交换信息都必须通过CPU 当时的I/O设备有如下几个特点&#xff1a; &#xff08;1&#xff09;每个I\O设备都必须配有一套独立的逻辑电路与CPU相连&#xff0c;用来…...

[数据结构] 动态顺序表应用

可扩容顺序表顺序表 SeqList.hSeqList.cTest.c 动态顺序表能够根据数据存储的需要动态地管理内存空间。 SeqList.h #include<stdio.h> #include<stdlib.h>//静态顺序表 //小了不够用&#xff0c;多了浪费 //#define N 10 //typedef int SLDatatype; //struct SeqL…...

MinIO-对象存储方案

MinIO 是一个基于Apache License v2.0开源协议的对象存储服务。它兼容亚马逊S3云存储服务接口,非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等,而一个对象文件可以是任意大小,从几kb到最大5T不等。 MinIO是一个非常轻量的服务…...

装饰器模式 (Decorator Pattern)

装饰器模式 (Decorator Pattern) 是一种结构型设计模式,它动态地给一个对象添加一些额外的职责,就增加功能来说,装饰器模式相比生成子类更为灵活。 一、基础 1 意图 动态地给一个对象添加一些额外的职责。 就增加功能来说,装饰器模式相比生成子类更为灵活。 2 适用场景 当…...