当前位置：首页 > news >正文

玩一玩通义千问Qwen开源版，Win11 RTX3060本地安装记录！

news 2026/2/10 15:15:10

大概在两天前，阿里做了一件大事儿。

就是开源了一个低配版的通义千问模型--通义千问-7B-Chat。

这应该是国内第一个大厂开源的大语言模型吧。

虽然是低配版，但是在各类测试里面都非常能打。

官方介绍：

Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。同时，在Qwen-7B的基础上，我们使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。本仓库为Qwen-7B-Chat的仓库。

同时官方也给出了很多测试结果。

比如中文评测。

在C-Eval验证集上得分对比：

Model	Avg. Acc.
LLaMA2-7B-Chat	31.9
LLaMA2-13B-Chat	40.6
Chinese-Alpaca-2-7B	41.3
Chinese-Alpaca-Plus-13B	43.3
Baichuan-13B-Chat	50.4
ChatGLM2-6B-Chat	50.7
InternLM-7B-Chat	53.2
Qwen-7B-Chat	54.2

如果单看这个数据。说“吊打”同级别羊驼模型一点不夸张吧。比起热门的开源模型ChatGLM2也高出了不少。

除此之外还有：

英文测评（南玻王）

代码测评（南玻王）

数学测评（南玻王）

长序列测评（南玻王）

工具使用能力测评

全方位碾压同类70亿参数模型，在即将开源的、用于评估工具使用能力的自建评测基准上，居然K·O了GPT-4 哈哈。

Model	Tool Selection (Acc.↑)	Tool Input (Rouge-L↑)	False Positive Error↓
GPT-4	95%	0.90	15%
GPT-3.5	85%	0.88	75%
Qwen-7B-Chat	99%	0.89	8.5%

我也不太懂，没研究过这个基准测试，反正就是看起来很厉害的样子。

不管怎么样，大厂开源的东西总不会太差。有可能真的是最好的小型中文大语言模型了。

阿里已经亮出态度了，接下来压力给到百度，讯飞，华为... 哈哈~~

既然阿里都开源了，那我们自然就笑纳了，接下就在本机跑一个试试。

下面是我在Win11 RTX3060 12G 上完整的安装记录。玩过的可以跳过，没玩过的可以当个参考。

我的安装思路完全来自官网指引：

官方的安装指引看起来非常简单。只要安装一下modelscope这个包，然后运行一段Python代码就可以了。当然，这个世界上看起来简单的东西，做起来往往都不那么简单。一步一坑是常态，踩过了，就简单了。

常规流程

1.创建并激活虚拟环境。

我们还是用常用的MiniConda来创建一个虚拟的Python环境。

conda create -n models python=3.10.6

激活激活虚拟环境：

conda activate  models

2. 安装modescope基础库

pip install modelscope

3. 编写Python代码

不需要自己编写啊，直接抄官方代码。

创建一个test.py文件，然后将代码粘贴到里面，Ctrl+S 保存代码。

4.运行代码

运行代码也非常简单。上面已经激活了虚拟环境。然后用cd命令，进入到代码所在目录。然后用Python运行就可以了。

E:cd 
E:\DEV\qwen
python test.py

运行代码之后，会自动联网下载一个14G的模型文件。

阿里毕竟是做服务器的，我又在杭州，这速度真的是真是相当给力。不用魔法，就能飞起，这是搞国外项目，永远享受不到的待遇啊。

按正常的节奏来说，下载完大模型，然后运行代码。通义千问大模型就会乖乖的回答我预设的两个问题了。

但是...不可能这么顺利。

其实还有很多包还没装完，我就按我出错的顺序和解决方法，一个个来记录吧。

踩坑记录

1.缺少transformers包

提示信息如下：

ImportError:modelscope.pipelines.nlp.text_generation_pipeline requires the transformers library but it was not found in your environment. You can install it with pip:pip install transformers

解决方法很简答，运行提示中的命令即可：

pip install transformers

2. 缺少tiktoken包

提示信息如下：

modelscope.models.nlp.qwen.tokenization requires the tiktoken library but it was not found in your environment. You can install it with pip:pip install tiktoken

解决方法：

pip install tiktoken

3.缺少accelerate包

提示信息如下：

ImportError: QWenChatPipeline: QWenForTextGeneration: Using low_cpu_mem_usage=True or a device_map requires Accelerate: pip install accelerate

解决方法：

pip install accelerate

4.爆显存了OutOfMemory

终于所有包都装完了。

再次运行test.py

软件有条不紊的运行，好像有戏。可惜，最终还是卡在硬件配置上了。

见到了熟悉的OutOfMemory。

torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 1.16 GiB (GPU 0; 12.00 GiB total capacity; 9.99 GiB already allocated; 200.79 MiB free; 9.99 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.  See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

在大语言模型面前，12G显存，啥都不是。

查了一下资料，BF16需要16.2G显存才可以运行...

Precision	MMLU	Memory
BF16	56.7	16.2G
Int8	52.8	10.1G
NF4	48.9	7.4G

遇到这种情况，没啥办法，只能用量化。官方也提供了4bit量化的代码，直接拷贝过来，搞了一个test2.py文件。

5. 运行4bit量化代码出错

错误提示如下：

importlib.metadata.PackageNotFoundError: No package metadata was found for bitsandbytes

大概就是量化的时候需要用到一个叫bitsandbytes的依赖包。

那就安装一下呗：

pip install bitsandbytes

安装非常简单快速，没有任何问题。

6. 量化包不支持Windows

安装完依赖之后运行test2.py 很快就收到了如下错误：

CUDA Setup failed despite GPU being available. Please run the following command to get more information:          python -m bitsandbytes
    Inspect the output of the command and see if you can locate CUDA libraries. You might need to add them    to your LD_LIBRARY_PATH. If you suspect a bug, please take the information from python -m bitsandbytes    and open an issue at: https://github.com/TimDettmers/bitsandbytes/issues

这句话对于对于一个英语只过了4级的人有点难度啊。什么叫尽管有可用的GPU但是CUDA设置失败.... 你这句式是不是等价于，你有一个女朋友，但是不能用！

查了一下资料，bitsandbytes库目前仅支持Linux发行版，Windows目前不受支持。。。

还好上面的资料已经过时了，其实已经有大佬做了Windows版本。

7. Windows版量化包版本太低

为了解决上面一个的问题，找到了一个Windows版本的依赖包。

安装命令如下：

pip install git+https://github.com/Keith-Hon/bitsandbytes-windows.git

安装完成之后，本以为完事大吉了。

还是太年轻...

错误提示如下：

ValueError: 4 bit quantization requires bitsandbytes>=0.39.0 - please upgrade your bitsandbytes version

这个问题出在两个方面，一个是这个包好像只支持8bit量化，而我代码里有用的是4bit。另外一个问题就是错误日志中提到的版本太低。

没办法，又是一顿乱找，狂开N个网页。

最后最终找到了可以用的版本。

安装命令：

python -m pip install bitsandbytes --prefer-binary --extra-index-url=https://jllllll.github.io/bitsandbytes-windows-webui

终于安装成功0.41版本

8 缺少transformers_stream_generator包

习惯了，习惯了。上面的都搞完了，又出现缺包提示。

ImportError: This modeling file requires the following packages that were not found in your environment: transformers_stream_generator. Run `pip install transformers_stream_generator`

解决方法：

pip install transformers_stream_generator

9. Numpy不可用。

所有包装完之后，运行test2.py，眼看这要成功了，又跳出一个“Numpy is not available” 。


Traceback (most recent call last):File "e:\DEV\qwen\test2.py", line 12, in <module>response, history = model.chat(tokenizer, "你好", history=None)File "C:\Users\tony/.cache\huggingface\modules\transformers_modules\Qwen-7B-Chat\modeling_qwen.py", line 1003, in chatresponse = decode_tokens(File "C:\Users\tony/.cache\huggingface\modules\transformers_modules\Qwen-7B-Chat\qwen_generation_utils.py", line 269, in decode_tokenstokens = tokens.cpu().numpy().tolist()RuntimeError: Numpy is not available

用pip list 查看了一下包列表，明明有这个包，怎么就不能用呢？

不管了，直接更新有一把看看。

把Numpy升级到最新版：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple numpy --upgrade

安装过程出现红色提示：

ERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.modelscope 1.8.1 requires numpy<=1.22.0, but you have numpy 1.25.2 which is incompatible.Successfully installed numpy-1.25.2

内心凉了一半。

提示里面说modelscope需要的是1.22, 但是我装了1.25.2... 最怕就是这种版本问题了...

我也不知道该怎么排查，想着就死马当活马医了。

最后...居然成功了，这是~~什么道理~~！

通过日志可以看到，AI已经做出了回答。答案也正确且通顺。幸福来的太突然...

到这里，我就成功的在我的Rtx3060 12G上面把“通义千问”给跑起来了。理论上所有的8G N卡也能跑起来！

成功后，心态就平稳很多了，半天功夫没白费，美滋滋。

趁热打铁，抽个几分钟来测试一下运行速度。

start:2023-08-05 11:06:54.399781;
loaded:2023-08-05 11:09:05.583479;
hello:2023-08-05 11:09:21.236158;
where:2023-08-05 11:09:22.543629;
goood:2023-08-05 11:09:28.565053

加载模型用了好几分钟，回答问题大概只用了几秒钟。还不错啊，这速度基本能用了。

按上面的方式运行代码，AI只能回答预设的几个问题。这样搞起来就有点不爽，每次提问，还得改源代码，重新加载模型...

所以我又花了几分钟，写了一个WebUI。

界面如下：

写这个界面和功能，大概只用了23行Python代码。Gradio这东西用起来确实爽，怪不得那么多开源项目都用这个来做界面。

心满意足了！！！

有没有看到这里，还是一头雾水的人？哈哈！

那么我就提供一个无需配置，无需登录，直接可以体验的网址把：

https://modelscope.cn/studios/qwen/Qwen-7B-Chat-Demo/summary

通义千问官方主页：

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

有兴趣的可以去玩一玩！

收工！

玩一玩通义千问Qwen开源版，Win11 RTX3060本地安装记录！

大概在两天前，阿里做了一件大事儿。就是开源了一个低配版的通义千问模型--通义千问-7B-Chat。这应该是国内第一个大厂开源的大语言模型吧。虽然是低配版，但是在各类测试里面都非常能打。官方介绍： Qwen-7B是基于Transformer的大语言模…...

编程日记 2023/8/10 15:17:27

oracle积累增量和差异增量

积累增量和差异增量： 对于 RMAN 来说，积累增量备份和差异增量备份都是增量备份的一种形式，它们之间的区别在于备份的范围和备份集的方式。积累增量备份：在进行积累增量备份时，RMAN 会备份自最后一次完全备份或增量备…...

编程日记 2023/8/10 15:16:26

利用C++nlohmann库解析json文件

json文件示例： 代码运行环境VS2019 一、git下载nlohmann库文件源代码源代码文件目录二、利用VS2019新建工程，并配置项目属性配置VC目录---包含目录三、项目源代码 #include <iostream> #include <fstream> #include <nlohmann/jso…...

编程日记 2023/8/10 15:15:25

OpenCV 中的光流 (C++/Python)

什么是光流？光流是一项视频中两个连续帧之间每像素运动估计的任务。基本上，光流任务意味着计算像素的位移矢量作为两个相邻图像之间的对象位移差。光流的主要思想是估计物体由其运动或相机运动引起的位移矢量。理论基础假设我们有一个灰度图像——具有像素强度的矩阵。我…...

编程日记 2023/8/10 15:14:24

第9集丨Vue 江湖 —— 监测数据原理

目录一、修改数据时的一个问题1.1 现象一1.2 现象二二、Vue监测数据原理2.1 模拟一个数据监测2.2 数据劫持2.3 Vue.set()/vm.$set()2.4 基本原理2.4.1 如何监测对象中的数据?2.4.2 如何监测数组中的数据?2.4.3 修改数组中的某个元素 2.5 案例2.5.1 需求功能2.5.2 实现一、…...

编程日记 2023/8/10 15:13:23

【YOLO】替换骨干网络为轻量级网络MobileNet3

替换骨干网络为轻量级网络MobileNet_v3 上一章模型网络结构解析&增加小目标检测文章目录替换骨干网络为轻量级网络MobileNet_v3前言一、MobileNetV3介绍二、MobileNetV2&MobileNetV3三、MobileNetV3网络结构1. 结构查看2. 查看每层featuremap大小三、YOLOV5替换骨干…...

编程日记 2023/8/10 15:12:22

如何识别手机是否有灵动岛（dynamic island）

如何识别手机是否有灵动岛（dynamic island） 灵动岛是苹果2022年9月推出的iPhone 14 Pro、iPhone 14 Pro Max首次出现，操作系统最低是iOS16.0。带灵动岛的手机在竖屏时顶部工具栏大于等于51像素。 #define isHaveDynamicIsland ({ BOOL isH…...

编程日记 2023/8/10 15:11:21

Linux设备树简介

一、起源减少垃圾代码减轻驱动开发工作量驱动代码和设备信息分离参考Open Fireware设计用来记录硬件平台中各种硬件设备的属性信息二、基本组成两种源文件： xxxxx.dts dts是device tree source的缩写 xxxxx.dtsi dtsi是device tree source include的…...

编程日记 2023/8/10 15:09:15

1.依次执行下面三条命令： sudo apt install gnome-shell-extensions sudo apt install gnome-tweak-tool sudo apt install chrome-gnome-shell2.下载主题，也是命令： git clone <https://github.com/qingchendelaike/GNOME-OSX-II-Theme…...

编程日记 2023/8/10 15:08:14

RabbitMQ学习——发布订阅/fanout模式 topic模式 rabbitmq回调确认延迟队列（死信）设计

目录引出点对点(simple)Work queues 一对多发布订阅/fanout模式以登陆验证码为例pom文件导包application.yml文件rabbitmq的配置生产者生成验证码，发送给交换机消费者消费验证码 topic模式配置类增加配置生产者发送信息进行发送控制台查看 rabbitmq回调确认配置类验…...

编程日记 2023/8/10 15:07:13

Leetcode算法递归类—合并两个有序链表

目录 21. 合并两个有序链表题解： 代码： 将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。示例 1： 输入：l1 [1,2,4], l2 [1,3,4] 输出：[1,1,2,3,4,4]示例 2&a…...

编程日记 2023/8/10 15:06:12

YOLOv5可视化界面

Pyside6可视化界面安装Pyside6 激活之前的虚拟环境yolov5 在该环境的终端输入以下命令 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyside6输入where python找到当前使用的Python的路径找到该路径下的designer.exe文件（/Lib/site-packages/PySi…...

编程日记 2023/8/10 15:05:11

C语言使用库函数实现大小写字母转换

功能；多行输入，输入大写字母，返回相应的小写字母；输入小写字母，返回相应的大写字母需要用到的库函数： islower（） -- 判断是否为小写，是，返回非0，…...

编程日记 2023/8/10 15:04:10

Redis简单学习

Redis是一个基于内存的key-value结构数据库 linux上面安装： Redis存储的是key-value结构的数据，其中key是字符串，value有常见的5中数据类型： 字符串 string哈希 hash列表 list集合 set有序集合 sorted set 字符串常用操作&am…...

编程日记 2023/8/10 15:03:08

《Python入门到精通》函数详解

「作者主页」：士别三日wyx 「作者简介」：CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者「推荐专栏」：小白零基础《Python入门到精通》函数 1、函数的调用2、函数的参数2.1、变量的就近原则2.2、传递参数2.3、形参和实…...

编程日记 2023/8/10 15:02:07

PHP流浪动物招领网站mysql数据库web结构apache计算机软件工程网页wamp

一、源码特点 PHP流浪动物招领网站是一套完善的web设计系统，对理解php编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。下载链接 nullhttps://download.csdn.net/download/qq_41221322/88190168视频演示 …...

编程日记 2023/8/10 15:01:06

android—ktor-client封装使用，请求网络

ktor-client封装使用步骤： 1.导入依赖： 设置版本号： buildscript {ext.ktor_version 2.3.1 }添加依赖： implementation "io.ktor:ktor-client-okhttp:$ktor_version"implementation "io.ktor:ktor-client-auth…...

编程日记 2023/8/10 15:00:05

GD32F103VE侵入事件

GD32F103VE的TAMPER引脚(PC13)，当PC13输入低电平时，会产生一个侵入检测事件。它会将所有“数据备份寄存器”内容清除。这个功能有什么用？ 一是防止被人开壳，抄袭。二是自毁功能。直奔主题，多一句就是浪费时间。测试…...

编程日记 2023/8/10 14:59:04

将tp5项目、fastadmin项目部署到服务器宝塔面板

目录一、将你的fastadmin或者tp5项目文件夹上传至你的服务器域名根目录下二、修改你的网站目录指向，指向public目录，点击保存，并取消勾选防跨站攻击。三、配置伪静态四、fastadmin框架上传至服务器后如果想要访问后台可以进行重定向&am…...

编程日记 2023/8/10 14:58:02

Jenkins+Docker+SpringCloud微服务持续集成

JenkinsDockerSpringCloud微服务持续集成 JenkinsDockerSpringCloud持续集成流程说明SpringCloud微服务源码概述本地运行微服务本地部署微服务 Docker安装和Dockerfile制作微服务镜像Harbor镜像仓库安装及使用在Harbor创建用户和项目上传镜像到Harbor从Harbor下载镜像微服务持…...

编程日记 2023/8/10 14:57:01

eNSP-Cloud(实现本地电脑与eNSP内设备之间通信)

说明： 想象一下，你正在用eNSP搭建一个虚拟的网络世界，里面有虚拟的路由器、交换机、电脑（PC）等等。这些设备都在你的电脑里面“运行”，它们之间可以互相通信，就像一个封闭的小王国。但是&#…...

编程新知 2026/2/8 4:37:17

HTML 语义化

目录 HTML 语义化HTML5 新特性HTML 语义化的好处语义化标签的使用场景最佳实践 HTML 语义化 HTML5 新特性标准答案： 语义化标签： <header>：页头<nav>：导航<main>：主要内容<article>&#x…...

编程新知 2026/1/15 21:24:41

【根据当天日期输出明天的日期(需对闰年做判定)。】2022-5-15

缘由根据当天日期输出明天的日期(需对闰年做判定)。日期类型结构体如下： struct data{ int year; int month; int day;};-编程语言-CSDN问答 struct mdata{ int year; int month; int day; }mdata; int 天数(int year, int month) {switch (month){case 1: case 3:…...

编程新知 2025/11/27 21:52:13

.Net框架，除了EF还有很多很多......

文章目录 1. 引言2. Dapper2.1 概述与设计原理2.2 核心功能与代码示例基本查询多映射查询存储过程调用 2.3 性能优化原理2.4 适用场景 3. NHibernate3.1 概述与架构设计3.2 映射配置示例Fluent映射XML映射 3.3 查询示例HQL查询Criteria APILINQ提供程序 3.4 高级特性3.5 适用场…...

编程新知 2026/2/1 19:26:16