当前位置: 首页 > article >正文

win10 本地部署ollama + qwen3.5:0.8b

尝试本地部署一个资源要求小的模型完成一些简单的本地调用任务。硬件是一个minibox电脑成本在3k以内。amd R7 自带的核显尝试一下性能如何。如果足够稳定可以部署一些没有时效性要求的agent。24小时运行美滋滋。cpu amd R7 7840HSgpu 780M内存16gb 核显分配3GB操作系统win10安装1下载最新版本的ollama安装老版本的ollama 在pull qwen3.5的时候会报错。ollama2拉取模型 在cmd 窗口下执行ollama pull qwen3.5:0.8b3运行模型哦ollama run qwen3.5:0.8b关闭思考提高响应速度/set nothink模型对系统资源要求是特别低只使用cpu的情况下cpu使用率70%内存2GB以内使用python调用api遇到了第一个问题。响应时间在100秒左右这个有点问题应该是哪里没有设置好。尝试解决1设置模型常驻内存。让qwen3.5:0.8b模型常驻内存需要设置OLLAMA_KEEP_ALIVE环境变量。默认情况下模型在处理完请求后只会保留 5 分钟就会被卸载设置后可以让它一直留在显存里下次调用时就能瞬间响应。方法一临时设置测试用在启动 Ollama 服务的命令行窗口中设置cmdset OLLAMA_KEEP_ALIVE-1 ollama serve参数说明-1表示永久常驻直到服务关闭也可以设置具体时间如24h表示 24 小时30m表示 30 分钟。验证这个办法效果明显在70秒内响应。添加到系统环境变量重启后永久生效修改环境变量点击确定保存重启电脑继续优化关闭模型思考功能相应时间在50秒以内已经到达可接受的范围。继续压榨硬件性能现在只是使用CPU算力还没有使用到核显的GPU想办法利用GPU算力。https://zhuanlan.zhihu.com/p/32548573553这上面是一个ollama使用780M的方法。文章写的不是很好我看了半天。就是安装了两个软件下载对应的补丁解压后覆盖就完事了。AMD HIP SDK 这个是6.4.2OLLAMA 这个是0.18.2配置好之后下面这步很重要。让ollama能够发现780M在启动 Ollama 前正确设置环境变量在同一个 PowerShell 窗口中按顺序执行powershell# 1. 停止所有 Ollama 进程 taskkill /F /IM ollama.exe 2$null taskkill /F /IM ollama-app.exe 2$null # 2. 设置环境变量关键 # 强制启用 GPU $env:HSA_OVERRIDE_GFX_VERSION 11.0.2 $env:OLLAMA_GPU_LAYERS 25 $env:OLLAMA_VULKAN 1 # 模型常驻内存避免冷启动 $env:OLLAMA_KEEP_ALIVE -1 # 3. 验证环境变量已设置 Write-Host HSA_OVERRIDE_GFX_VERSION $env:HSA_OVERRIDE_GFX_VERSION Write-Host OLLAMA_VULKAN $env:OLLAMA_VULKAN # 4. 启动 Ollama ollama serveGPU设置完成模型使用GPU内存参与后模型完全加载到显存中代码中继续优化# 初始化模型 chat ChatOllama( modelqwen3.5:0.8b, reasoningFalse, # 关闭冗长的思考链 temperature0.3, # 降低随机性提高确定性 num_predict1024, # 限制输出长度 num_ctx4096, # 上下文长度适中 top_k20, # 减少采样范围加快生成 base_urlhttp://127.0.0.1:11434 )响应时间继续压缩

相关文章:

win10 本地部署ollama + qwen3.5:0.8b

尝试本地部署一个资源要求小的模型,完成一些简单的本地调用任务。硬件是一个minibox电脑成本在3k以内。amd R7 自带的核显尝试一下性能如何。如果足够稳定可以部署一些没有时效性要求的agent。24小时运行美滋滋。 cpu amd R7 7840HS gpu 780M 内存16gb 核显分配…...

在Visual Studio中集成libxls库:从编译到项目配置的完整指南

1. 为什么选择libxls库处理Excel文件 在Windows平台处理老版Excel文件(.xls格式)时,很多开发者会遇到一个尴尬的问题:现代Excel组件往往对这类老旧格式支持有限,而开源社区的主流方案(如libxlsxwriter&…...

AlphaFold更上一层楼

这个包含2亿个蛋白质结构预测的数据库,现已纳入同源2聚体,增添了新的生物学意义。这是来自Google DeepMind数据集、含转录延伸因子Eaf N端结构域蛋白的同源2聚体AlphaFold分子模型。AlphaFold现已能够预测同源2聚体复合物&#xf…...

【ROS】利用moveit控制自制机械臂(0)

利用moveit控制自制机械臂: 1. 建立机械臂的urdf文件(或xacro文件)【ROS】利用moveit控制自制机械臂(1)——建立机械臂的urdf文件-CSDN博客 2. 使用moveit配置助手生成配置文件 【ROS】利用moveit控制自制机械臂&…...

OpenCV中LSD直线检测算法的模块选择与性能对比

1. OpenCV中的LSD直线检测算法简介 在计算机视觉领域,直线检测是一项基础而重要的任务。OpenCV作为最流行的计算机视觉库,提供了两种LSD(Line Segment Detector)直线检测算法的实现。这两种实现虽然基于相同的理论基础&#xff0c…...

LobeChat多场景实战:智能客服、文案创作、代码助手,一镜搞定

LobeChat多场景实战:智能客服、文案创作、代码助手,一镜搞定 1. 为什么选择LobeChat? 在AI助手遍地开花的今天,LobeChat凭借其开源特性和强大的扩展能力脱颖而出。它不仅仅是一个聊天界面,更是一个可以自由定制的AI交…...

阿里二面:什么是 MySQL 回表查询?如何避免?(修订版)

在线 Java 面试刷题(持续更新):https://www.quanxiaoha.com/java-interview 目录 面试考察点核心答案深度解析一、InnoDB 索引结构:理解回表的前提二、回表过程演示三、如何避免回表?—— 覆盖索引四、如何判断是否发生…...

环境配置——python代码打包超详细教程

在Python开发的过程中我们经常会需要将自己的代码打包成一个可执行文件,方便将代码分享给其他人使用,下面这篇文章主要给大家介绍了关于python代码打包的相关资料,需要的朋友可以参考下一、前言网上的文章对小白都不太友好呀,讲得都比较高大上,本文章就用…...

利用DeOldify进行影视资料修复:批量视频帧上色处理方案

利用DeOldify进行影视资料修复:批量视频帧上色处理方案 每次看到那些珍贵的历史影像资料,总是觉得有些遗憾。黑白画面虽然经典,但总感觉隔了一层纱,人物的表情、环境的细节,都少了些温度和真实感。对于影视资料馆、纪…...

PHP-Resque源码解析:深入剖析核心类Resque_Job和Resque_Worker的实现原理

PHP-Resque源码解析:深入剖析核心类Resque_Job和Resque_Worker的实现原理 【免费下载链接】php-resque PHP port of resque (Workers and Queueing) 项目地址: https://gitcode.com/gh_mirrors/ph/php-resque PHP-Resque是Redis支持的PHP后台作业处理库&…...

Squirrel-RIFE常见问题解决方案:从安装到使用的完整排错

Squirrel-RIFE常见问题解决方案:从安装到使用的完整排错 【免费下载链接】Squirrel-RIFE 项目地址: https://gitcode.com/gh_mirrors/sq/Squirrel-RIFE Squirrel-RIFE是一款基于RIFE算法的中文视频插帧软件,能够将视频帧率提升至60fps甚至更高&a…...

腾讯开源翻译大模型实战:HY-MT1.5-1.8B快速上手体验

腾讯开源翻译大模型实战:HY-MT1.5-1.8B快速上手体验 1. 引言:从零开始,十分钟拥有自己的翻译引擎 你有没有遇到过这样的场景?想给国外的朋友发一段中文消息,却担心翻译软件不准;阅读一份外文技术文档&…...

VSCP-Arduino:面向嵌入式节点的轻量级语义化IoT协议栈

1. 项目概述VSCP-Arduino 是一个面向 Arduino 平台的VSCP Level 1(L1)协议栈实现,专为资源受限的嵌入式节点设计。它并非通用通信库,而是严格遵循《VSCP Specification v1.5》中定义的 Level 1 设备行为规范,将物理层抽…...

手把手教你用LingBot-Depth:RGB-D数据融合的5步完整流程

手把手教你用LingBot-Depth:RGB-D数据融合的5步完整流程 1. 环境准备与快速部署 LingBot-Depth是一个基于DINOv2 ViT-L/14编码器的深度估计与补全模型,能够将RGB图像与稀疏深度数据融合生成高质量的完整深度图。在开始使用前,我们需要先完成…...

Qwen2.5-VL-7B-Instruct多场景案例:跨境电商商品图合规审查自动化

Qwen2.5-VL-7B-Instruct多场景案例:跨境电商商品图合规审查自动化 1. 项目背景与价值 跨境电商平台每天需要处理海量商品图片,确保这些图片符合各国法规要求是一项耗时费力的工作。传统人工审核方式存在效率低、成本高、标准不统一等问题。Qwen2.5-VL-…...

STM32内部六大总线架构与协同机制详解

1. STM32单片机内部总线架构解析在嵌入式系统开发实践中,理解MCU内部总线结构是掌握性能瓶颈、优化代码执行效率、调试异常行为以及合理规划外设访问时序的基础。对于基于ARM Cortex-M3内核的STM32F1系列微控制器(如STM32F103xB/C/E)&#xf…...

ROS2 Navigation Framework and System导航系统国际化支持方案:为全球机器人应用赋能

ROS2 Navigation Framework and System导航系统国际化支持方案:为全球机器人应用赋能 【免费下载链接】navigation2 ROS2 Navigation Framework and System 项目地址: https://gitcode.com/gh_mirrors/na/navigation2 ROS2 Navigation Framework and System&…...

Lingbot-Depth-Pretrain-Vitl-14 应用:机器人视觉导航中的深度感知实战

Lingbot-Depth-Pretrain-Vitl-14 应用:机器人视觉导航中的深度感知实战 想让机器人像人一样“看清”周围环境的远近,自主避开障碍物,甚至规划出一条安全的行走路线吗?这背后离不开一项关键技术——深度感知。简单来说&#xff0c…...

零基础玩转Pi0具身智能:浏览器一键体验机器人动作生成

零基础玩转Pi0具身智能:浏览器一键体验机器人动作生成 1. 从零开始:什么是Pi0具身智能? 你可能听说过机器人、人工智能,但“具身智能”这个词听起来有点陌生。简单来说,具身智能就是让AI拥有“身体”,能像…...

Qwen2.5-VL-7B-Instruct LangChain应用开发:智能体系统构建

Qwen2.5-VL-7B-Instruct LangChain应用开发:智能体系统构建 1. 引言 想象一下,你正在开发一个智能客服系统,用户不仅会发文字提问,还会上传截图、商品图片甚至操作界面。传统的文本AI只能处理文字,但现实中的问题往往…...

红外图像特征提取:从基础原理到实战应用

1. 红外图像与常规图像的差异 第一次接触红外图像时,我和大多数人一样困惑:这不就是黑白照片吗?直到在安防项目中踩了坑才明白,红外图像和灰度图像虽然看起来相似,但背后的物理原理完全不同。普通灰度图像记录的是物体…...

灵毓秀-牧神-造相Z-Turbo辅助C语言学习教程

灵毓秀-牧神-造相Z-Turbo辅助C语言学习教程 1. 引言:当AI绘画遇上编程学习 你可能用过各种工具来学习C语言,从厚重的教材到在线编译器,但用AI绘画模型来辅助编程学习,听起来是不是有点新鲜?其实,灵毓秀-牧…...

Word分节后页码混乱?3分钟搞定页码连续与PDF空白页问题

Word分节后页码混乱?3分钟搞定页码连续与PDF空白页问题 每次在Word里折腾几十页的论文或报告,最崩溃的瞬间莫过于发现页码莫名其妙从"1"重新开始,或者导出PDF时凭空多出几张空白页。这种问题往往发生在文档分节之后——你可能只是…...

2025 高效整理雪球内容:自动化下载与多格式导出实战

1. 为什么需要自动化整理雪球内容? 作为一个在金融信息领域摸爬滚打多年的老手,我深知及时获取和整理投资信息的重要性。雪球作为国内领先的投资社区,每天产生大量优质内容,但手动保存和整理这些内容简直是一场噩梦。想象一下&…...

斯坦福CS229中文翻译项目:EM算法与混合高斯模型深度解析

斯坦福CS229中文翻译项目:EM算法与混合高斯模型深度解析 【免费下载链接】Stanford-CS-229 A Chinese Translation of Stanford CS229 notes 斯坦福机器学习CS229课程讲义的中文翻译 项目地址: https://gitcode.com/gh_mirrors/st/Stanford-CS-229 欢迎来到斯…...

MAA助手:深度解析明日方舟智能自动化解决方案

MAA助手:深度解析明日方舟智能自动化解决方案 【免费下载链接】MaaAssistantArknights 一款明日方舟游戏小助手 项目地址: https://gitcode.com/GitHub_Trending/ma/MaaAssistantArknights MAA助手(MaaAssistantArknights)是一款专为《…...

IDA Pro逆向分析技巧:通过CTFshow-PWN题掌握汇编关键知识点

IDA Pro逆向分析实战:从CTFshow-PWN题透视汇编核心原理 逆向工程师的思维训练场 在网络安全竞赛的战场上,逆向工程能力就像一把瑞士军刀,既能剖析漏洞本质,也能构建防御策略。CTFshow平台上的PWN题目,特别是pwn5-pwn12…...

Open UI5 源代码解析之675:Dialog.js

源代码仓库: https://github.com/SAP/openui5 源代码位置:src\sap.m\src\sap\m\Dialog.js sap.m.Dialog 文件深度解析与项目作用说明 文件定位与整体价值 Dialog.js 是 sap.m 库里极其核心的交互基础设施之一。它并不只是一个 弹窗控件 的实现文件,更像是一个把视觉层、…...

比话降AI效果实测:知网检测从38.9%直接降到4.2%

比话降AI效果实测:知网检测从38.9%直接降到4.2% 有一类同学的情况比较特殊:论文AI率不算特别高,大概在30%-50%之间,属于那种"改一改可能能过,但也可能过不了"的灰色地带。 我就是这种情况。知网AIGC检测结果…...

集成学习与决策树:斯坦福CS229中文翻译项目高级算法解析

集成学习与决策树:斯坦福CS229中文翻译项目高级算法解析 【免费下载链接】Stanford-CS-229 A Chinese Translation of Stanford CS229 notes 斯坦福机器学习CS229课程讲义的中文翻译 项目地址: https://gitcode.com/gh_mirrors/st/Stanford-CS-229 斯坦福大学…...