当前位置: 首页 > article >正文

OpenClaw部署与调用本地部署的大模型

记录一下这个部署过程不想调云端API毕竟花钱买Token还是有点肉疼所以打算在本地部一个大模型。有一台放在内网机房的服务器用来做大模型的宿主机。有了大模型之后需要找个终端来运行 OpenClaw 框架所以去闲鱼淘了台便宜二手旧电脑安装Ubuntu 24.04 系统作为物理沙箱。机房里的服务器本身无法连外网工位笔记本条件最好能正常上网能通过有线SSH连到内网机房的服务器。用来跑龙虾的闲鱼二手电脑只能通过连接热点获取外部网络不在内网环境里。服务器位于内网机房运行大模型后端。电脑 A能连内网的笔记本作为网关桥梁。电脑 B闲鱼买来的二手本(Ubuntu 24.04)通过热点上网运行 OpenClaw 客户端。其实如果能把大模型跟openclaw放到同一台机子上更简单一些但这样主要是考虑到安全问题万一龙虾一不高兴删点啥就完蛋了。ollama与大模型部署ssh连服务器官方安装脚本是这样的curl -fsSL https://ollama.com/install.sh | sh这里它相当于先把安更具体的bash脚本给下载下来然后根据脚本里的步骤去下载完整的ollama。但是由于我们的服务器是通过远程ssh访问的且服务器没法直接访问互联网因此这里需要借助能上网的笔记本作为中转设置临时代理去下载curl -x http://笔记本内网ip:7890 -fsSL https://ollama.com/install.sh | HTTPS_PROXYhttp://笔记本内网ip:7890 sh下完后改它的配置文件sudo mkdir -p /etc/systemd/system/ollama.service.d/ sudo vim /etc/systemd/system/ollama.service.d/override.conf把这一段加上[Service] EnvironmentCUDA_VISIBLE_DEVICES0,1 EnvironmentHTTP_PROXYhttp://笔记本ip:7890 EnvironmentHTTPS_PROXYhttp://笔记本ip:7890其中CUDA_VISIBLE_DEVICES主要是指定它可调用的gpu这里不写也行因为我希望它的调用局限于两个gpu不要把服务器上所有gpu全折腾起来。下面那俩还是代理因为ollama也需要联网去拉取模型。wq!保存后接下来告诉系统你修改了配置sudo systemctl daemon-reload重启ollama服务sudo systemctl restart ollama重启后我们要检查一下 Ollama 进程是否真的拿到了代理设置运行下面这行命令sudo cat /proc/$(pgrep ollama)/environ | tr \0 \n | grep -E PROXY|CUDA如果屏幕输出了你设置的那几行Environment内容说明配置成功如果啥也没输出说明配置还是没生效那可能需要检查文件权限。下载模型(这里我们选择Qwen3.5)ollama pull qwen3.5:35b-a3b下载完成后在服务器终端运行ollama run qwen3.5:35b-a3b退出聊天界面在提示符处直接输入/bye然后回车或者按快捷键Ctrl D就可以退出当前的对话界面回到普通的终端命令行。强制立刻释放资源退出聊天界面后模型默认还会占 5 分钟显存。如果想立刻把显存清空(比如想跑其他任务)可以在终端直接运行这条命令ollama stop qwen3.5:35b-a3bopenclaw部署以下是在电脑B上的操作cd sudo apt update sudo apt install -y git curl # 安装 Node.js curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash - sudo apt install -y nodejs sudo npm install -g pnpm我的这个笔记本B没有挂节点需要走笔记本A上的梯子流量否则git下载不下来可以这样搞git config --global http.proxy http://192.168.137.1:7890 git config --global https.proxy http://192.168.137.1:7890git clone https://github.com/OpenClaw/OpenClaw.git cd OpenClaw npm run build pnpm install pnpm run build pnpm run start pnpm run start -- setup pnpm run start -- gateway内网服务器(运行 Qwen 模型)无法直接暴露在公网客户端笔记本通过连接手机热点或随身 WiFi 获得外部网络同时需要访问内网服务器的模型 API。所以这里需要在电脑A上开一个窗口# 假设模型 API 运行在 11434 端口 # 这里相当于我们把服务器的11434端口中转到电脑A的11435端口 # 为啥不也中转到电脑A的11434端口因为不知道为啥它报错了总之换个端口中转也行 ssh -N -f -L 0.0.0.0:11435:127.0.0.1:11434 用户名服务器ip此时如何验证一下电脑B上能不能走这个接口呢在B上输入运行curl http://192.168.137.1:11435/api/tags试试。如果输出是类似这样的一大串{models:[{name:glm-4.7-flash:latest,model:glm-4.7-flash:latest,modified_at:2026-03-18T08:30:20.430865628Z,size:19019270852,digest:d1a8a26252f18eb157e01321222,details:{parent_model:,format:gguf,family:glm4moelite,families:[glm4moelite],parameter_size:29.9B,quantization_level:Q4_K_M}},{name:qwen3.5:35b-a3b,model:qwen3.5:35b-a3b,modified_at:2026-03-12T16:00:38.591154269Z,size:23869191742,digest:3460ffeede5453ea30971993babdb2165221f7,details:{parent_model:,format:gguf,family:qwen35moe,families:[qwen35moe],parameter_size:36.0B,quantization_level:Q4_K_M}}]}说明跑通了。回到电脑B我们再打开一个窗口配置一下model提供方cd OpenClaw pnpm run start -- configure配置时这样选◇ Where will the Gateway run? │ Local (this machine) │ ◇ Select sections to configure │ Model │ ◇ Model/auth provider │ Ollama │ ◇ Ollama base URL │ http://电脑A的局域网ip:11435 #例如http://192.168.137.1:11435一般是这个可以ipconfig看一下 #然后等着它在服务器上下载一个glm-4.7-flash(我也不知道为啥它非得下这个没有提供一个直接的qwen3.5的接口)启动openclawcd ~/OpenClaw pnpm run start -- tui此时就可以用了但是它用的模型api默认是那个glm-4.7-flash这个算是一个轻量化的小模型如何把它切换成qwen3.5:35b-a3b或者其他模型修改配置文件如下流程rm -rf ~/.openclaw/agents/main #把之前那个对话给扬了避免留下缓存 vim ~/.openclaw/openclaw.json #这里要修改以下参数 #primary: ollama/qwen3.5:35b-a3b, #意思是把它作为主要的模型api然后重启服务pnpm run start -- gateway stop pnpm run start -- tui每次电脑关机后重新启动应该怎么办呢#在电脑A上 ssh -N -f -L 0.0.0.0:11435:127.0.0.1:11434 用户名服务器ip#在电脑B上开第一个窗口 cd ~/OpenClaw pnpm run start -- gateway #第二个窗口 cd ~/OpenClaw pnpm run start -- tui

相关文章:

OpenClaw部署与调用本地部署的大模型

记录一下这个部署过程:不想调云端API,毕竟花钱买Token还是有点肉疼,所以打算在本地部一个大模型。有一台放在内网机房的服务器,用来做大模型的宿主机。有了大模型之后,需要找个终端来运行 OpenClaw 框架,所…...

golang如何实现用户积分系统_golang用户积分系统实现总结

积分系统需用数据库原子更新或Redis原子命令操作,强制记录含幂等ID的完整流水,查询分场景选DB直查或带TTL的Redis缓存,扣减前校验余额与状态,逆向冲正依赖流水source和幂等ID。积分增减必须用原子操作,别直接读-改-写并…...

SQL处理大规模分组聚合的内存限制_调整服务器配置

MySQL分组聚合OOM时应调大tmp_table_size和max_heap_table_size而非sort_buffer_size;PostgreSQL需按并发和操作数合理设work_mem;ClickHouse需联动max_threads配置max_bytes_before_external_group_by。MySQL分组聚合OOM时,sort_buffer_size…...

从BUUCTF一道RSA难题看e与φ不互素问题的AMM算法实战解析

1. 当RSA遇上特殊条件:e与φ(n)不互素问题 第一次遇到RSA题目时,很多CTF选手都会觉得"这不就是白给题吗?"——毕竟只要知道p和q,按照标准流程计算私钥d就能解密。但现实往往给我们当头一棒:当公钥指数e与欧拉…...

从“完全或无”到IND-CCA2:公钥加密安全模型的演进与实战解析

1. 公钥加密安全模型的演进之路 我第一次接触公钥加密安全模型时,完全被各种缩写搞晕了。直到在实际项目中踩过几次坑,才真正理解这些安全等级的重要性。想象一下,你给朋友寄了个带锁的箱子,从"完全或无"到IND-CCA2&…...

Fastjson的AutoType:从‘得力助手’到‘安全噩梦’,我们该如何用SafeMode优雅收场?

Fastjson的AutoType:从‘得力助手’到‘安全噩梦’,我们该如何用SafeMode优雅收场? 在Java生态中,Fastjson以其卓越的性能和简洁的API长期占据JSON处理库的榜首。但近年来,这个明星库却因为一个名为AutoType的特性频频…...

别再死磕命令行!用eNSP+USG6000V零基础搞定防火墙Web管理界面(附虚拟网卡配置避坑指南)

零基础玩转防火墙:eNSPUSG6000V图形化管理全攻略 第一次接触防火墙配置时,命令行界面总让人望而生畏。作为网络安全领域的敲门砖,图形化管理界面(Web UI)无疑是新手更友好的选择。本文将带你用华为eNSP模拟器和USG600…...

免费在线UML绘图神器:3分钟学会用代码生成专业图表

免费在线UML绘图神器:3分钟学会用代码生成专业图表 【免费下载链接】plantuml-editor PlantUML online demo client 项目地址: https://gitcode.com/gh_mirrors/pl/plantuml-editor 还在为复杂的UML绘图工具而头疼吗?PlantUML Editor是一款革命性…...

5分钟掌握PlantUML Editor:专业级代码驱动UML绘图工具实战指南

5分钟掌握PlantUML Editor:专业级代码驱动UML绘图工具实战指南 【免费下载链接】plantuml-editor PlantUML online demo client 项目地址: https://gitcode.com/gh_mirrors/pl/plantuml-editor 还在为绘制复杂的UML图表而烦恼吗?传统的拖拽式绘图…...

从零到一:在Ubuntu上搭建完整的GNU Radio Python开发环境

1. 环境准备:Ubuntu系统与基础工具 在开始搭建GNU Radio开发环境之前,我们需要确保系统基础环境已经就绪。我推荐使用Ubuntu 20.04 LTS版本,这个版本不仅长期支持,而且软件仓库中的GNU Radio和相关依赖都比较新且稳定。如果你还在…...

炉石传说HsMod插件:55项功能深度解析与架构实现

炉石传说HsMod插件:55项功能深度解析与架构实现 【免费下载链接】HsMod Hearthstone Modification Based on BepInEx 项目地址: https://gitcode.com/GitHub_Trending/hs/HsMod HsMod是基于BepInEx框架开发的炉石传说多功能插件,通过55项技术增强…...

从零到一:手把手教你用conda与pip实现开发环境的无缝迁移与国内源加速

1. 环境迁移的痛点与解决方案 刚拿到新电脑的程序员最头疼什么?十有八九是开发环境配置。我上周刚换了工作电脑,深刻体会到那种"明明代码能跑却装不上依赖"的崩溃感。特别是用Python做开发的同行,conda和pip混用产生的依赖冲突&…...

数字信号处理——上采样(Upsampling)和下采样(Downsampling)

目录 1. 上采样(upsampling) 2. 下采样(downsampling) 1. 上采样(upsampling) 上采样的过程(亦称为“升采样(upscaling)”或“扩展(expansion)”)是在不改变原信号基本内容的前提下,为其添加更多数据点,即增加数据的空间分布率和采样频率。当这一过程应用于信…...

告别卡顿!用GStreamer的nvv4l2decoder插件为你的RTSP播放器开启GPU硬解

告别卡顿!用GStreamer的nvv4l2decoder插件为你的RTSP播放器开启GPU硬解 在实时视频处理领域,卡顿和延迟是开发者最头疼的问题之一。想象一下,当你正在构建一个多路视频分析系统时,CPU软解带来的高负载不仅让机器风扇狂转&#xff…...

AI建站工具避坑指南:10个最常见问题与客观解答

工具越智能,使用者的疑问往往越多。面对“公司官网智能生成工具”,大家既期待它解决问题,又担心它带来新的麻烦。我们把用户在咨询和实践中遇到的高频问题整理了出来,并给出客观、坦诚的解答,希望能帮你绕过那些可以避…...

技术揭秘:Nintendo Switch NAND存储系统的深度探索与管理实践

技术揭秘:Nintendo Switch NAND存储系统的深度探索与管理实践 【免费下载链接】NxNandManager Nintendo Switch NAND management tool : explore, backup, restore, mount, resize, create emunand, etc. (Windows) 项目地址: https://gitcode.com/gh_mirrors/nx/…...

用周立功CAN分析仪抓包解析电动汽车充电握手报文(BMS/充电机通信实战)

电动汽车充电握手报文解析实战:从CAN抓包到BMS通信全解密 电动汽车充电过程中,BMS(电池管理系统)与充电机之间的通信就像两个陌生人在初次见面时的握手——需要确认身份、交换基本信息,并达成充电协议。而这一切&#…...

数字政府智慧政务场景落地AI大模型基于DeepSeek实操应用设计方案:核心应用场景落地设计、实施保障与运维体系

本方案利用DeepSeek大模型技术,针对政务流程繁琐、数据孤岛等痛点,构建智能问答、政策解析及舆情预警三大核心场景,实现高频事项处理效率提升40%、群众满意度超90%的目标,并提供从数据治理到安全合规的全链条落地设计。 关键绩效指…...

3步解锁Cursor Pro完整功能:告别试用限制的终极免费解决方案

3步解锁Cursor Pro完整功能:告别试用限制的终极免费解决方案 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached yo…...

Python开启AI之门:04 机器学习的核心思想:让机器自己找规律

04 机器学习的核心思想:让机器自己找规律 欢迎回来!前三篇咱们从Python钥匙聊到语法积木,再到数据这顿“AI早餐”,今天终于要进入正题了——机器学习!这可是AI里最接地气的“找规律”环节。 机器学习不是让机器变聪明,而是让机器在数据里找到人类自己都没注意到的规律。…...

MSP430与MMC/SD卡SPI通信实现与优化

1. MSP430与MMC/SD卡SPI通信概述在嵌入式系统开发中,外扩存储设备是常见需求。MSP430系列微控制器通过SPI接口与MMC/SD卡通信,为数据采集、日志记录等应用提供了可靠的存储解决方案。SPI(Serial Peripheral Interface)作为一种同步…...

AI大模型智算运营运维服务建设方案:AI大模型架构、智算平台架构、数据管理架构、 运营运维服务体系设计、 项目实施与保障

本方案不仅仅停留在技术层面,而是从业务需求出发,覆盖了从战略规划、架构设计、详细实施、日常运维到持续优化和风险合规的全链条。方案中包含了大量具体的技术选型、量化指标、流程规范、成本预算和团队配置建议,展现了很强的落地指导意义。…...

Agent VS Skills的差别,谁是执行者,谁是工具?

文章探讨了AI智能体(Agent)与技能(Skills)结合的新范式如何解决当前AI应用落地痛点。智能体具备理解意图和规划任务的能力,而技能则封装了标准化流程和专业知识。二者结合将实现工作流程自动化、AI成为数字员工、组织知…...

LeetCode 3379. 转换数组 详细技术解析

LeetCode 3379. 转换数组 详细技术解析 前言 本文针对 LeetCode 3379. 转换数组 题目,进行全面、细致的技术解析,包含题目拆解、解题思路推导、规范代码实现、示例验证、复杂度分析及边界拓展,贴合 CSDN 技术博客高分标准(逻辑清晰、格式规范、内容详实、代码可直接复制、…...

2026软著审核全面收紧!驳回率飙升背后,这份“通关指南”请收好

最近很多开发者和企业负责人都在吐槽:软著怎么突然变得这么难拿了?曾经“提交即过”的好日子一去不复返。如今,收到的不是补正通知,就是直接驳回。反复修改、来回折腾,几个月过去了,证书还是没着落。这不是…...

LeetCode 3761. 镜像对之间最小绝对距离 (多算法优化版)

LeetCode 3761. 镜像对之间最小绝对距离 (多算法优化版) 前言 本文针对 LeetCode 3761. 镜像对之间最小绝对距离 题目,进行全面、细致的技术解析,包含题目拆解、多种解题思路推导、多版可直接运行代码实现、示例验证、复杂度对比及边界拓展,贴合 CSDN 技术博客高分标准(…...

OpenClaw 低代码部署教程 小白也能快速上手

Windows 一键部署 OpenClaw 教程|5 分钟搭建本地 AI 智能体,简化环境配置 2026 年开源领域关注度较高的数字员工OpenClaw(小龙虾),在 GitHub 平台收获大量开发者关注,凭借本地运行、低代码操作、任务自动执…...

从零开始:30分钟搭建AI驱动的自动化测试平台Testsigma

从零开始:30分钟搭建AI驱动的自动化测试平台Testsigma 【免费下载链接】testsigma Testsigma is an agentic test automation platform powered by AI-coworkers that work alongside QA teams to simplify testing, accelerate releases and improve quality acros…...

STM32F407实战避坑指南(一)

1. GPIO配置中的那些"坑" 第一次用STM32F407点灯的时候,我信心满满地照着手册写好了GPIO配置代码,结果灯死活不亮。后来才发现,原来GPIO的时钟使能位写错了位置。这种低级错误在新手阶段特别常见,今天就和大家分享几个G…...

GPT-6倒计时:AGI时代的前夜

200万Token上下文、原生多模态统一架构、强化长期任务执行能力——GPT-6的到来,或许是AGI时代的真正开端。01 注:本文写于2026年4月16日,截止发稿时,OpenAI官方尚未公布GPT-6的最终发布状态。文中信息基于OpenAI此前的官方预告和行…...