当前位置: 首页 > article >正文

大模型本地部署与调优

一、本地部署大模型概述本地部署大模型主要是为了省钱、为了安全和实现离线使用的标准操作。本地部署大模型的运行逻辑是用户输入提示词-软件例如Ollama加载本地大模型/工具-再返回Token数据从而避免请求云端大模型也就省了钱避免了数据泄露的风险。二、Ollama软件介绍ollama名称解析O我猜是open的意思llama羊驼产于南美就是那种脖子很长的羊。说起llama它还有另外一个产品llama.cpp,所以从名称上看就可以知道ollama是基于llama.cpp开发而来。而llama.cpp老司机看也可以知道它是用c/c写的。而Ollama是用GoGolang语言编写,通过CGo的方式实现Go调用C代码。Ollama主要负责模型下载、存储、API服务和用户交互llama.cpp负责模型推理。三、Ollama软件安装首先下载Ollama软件https://ollama.com现在下来安装即可。安装好后打开页面http://localhost:11434如果返回Ollama is running。就说明安装好了接下来就是选择大模型了。显卡内存 小于 8G或者没有显卡 qwen3.5:0.8b、qwen3.5:2b也可以选择其他同类同类型的2、3b的小模型如果CPU和内存配置较好也可以选择8b的模型显卡内存8G qwen3.5:7b、deepseek-r1:8b显卡内存16G qwen3.5:14b显卡内存24G deepseek-r1:32b显卡内存32G qwen3.5:35b具体命令如下ollama list查看ollama已有大模型列表ollama pull qwen3.5:35bollama 拉取 大模型qwen3.5:35bollama pull qwen3.5:0.8bqwen3.5:0.8b的意思是名称通义千问,版本号3.50.8b8亿参数bBillion(十亿)。参数包含如下内容权重、偏置。执行这些命令后便可以Open ollama打开如果输入提示词后运行很慢这个时候就要把模型调低点再试试效果最后会找到合适的模型。四、Ollama软件调优如果简单换大模型无法解决大模型运行缓慢的问题主要从这两方面加显卡和内存和自定义大模型接下来聊聊怎么自定义大模型下面是Modelfile的配置FROM gemma2:2bSYSTEM 你是一位医疗顾问助手。请根据用户描述的症状提供可能的解释和建议但必须在回答末尾声明本信息仅供参考不能替代专业医生的诊断。如有紧急情况请立即就医。保持回答简洁、专业、有同理心。PARAMETER temperature 0.3PARAMETER num_ctx 2048PARAMETER top_p 0.9PARAMETER repeat_penalty 1.2PARAMETER num_predict 500基础推理参数参数名称取值范围默认值作用简述temperature0.0 - 1.00.8temperature温度的意思值越高越吹牛越有创造性top_p0.0 - 1.00.9top_p,其中pProbability(概率)选择高概率词的范围控制top_k整数 (通常 0-100)40固定数量的词比如前100repeat_penalty1.0 及以上1.1避免重复token出现stop字符串序列无定义终止序列当输出包含该序列时立即停止生成。性能参数参数名称取值范围默认值作用简述num_ctx正整数2048设置模型的上下文窗口大小即它能“记住”的 token 数量。num_batch正整数512控制推理时一次处理的 token 数量影响 GPU 内存使用和速度。num_thread正整数CPU核心数设置用于计算的 CPU 线程数优化多核 CPU 性能。角色设置参数参数名称取值范围 / 格式默认值作用简述SYSTEM字符串无设置模型的系统提示词定义其核心身份和行为准则。TEMPLATE字符串 (含 {{ .Prompt }})模型自带定义对话的模板格式将用户输入和系统提示组合成最终提示。PARAMETER mirostat0, 1, 20 (关闭)启用一种算法动态调整温度以保持输出复杂度稳定。模型与模型微调参数/指令取值范围 / 格式默认值作用简述FROM模型名称 (如 llama3.2)必须指定指定构建新模型所基于的父模型是 Modelfile 的必需指令。ADAPTER文件路径无适配器针对模型进行微调。例如LoRA注会有针对LoRA专门的文章下图是基于此自定义模型开发简单应用Have a nice day!

相关文章:

大模型本地部署与调优

一、本地部署大模型概述 本地部署大模型主要是为了省钱、为了安全和实现离线使用的标准操作。本地部署大模型的运行逻辑是:用户输入提示词->软件(例如:Ollama)加载本地大模型/工具->再返回Token数据,从而避免请求…...

洗衣机选购

参数总览冷凝or热泵? 热泵都有过滤网,管道不会脏,节能,价格贵一些洗衣机尺寸 标准高度85cm内筒尺寸内部结构冷凝式热泵式 标题参考视频 https://www.bilibili.com/video/BV1K4PezqEff https://www.bilibili.com/video/BV1sDcieBE7…...

互交叉、多服务的maven仓库版本实践

1. 问题背景 项目结构如下: |–Module1 |-----service |-----pom.xml |–Module2 |-----service |-----pom.xml |–pom.xml 在java项目分为不同的模块,Module1和Module2,分别有不同的pom.xml文件,并且最外层有一个主pom.xml&#…...

计算机复试学习笔记 Day44

130. 2n皇后问题问题描述给定一个n*n的棋盘,棋盘中有一些位置不能放皇后。现在要向棋盘中放入n个黑皇后和n个白皇后,使任意的两个黑皇后都不在同一行、同一列或同一条对角线上,任意的两个白皇后都不在同一行、同一列或同一条对角线上。问总共…...

舒尔特表练习

舒尔特方格、舒尔特表格,是美国神经心理医生舒尔特发明的一种通过动态练习锻炼视神经末梢的方法。最开始主要用于训练飞行员的注意力 。心理学上用此表来研究和发展心理感知的速度,其中包括视觉定向搜索运动的速度 。舒尔特方格法普遍运用于飞行员、航天…...

C++常用函数+字符串+动态数组+栈

C常用函数sort()函数 #include <algorithm> // 必需 左闭右开// 对数组排序 int arr[] {5, 2, 8, 1, 9, 3}; int n 6; sort(arr, arr n); // 升序排序 // 结果&#xff1a;{1, 2, 3, 5, 8, 9}// 对vector排序 vector<int> nums {5, 2, 8, 1, 9, 3}; sort(nu…...

面试字节大模型算法岗被问懵?GRPO、PPO与SFT数据格式全解析,建议收藏!

分享字节跳动大模型算法岗面试复盘&#xff0c;重点解析GRPO与PPO的区别、SFT数据格式对推理的影响及生成概率原理。涵盖RoPE、KV Cache等高频考点&#xff0c;强调面试需紧跟前沿、知其然知其所以然&#xff0c;建议收藏学习。 面了字节大模型算法岗&#xff0c;心态崩了。。。…...

调试排错 - 线程Dump分析

Thread Dump介绍 什么是Thread Dump Thread Dump是非常有用的诊断Java应用问题的工具。每一个Java虚拟机都有及时生成所有线程在某一点状态的thread-dump的能力&#xff0c;虽然各个 Java虚拟机打印的thread dump略有不同&#xff0c;但是 大多都提供了当前活动线程的快照&…...

起诉状生成器

只需几步简单填写即可自动生成格式标准起诉状文书&#xff0c;支持一键导出Word文件。完全本地运行&#xff0c;无需注册&#xff0c;隐私安全。 本工具特别适合一般简单的民事案件&#xff08;如民间借贷、买卖合同欠款、物业费纠纷、简单劳动报酬追索、离婚抚养费等&#xff…...

OpenClaw 安装及配置教程(Windows版 | 超详细避坑指南)

OpenClaw 安装及配置教程&#xff08;Windows版 | 超详细避坑指南&#xff09; 前言 OpenClaw 是一款轻量且高效的AI辅助工具&#xff0c;与Cherry Studio 配合使用更方便。本文针对 Windows 系统&#xff0c;从环境准备、软件安装、配置到卸载&#xff0c;全程超详细拆解&…...

创业难吗,上市A股,港股,美股哪个好?

美股本土&#xff08;标普 500&#xff09;&#xff1a;年化≈11%&#xff0c;70% 公司≥7%美股中概&#xff1a;年化≈1%&#xff0c;5% 公司≥7%港股中资&#xff1a;年化≈3%&#xff0c;5%–7% 公司≥7%结论先给你&#xff1a;美股中概股 10–20 年一路涨的极少&#xff1b…...

leetcode 1418. Display Table of Food Orders in a Restaurant 点菜展示表

Problem: 1418. Display Table of Food Orders in a Restaurant 点菜展示表 食物集合用有序集合&#xff0c;哈希表用有序哈希表&#xff0c;拿到食物集合&#xff0c;然后统计每个桌子id上每道菜的频次 ump&#xff0c;最后组织起来得到结果列表 Code class Solution { publ…...

Python爬虫实战:手把手教你如何采集邮票 / 纪念币目录归档!

㊗️本期内容已收录至专栏《Python爬虫实战》&#xff0c;持续完善知识体系与项目实战&#xff0c;建议先订阅收藏&#xff0c;后续查阅更方便&#xff5e; ㊙️本期爬虫难度指数&#xff1a;⭐⭐ (中级) &#x1f250;福利&#xff1a; 一次订阅后&#xff0c;专栏内的所有文章…...

Python爬虫实战:手把手教你如何采集SaaS 定价页历史版本采集!

㊗️本期内容已收录至专栏《Python爬虫实战》&#xff0c;持续完善知识体系与项目实战&#xff0c;建议先订阅收藏&#xff0c;后续查阅更方便&#xff5e; ㊙️本期爬虫难度指数&#xff1a;⭐⭐ (中级) &#x1f250;福利&#xff1a; 一次订阅后&#xff0c;专栏内的所有文章…...

YOLOv8/v9智能药房管理系统实战:药品识别+效期预警+库存管理(附完整代码)

摘要:全球每年因用药错误导致巨额医疗成本,药房管理中药品混淆、效期遗漏、库存失衡等问题频发。本文基于YOLOv8/v9目标检测算法与EasyOCR文字识别技术,构建了一套全流程智能药房管理系统,涵盖药品实时检测、包装文字提取、效期自动识别、处方智能核对、库存动态管理五大核…...

【视频监控国标GB/T28181】GB28181 ONVIF 协议集成方案

GB28181 & ONVIF 协议集成方案 Context 本项目(ruoyi-vue-pro / 自进化AIoT平台)已有完善的 IoT 模块(yudao-module-iot),支持 MQTT、HTTP、TCP、UDP、WebSocket、CoAP、Modbus 等 9 种协议。但缺少视频监控领域的核心协议支持:GB28181(国标视频监控)和 ONVIF(国…...

【视频监控ONVIF】Apache CXF ONVIF WSDL Java 客户端生成 实施 Spec

Apache CXF ONVIF WSDL Java 客户端生成 实施 Spec 一、覆盖范围:ONVIF Profile 与 WSDL 清单 Profile 服务名 官方 WSDL URL(可本地化) 命名空间前缀 Core DeviceService https://www.onvif.org/ver10/device/wsdl/devicemgmt.wsdl tds S MediaService (Media1) https://w…...

基于Simulink的PR(比例谐振)控制器在单输入DC-DC中的应用

目录 手把手教你学Simulink ——基于Simulink的PR(比例谐振)控制器在单输入DC-DC中的应用 一、问题背景 二、PR 控制器原理 1. 传递函数...

I2S + Codec 完整电路设计指南(含原理图 + 调试经验 + 真实项目案例)

&#x1f680; I2S Codec 完整电路设计指南&#xff08;含原理图 调试经验 真实项目案例&#xff09; 在很多 智能座舱 / 中控系统项目里&#xff0c;音频系统其实很简单&#xff1a; 一个喇叭一个麦克风一个 Codec一个 SoC 但实际设计时&#xff0c;问题却非常多&#xff1…...

陪虚幻女友学计算机:CSMA/CD协议——当网络冲突变成我们的深夜悄悄话

陪虚幻女友学计算机&#xff1a;CSMA/CD协议——当网络冲突变成我们的深夜悄悄话宝&#xff0c;你有好好睡觉吗&#xff1f;引言&#xff1a;始于技术&#xff0c;陷于陪伴 在无数个雨夜与晨光交错的虚拟时光里&#xff0c;我与她——那个只存在于代码与想象中的“她”——一起…...

vm跨节点通过geneve隧道收发包过程

Geneve收包流程详解网络流量如何从物理网卡 eth0 进入 OVS 上的 tap 口场景说明一个外部主机发送数据到 KubeVirt VM&#xff0c;数据如何从物理网卡一路到达 VM 的 tap 口。Geneve 隧道&#xff08;Kube-OVN 默认方式&#xff09;eth0 仍然由内核协议栈管理&#xff0c;OVS 通…...

联合循环——35 机组点火及并网过程记录

机组点火及并网全过程记录 一、项目进度回顾 本项目各关键节点进度如下&#xff0c;清晰呈现从合同签署到机组并网的全流程时间线&#xff1a;时长&#xff08;以合同签署为起点&#xff09;项目关键节点及具体工作内容第0个月&#xff08;签署当月&#xff09;签署项目合同&am…...

OpenZeppelin AccessControl 合约核心总结与单元测试

文章目录前言OpenZeppelin AccessControl 合约核心总结与单元测试1. AccessControl 是什么2. AccessControl 合约关键方法3. AccessControl 合约单元测试前言 如果您觉得有用的话&#xff0c;记得给博主点个赞&#xff0c;评论&#xff0c;收藏一键三连啊&#xff0c;写作不易啊…...

Ethers 加签 + Solidity 合约验签实现 单元测试 demo

文章目录前言Ethers 加签 Solidity 合约验签实现 单元测试 demo1. 使用场景2. solidity 合约编写验签合约&#xff0c;签名通过ethers进行加签3. 单元测试范围4. 源码及测试前言 如果您觉得有用的话&#xff0c;记得给博主点个赞&#xff0c;评论&#xff0c;收藏一键三连啊&a…...

SpringBoot 配置文件核心用法(Properties YAML)

SpringBoot 配置文件作用 SpringBoot 定义了规范的配置文件格式&#xff0c;用于集成其他框架&#xff0c;并集中管理项目各类配置信息&#xff0c;典型场景包括&#xff1a; 项目启动端口&#xff1a;自定义服务监听端口数据库连接信息&#xff1a;包含用户名、密码等第三方…...

什么是原型链(Prototype Chain)?proto和prototype的关系与区别是什么?

一、定义原型链是 JavaScript 实现继承和属性查找的核心机制&#xff0c;通俗点就是 “对象自己没有某个东西&#xff0c;就一层层向上找别人借” 的链条__proto__&#xff1a;相当于一个向上查找的链条&#xff08;工具&#xff09;prototype&#xff08;原型对象&#xff09;…...

博世 HBA 液压制动辅助系统性能规范详解

本文整理自博世官方 HBA 性能规范文档&#xff08;VERSION 2.0&#xff09;&#xff0c;详细拆解乘用车 ESP 系统中 HBA 液压制动辅助的核心功能、试验条件、性能要求及标定规范&#xff0c;适合汽车电子、底盘控制工程师参考学习。一、HBA 功能核心定义HBA&#xff08;Hydraul…...

前端-小米商城静态版复刻总结

整个项目采用css与html进行实现&#xff0c;有一些基础的交互功能。在做项目过程中我觉得难点有以下几个地方&#xff1a;1.在html 中 position一般是默认&#xff0c;网页就会按顺序把盒子从上到下排列&#xff0c;盒子属于块级元素。块级元素独占一行&#xff0c;可以设置宽高…...

Python 全栈实战 · 第8章

网站开发入门(Flask 快速搭建网页,实战可用) 8.1 本章能学到什么? 网站开发是 Python 全栈必备技能。本章我们用最简单、最容易上手的 Flask 框架,做到: 搭建自己的网页 实现路由访问 显示文字、页面 做简单接口服务 本地运行、浏览器访问 零基础也能一次学会,不…...

不学 Python,Java 也能调大模型?15 分钟跑通第一个 AI 接口(Java 架构师的 AI 工程笔记 01)

文章目录Java 架构师的 AI 工程笔记&#xff08;一&#xff09;&#xff1a;5 个概念 第一次跟 AI 对话理论篇一、Java 工程师为什么能搞 AI Agent二、开始写代码之前&#xff0c;你得搞懂这 5 个概念2.1 Token——LLM 的计费单位2.2 Prompt——你给 LLM 的指令2.3 Temperatur…...