当前位置: 首页 > article >正文

Phi-3-mini-4k-instruct-gguf快速上手:VS Code远程开发+Jupyter Notebook联调

Phi-3-mini-4k-instruct-gguf快速上手VS Code远程开发Jupyter Notebook联调1. 环境准备与快速部署Phi-3-mini-4k-instruct-gguf是微软推出的轻量级文本生成模型特别适合问答、文本改写、摘要整理等场景。本文将带你快速搭建开发环境实现VS Code远程开发与Jupyter Notebook联调。首先确保你的开发环境满足以下要求支持CUDA的NVIDIA显卡推荐RTX 3060及以上已安装最新版VS Code具备基础的Python开发环境1.1 安装必要组件在VS Code中安装以下扩展Remote - SSHPythonJupyter通过终端执行以下命令安装依赖pip install llama-cpp-python jupyter notebook2. 远程开发环境配置2.1 连接远程服务器在VS Code中按CtrlShiftP打开命令面板输入Remote-SSH: Connect to Host按照提示输入服务器地址和登录凭证连接成功后VS Code左下角会显示远程主机信息。2.2 下载模型文件在远程服务器上执行mkdir -p ~/models/phi3 cd ~/models/phi3 wget https://huggingface.co/TheBloke/Phi-3-mini-4k-instruct-gguf/resolve/main/phi-3-mini-4k-instruct-q4.gguf3. Jupyter Notebook联调3.1 创建Notebook文件在VS Code中新建.ipynb文件添加以下代码测试模型加载from llama_cpp import Llama llm Llama( model_path~/models/phi3/phi-3-mini-4k-instruct-q4.gguf, n_ctx2048, n_threads4 )3.2 基础问答测试在下一个单元格中输入response llm.create_chat_completion( messages[{role: user, content: 用中文介绍你自己}] ) print(response[choices][0][message][content])运行后应该能看到模型的自我介绍。4. 实用功能开发4.1 文本改写功能def rewrite_text(text, style正式): prompt f请把下面这句话改写得更{style}{text} response llm.create_chat_completion( messages[{role: user, content: prompt}], temperature0.3 ) return response[choices][0][message][content] print(rewrite_text(今天开会说的东西很多))4.2 摘要生成功能def generate_summary(text, sentences3): prompt f请用{sentences}句话总结以下内容{text} response llm.create_chat_completion( messages[{role: user, content: prompt}], max_tokens256 ) return response[choices][0][message][content]5. 性能优化建议5.1 参数调优模型支持以下关键参数调整temperature控制创造性0-1max_tokens限制输出长度top_p影响词汇选择多样性推荐配置response llm.create_chat_completion( messages[{role: user, content: prompt}], temperature0.2, max_tokens512, top_p0.9 )5.2 批处理优化对于批量任务建议def batch_process(queries): results [] for query in queries: response llm.create_chat_completion( messages[{role: user, content: query}], temperature0.1 ) results.append(response[choices][0][message][content]) return results6. 总结与下一步通过本文的配置你已经成功搭建了Phi-3-mini-4k-instruct-gguf的开发环境并实现了VS Code远程开发与Jupyter Notebook的联调。这个轻量级模型特别适合处理以下任务快速问答响应文本风格转换内容摘要生成简短创意写作建议下一步尝试将常用功能封装为API服务开发VS Code扩展直接调用模型探索更多应用场景如邮件自动回复等获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

Phi-3-mini-4k-instruct-gguf快速上手:VS Code远程开发+Jupyter Notebook联调

Phi-3-mini-4k-instruct-gguf快速上手:VS Code远程开发Jupyter Notebook联调 1. 环境准备与快速部署 Phi-3-mini-4k-instruct-gguf是微软推出的轻量级文本生成模型,特别适合问答、文本改写、摘要整理等场景。本文将带你快速搭建开发环境,实…...

打字不如说话,说话不如截图——AI 代码助手的多模态输入实践嚎

整体排查思路 我们的目标是验证以下三个环节是否正常: 登录成功时:服务器是否正确生成了Session并返回了包含正确 JSESSIONID的Cookie给浏览器。 浏览器端:浏览器是否成功接收并存储了该Cookie。 后续请求:浏览器在执行查询等…...

亚洲美女-造相Z-TurboGPU算力优化:FP16量化+FlashAttention加速部署方案

亚洲美女-造相Z-Turbo GPU算力优化:FP16量化FlashAttention加速部署方案 想快速部署一个能生成高质量亚洲美女图片的AI模型,但又担心显存不够、速度太慢?今天分享一个经过深度优化的部署方案,让你用更少的资源,跑出更…...

KOOK艺术馆镜像免配置教程:8步完成Diffusers+Turbo环境搭建

KOOK艺术馆镜像免配置教程:8步完成DiffusersTurbo环境搭建 1. 引言:开启AI艺术创作之旅 想象一下,你坐在数字化的卢浮宫中,周围是梵高星空下的沉浸式创作环境,只需简单描述你的想法,就能生成专业级的艺术…...

Cosmos-Reason1-7B作品集:覆盖IMO/CMO/AMC等国际数学竞赛真题解析

Cosmos-Reason1-7B作品集:覆盖IMO/CMO/AMC等国际数学竞赛真题解析本文展示Cosmos-Reason1-7B在数学竞赛真题解析中的实际效果,所有案例均基于真实题目生成1. 工具简介:你的本地数学竞赛解题助手 Cosmos-Reason1-7B是一款专门针对推理任务优化…...

Servlet-JAVA【笔记】

JAVA_WEBTomcattomcat工作流程servlet的生命周期ServletConfigServletContextHttpServletRequestHttpServletResponse前端提交的数据和请求域里的数据的区别?应用域和请求域的区别?如何做到两个servlet之间交流/共享数据?请求转发和重定向区别…...

超详细图解:HTTPS 中的 SSL/TLS 完整握手过程(面试必背)

超详细图解:HTTPS 中的 SSL/TLS 完整握手过程(面试必背)摘要一、HTTPS 与 SSL/TLS 的关系二、SSL/TLS 握手:核心作用三、SSL/TLS 握手:标准流程(TLS 1.2 完整版)3.1 握手流程图3.2 逐步骤详细解…...

使用Alpine配置WSL ssh门户匚

1. 哑铃图是什么? 哑铃图(Dumbbell Plot),有时也称为DNA图或杠铃图,是一种用于比较两个相关数据点的可视化图表。 它源于人们对更有效数据比较方式的持续探索。 在传统的时间序列比较中,我们通常使用两条折…...

栅极驱动核心原理 - DESAT保护

栅极驱动核心原理 - DESAT保护 它是一张电路实现图 + 文字说明图,旨在解释DESAT保护在驱动IC内部是如何通过硬件电路实现的——即如何利用恒流源、电阻、二极管和比较器来检测 VCEV_{CE}V...

深度解析TLS/SSL协议:工作原理、握手流程与网络安全应用

深度解析TLS/SSL协议:工作原理、握手流程与网络安全应用摘要一、TLS/SSL协议:基础定义1.1 TLS/SSL协议:是什么1.2 TLS/SSL协议:三大核心安全能力二、TLS/SSL协议:核心工作原理三、TLS/SSL协议:标准握手流程…...

计算机毕业设计:Python水网数据可视化与水位预测系统 Flask框架 数据分析 可视化 大数据 AI 线性回归 河流数据 水位预测(建议收藏)✅

博主介绍:✌全网粉丝50W,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,…...

qsort函数深度解析:如何自定义比较函数?

文章目录qsort函数深度解析:如何自定义比较函数?🚀什么是qsort函数?🤔自定义比较函数的重要性🎯基本示例:排序整数数组🔢排序字符串数组📝排序结构体数组🏗️…...

C语言中的泛型尝试:void_ + 函数指针

文章目录C语言中的泛型尝试:void* 函数指针 🧪什么是泛型?🤔C语言中的工具:void* 和函数指针 🛠️代码示例:泛型排序函数 📝进阶示例:泛型链表 📚优缺点分析…...

服务器Docker容器使用

0.基础指令 # 查看容器 docker ps docker images1.删除旧容器 docker rm -f novnc-test 2>/dev/null2.删除旧镜像 docker rmi ubuntu-novnc-vnc:22.04 2>/dev/null3.确认删除情况 docker ps -a | grep novnc-test docker images | grep ubuntu-novnc-vnc4.重新加载镜像 c…...

使用开源 Authentik 实现 AWS 单点登录

前言 懒得自己编了, Gemini 这样介绍 Authentik: 简单来说,Authentik 是一款功能极其强大的开源身份验证与访问管理 (IAM) 解决方案。 如果你觉得像 Okta 或 Auth0 这种商业服务太贵,或者觉得像 Keycloak 这种传统方案配置起来太头疼,那么…...

袁永福 电子病历,医疗信息化际

在AI辅助开发的语境下,Skill就是一个包含了领域知识、最佳实践、代码模板的知识包。 以"DAO层CRUD生成"为例,一个Skill包含: /mnt/skills/dao-crud/ ├── SKILL.md # 使用说明 │ ├── 何时使用这个Skill │ …...

算法优化中的多线程数据一致性问题的技术9

多线程数据一致性问题概述多线程环境下,数据一致性是算法优化中常见的技术挑战。多个线程同时访问和修改共享数据可能导致竞态条件、脏读或不可重复读等问题。确保数据一致性对算法正确性和性能至关重要。常见数据一致性问题类型竞态条件(Race Condition…...

BM25(Best Matching 25)信息检索

文章目录一、BM25本质在做什么二、核心思想(直观理解)1️⃣ 词出现次数(Term Frequency, TF)2️⃣ 词的稀有程度(IDF)3️⃣ 文档长度归一化三、BM25公式(核心)这是标准BM25打分函数&…...

AI 编程盛行的时代,为什么 “『DC- WFW』” 仍然具有必要性?沼

这&#xff0c;是一个采用C精灵库编写的程序&#xff0c;它画了一幅漂亮的图形&#xff1a; 复制代码 #include "sprites.h" //包含C精灵库 Sprite turtle; //建立角色叫turtle void draw(int d){for(int i0;i<5;i)turtle.fd(d).left(72); } int main(){ …...

算法的能耗模型与绿色计算优化方向的技术4

能耗模型基础理论算法复杂度与能耗关系时间复杂度与空间复杂度对硬件资源消耗的影响&#xff0c;建立数学模型描述指令执行次数、数据访问频率与能耗的关联。硬件层面的能耗因素CPU动态功耗&#xff08;CVf&#xff09;、静态功耗、内存访问能耗、缓存命中率等关键参数&#xf…...

3步解决浏览器Markdown阅读难题:从乱码到专业渲染的蜕变之路

3步解决浏览器Markdown阅读难题&#xff1a;从乱码到专业渲染的蜕变之路 【免费下载链接】markdown-viewer Markdown Viewer / Browser Extension 项目地址: https://gitcode.com/gh_mirrors/ma/markdown-viewer 你是否遇到过这样的窘境&#xff1a;在浏览器中打开本地M…...

Docker 容器中运行 AI CLI 工具:用户隔离与持久化卷实战指南暗

环境安装 pip install keystone-engine capstone unicorn 这3个工具用法极其简单&#xff0c;下面通过示例来演示其用法。 Keystone 示例 from keystone import * CODE b"INC ECX; ADD EDX, ECX" try:ks Ks(KS_ARCH_X86, KS_MODE_64)encoding, count ks.asm(CODE)…...

电子电路中的“心脏”:电源铝

前言 Kubernetes 本身并不复杂&#xff0c;是我们把它搞复杂的。无论是刻意为之还是那种虽然出于好意却将优雅的原语堆砌成 鲁布戈德堡机械 的狂热。平台最初提供的 ReplicaSets、Services、ConfigMaps&#xff0c;这些基础组件简单直接&#xff0c;甚至显得有些枯燥。但后来我…...

如何永久保存微信聊天记录:WeChatMsg本地数据备份完整指南

如何永久保存微信聊天记录&#xff1a;WeChatMsg本地数据备份完整指南 【免费下载链接】WeChatMsg 提取微信聊天记录&#xff0c;将其导出成HTML、Word、CSV文档永久保存&#xff0c;对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/W…...

第十五节:启动序列——从 claude 命令到 REPL 就绪

知识图谱定位:前面两节我们分别拆解了终端 UI(第13节 React Ink)和命令系统(第14节 斜杠路由)——它们都假设一个前提:REPL 已经就绪。但从用户在终端敲下 claude 按回车,到他看到交互界面,这中间到底发生了什么?答案是一个精心设计的三阶段启动序列:cli.tsx::main()…...

贾子科学的历史意义与现实影响:挑战西方科学哲学霸权的新范式

贾子科学的历史意义与现实影响&#xff1a;挑战西方科学哲学霸权的新范式摘要&#xff1a; 贾子科学是贾龙栋于2025-2026年提出的原创科学哲学体系&#xff0c;其历史意义在于直接挑战以波普尔证伪主义为核心的西方科学划界标准&#xff0c;提出“公理驱动可结构化”新标尺&…...

Vitest单元测试教程

Vitest 是 Vite 生态的极速单元测试框架&#xff0c;API 兼容 Jest&#xff0c;上手快、配置简单、性能极高。下面从 安装 → 配置 → 编写测试 → 常用断言 → Mock → 组件测试 → 运行与覆盖率 完整流程带你上手。一、安装 1. 基础安装 npm i -D vitest # 或 yarn add -D vi…...

Jenkins 学习总结腋

先唠两句&#xff1a;参数就像餐厅点单 把API想象成一家餐厅的“后厨系统”。 ? 路径参数/dishes/{dish_id} -> 好比你要点“宫保鸡丁”这道具体的菜&#xff0c;它是菜单&#xff08;资源路径&#xff09;的一部分。查询参数/dishes?spicytrue&typeSichuan -> 好比…...

2025届学术党必备的十大AI科研平台横评

Ai论文网站排名&#xff08;开题报告、文献综述、降aigc率、降重综合对比&#xff09; TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 人工智能本领在学术写作范畴的运用越来越普遍&#xff0c;它的关键价值是协助科研者达成文献…...

ARM 架构 JuiceFS 性能优化:基于 MLPerf 的实践与调优死

Qt是一个跨平台C图形界面开发库&#xff0c;利用Qt可以快速开发跨平台窗体应用程序&#xff0c;在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置&#xff0c;实现图形化开发极大的方便了开发效率&#xff0c;本笔记将重点介绍QSpinBox数值微调组件的常用方法及灵活应用。…...