当前位置: 首页 > article >正文

Phi-3.5-mini-instruct代码实例:Python调用vLLM API+Chainlit前端示例

Phi-3.5-mini-instruct代码实例Python调用vLLM APIChainlit前端示例1. 模型简介Phi-3.5-mini 是一个轻量级的开放模型属于 Phi-3 模型家族。它基于高质量的数据集构建包括合成数据和经过筛选的公开网站数据特别关注推理密集型任务。该模型支持长达128K令牌的上下文长度并经过严格的训练过程监督微调Supervised Fine-Tuning近端策略优化Proximal Policy Optimization直接偏好优化Direct Preference Optimization这些训练方法确保了模型能够精确遵循指令同时具备强大的安全措施。2. 环境准备2.1 验证模型部署在开始使用前我们需要确认模型服务已成功部署。可以通过以下命令检查日志cat /root/workspace/llm.log如果看到类似下面的输出表示模型已成功加载[INFO] Model loaded successfully [INFO] vLLM API server started on port 80002.2 安装必要依赖确保已安装以下Python包pip install chainlit requests3. Python调用vLLM API3.1 基础API调用示例下面是一个简单的Python脚本演示如何通过vLLM API调用Phi-3.5-mini-instruct模型import requests import json def generate_text(prompt, max_tokens200): url http://localhost:8000/v1/completions headers {Content-Type: application/json} data { model: phi-3.5-mini-instruct, prompt: prompt, max_tokens: max_tokens, temperature: 0.7 } response requests.post(url, headersheaders, datajson.dumps(data)) return response.json() # 示例调用 result generate_text(请用简单的语言解释量子计算) print(result[choices][0][text])3.2 流式响应处理对于长文本生成可以使用流式响应来提高用户体验def generate_text_stream(prompt, max_tokens200): url http://localhost:8000/v1/completions headers {Content-Type: application/json} data { model: phi-3.5-mini-instruct, prompt: prompt, max_tokens: max_tokens, temperature: 0.7, stream: True } with requests.post(url, headersheaders, datajson.dumps(data), streamTrue) as response: for chunk in response.iter_lines(): if chunk: decoded_chunk chunk.decode(utf-8) if decoded_chunk.startswith(data:): data json.loads(decoded_chunk[5:]) yield data[choices][0][text] # 示例调用 for text in generate_text_stream(写一篇关于人工智能的短文): print(text, end, flushTrue)4. Chainlit前端集成4.1 基础Chainlit应用创建一个简单的Chainlit应用来与模型交互import chainlit as cl import requests import json cl.on_message async def main(message: cl.Message): # 调用vLLM API url http://localhost:8000/v1/completions headers {Content-Type: application/json} data { model: phi-3.5-mini-instruct, prompt: message.content, max_tokens: 500, temperature: 0.7 } response requests.post(url, headersheaders, datajson.dumps(data)) result response.json() # 发送响应 await cl.Message(contentresult[choices][0][text]).send()4.2 增强版Chainlit应用添加更多交互功能和更好的用户体验import chainlit as cl import requests import json from typing import Optional cl.on_chat_start async def start_chat(): settings await cl.ChatSettings( [ cl.input_widget.Slider( idtemperature, labelTemperature, initial0.7, min0, max1, step0.1 ), cl.input_widget.Slider( idmax_tokens, labelMax Tokens, initial500, min100, max2000, step100 ) ] ).send() cl.on_message async def main(message: cl.Message): # 获取用户设置 settings cl.user_session.get(settings) # 创建消息元素 msg cl.Message(content) await msg.send() # 调用vLLM API url http://localhost:8000/v1/completions headers {Content-Type: application/json} data { model: phi-3.5-mini-instruct, prompt: message.content, max_tokens: settings[max_tokens] if settings else 500, temperature: settings[temperature] if settings else 0.7, stream: True } full_response with requests.post(url, headersheaders, datajson.dumps(data), streamTrue) as response: for chunk in response.iter_lines(): if chunk: decoded_chunk chunk.decode(utf-8) if decoded_chunk.startswith(data:): data json.loads(decoded_chunk[5:]) token data[choices][0][text] full_response token await msg.stream_token(token) await msg.update()5. 实际应用示例5.1 代码解释器创建一个能够解释代码的Chainlit应用import chainlit as cl import requests import json SYSTEM_PROMPT 你是一个专业的代码解释器。用户会提供一段代码你需要 1. 解释代码的功能 2. 指出可能的改进点 3. 提供优化建议 4. 用简单的语言说明复杂概念 cl.on_message async def explain_code(message: cl.Message): prompt f{SYSTEM_PROMPT}\n\n请解释以下代码\n\n{message.content}\n # 调用vLLM API url http://localhost:8000/v1/completions headers {Content-Type: application/json} data { model: phi-3.5-mini-instruct, prompt: prompt, max_tokens: 800, temperature: 0.5 } response requests.post(url, headersheaders, datajson.dumps(data)) result response.json() # 发送响应 await cl.Message(contentresult[choices][0][text]).send()5.2 文档生成器创建一个自动生成文档的应用import chainlit as cl import requests import json cl.on_message async def generate_docs(message: cl.Message): prompt f根据以下需求生成详细的技术文档 需求描述 {message.content} 文档要求 1. 包含概述、功能说明、使用示例三部分 2. 使用Markdown格式 3. 代码示例要完整可运行 4. 语言简洁专业 # 调用vLLM API url http://localhost:8000/v1/completions headers {Content-Type: application/json} data { model: phi-3.5-mini-instruct, prompt: prompt, max_tokens: 1000, temperature: 0.6 } response requests.post(url, headersheaders, datajson.dumps(data)) result response.json() # 发送响应 await cl.Message(contentresult[choices][0][text]).send()6. 总结本文介绍了如何使用Python调用vLLM API来与Phi-3.5-mini-instruct模型交互并通过Chainlit构建用户友好的前端界面。主要内容包括模型简介了解Phi-3.5-mini-instruct的特点和能力API调用学习如何通过Python代码与vLLM API交互前端集成使用Chainlit构建交互式聊天界面实际应用实现代码解释器和文档生成器等实用功能通过这些示例您可以快速上手Phi-3.5-mini-instruct模型并将其集成到自己的应用中。模型支持流式响应和多种参数调整能够满足不同场景的需求。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

Phi-3.5-mini-instruct代码实例:Python调用vLLM API+Chainlit前端示例

Phi-3.5-mini-instruct代码实例:Python调用vLLM APIChainlit前端示例 1. 模型简介 Phi-3.5-mini 是一个轻量级的开放模型,属于 Phi-3 模型家族。它基于高质量的数据集构建,包括合成数据和经过筛选的公开网站数据,特别关注推理密…...

无人机视角风力涡轮机缺陷检测数据集VOC+YOLO格式5464张1类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数):5464标注数量(xml文件个数):5464标注数量(txt文件个数):5464标注类别…...

如何掌握Flux Standard Action:isFSA和isError工具函数的终极指南

如何掌握Flux Standard Action:isFSA和isError工具函数的终极指南 【免费下载链接】flux-standard-action A human-friendly standard for Flux action objects. 项目地址: https://gitcode.com/gh_mirrors/fl/flux-standard-action Flux Standard Action&am…...

Bluesky 24小时全网瘫痪深度解析:伊朗API层DDoS攻击与去中心化平台的安全困局

前言 2026年4月15日深夜,一场突如其来的大规模网络攻击让全球增长最快的去中心化社交平台Bluesky陷入了成立以来最严重的服务危机。在短短24小时内,全球4370万用户无法刷新信息流、接收通知、发布内容或使用搜索功能,平台几乎完全瘫痪。此次攻…...

ComfyUI IPAdapter完全指南:从零开始掌握图像风格迁移与人物特征控制

ComfyUI IPAdapter完全指南:从零开始掌握图像风格迁移与人物特征控制 【免费下载链接】ComfyUI_IPAdapter_plus 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI_IPAdapter_plus 在AI图像生成领域,ComfyUI IPAdapter插件为你提供了一个强大…...

手把手教你用Python爬取并整理三国杀移动版全武将台词(含2024最新群雄数据)

Python爬取三国杀移动版全武将台词的自动化实践 1. 项目背景与需求分析 三国杀作为国内现象级卡牌游戏,其武将台词系统承载着丰富的文化内涵和角色个性。对于开发者、数据分析师和游戏爱好者而言,系统性地收集整理这些台词数据具有多重价值: …...

NLI-DistilRoBERTa应用案例:多语言文本分析助手搭建指南

NLI-DistilRoBERTa应用案例:多语言文本分析助手搭建指南 1. 项目概述与核心能力 自然语言推理(Natural Language Inference, NLI)是自然语言处理中的一项基础任务,用于判断两个句子之间的逻辑关系。基于DistilRoBERTa的NLI模型通过轻量化的设计&#x…...

终极指南:3步永久备份QQ空间青春记忆的Python神器

终极指南:3步永久备份QQ空间青春记忆的Python神器 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory GetQzonehistory是一款专业的QQ空间数据备份工具,能够帮助您完…...

C语言ASM汇编内嵌语法详解

GCC 支持在C/C代码中嵌入汇编代码,这些汇编代码被称作GCC Inline ASM——GCC内联汇编。这是一个非常有用的功能,有利于我们将一些C/C语法无法表达的指令直接潜入C/C代码中,另外也允许我们直接写 C/C代码中使用汇编编写简洁高效的代码。1.基本…...

CircuitJS1 Desktop Mod:零基础入门电路仿真的终极免费指南

CircuitJS1 Desktop Mod:零基础入门电路仿真的终极免费指南 【免费下载链接】circuitjs1 Standalone (offline) version of the Circuit Simulator with small modifications based on modified NW.js. 项目地址: https://gitcode.com/gh_mirrors/circ/circuitjs1…...

告别手动重启!用NSSM把任意EXE程序变成Windows服务(附蚂蚁笔记实战)

Windows服务化神器NSSM:让普通程序享受系统级守护 每次服务器断电重启后,那些需要手动启动的后台程序是否让你头疼?当关键业务进程意外崩溃时,你是否不得不半夜爬起来手动恢复?在Windows服务器环境下,许多开…...

R3nzSkin国服换肤实战指南:安全自定义英雄联盟视觉体验完整方案

R3nzSkin国服换肤实战指南:安全自定义英雄联盟视觉体验完整方案 【免费下载链接】R3nzSkin-For-China-Server Skin changer for League of Legends (LOL) 项目地址: https://gitcode.com/gh_mirrors/r3/R3nzSkin-For-China-Server 英雄联盟国服皮肤自定义一直…...

避开这三个坑!企业无线网络规划中VLAN与DHCP的实战配置心得(以华为AC+AP为例)

企业无线网络规划中的三大隐形陷阱:VLAN与DHCP实战避坑指南 去年负责某跨国制造企业的无线网络升级项目时,凌晨三点被紧急电话叫醒——新部署的华为ACAP系统突然大面积断网。会议室里高管们正等着视频会议,而我们的无线网络却像被施了魔法般集…...

Flowchart-Vue:将可视化复杂性转化为开发者的技术杠杆

Flowchart-Vue:将可视化复杂性转化为开发者的技术杠杆 【免费下载链接】flowchart-vue Vue.js Flowchart Component with Drag-and-Drop Designer 项目地址: https://gitcode.com/gh_mirrors/fl/flowchart-vue 在当今的前端开发领域,业务流程可视…...

一站式游戏模组管理:XXMI启动器终极指南,轻松管理你的二次元游戏体验

一站式游戏模组管理:XXMI启动器终极指南,轻松管理你的二次元游戏体验 【免费下载链接】XXMI-Launcher Modding platform for GI, HSR, WW and ZZZ 项目地址: https://gitcode.com/gh_mirrors/xx/XXMI-Launcher 你是否厌倦了为不同的二次元游戏反复…...

告别‘频率越高,波束越窄’:聊聊麦克风阵列在智能音箱里如何保持‘听力稳定’

智能音箱的听觉革命:如何让高频唤醒不再"耳背" 清晨的阳光透过窗帘洒进卧室,你对着床头的智能音箱喊了三声"播放晨间新闻",它却毫无反应——直到你压低嗓音用低沉的语调重复指令,那个圆滚滚的小家伙才突然&qu…...

三步解锁百度文库:127行代码让你免费保存任何文档的终极指南

三步解锁百度文库:127行代码让你免费保存任何文档的终极指南 【免费下载链接】baidu-wenku fetch the document for free 项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wenku 还在为百度文库的付费文档而烦恼吗?每次找到心仪的资料&#x…...

如何快速优化FlexSlider轮播组件的可访问性:让残障用户也能轻松使用

如何快速优化FlexSlider轮播组件的可访问性:让残障用户也能轻松使用 【免费下载链接】FlexSlider An awesome, fully responsive jQuery slider plugin 项目地址: https://gitcode.com/gh_mirrors/fl/FlexSlider FlexSlider作为一款优秀的响应式jQuery轮播插…...

3步掌握OpenPLC Editor:工业自动化编程的免费开源完整解决方案

3步掌握OpenPLC Editor:工业自动化编程的免费开源完整解决方案 【免费下载链接】OpenPLC_Editor 项目地址: https://gitcode.com/gh_mirrors/ope/OpenPLC_Editor 你是否曾为高昂的PLC编程软件费用而烦恼?或者面对复杂的工业控制系统感到无从下手…...

3天打造专属桌面宠物:DyberPet框架让数字伙伴触手可及

3天打造专属桌面宠物:DyberPet框架让数字伙伴触手可及 【免费下载链接】DyberPet Desktop Cyber Pet Framework based on PySide6 项目地址: https://gitcode.com/GitHub_Trending/dy/DyberPet 你是否曾幻想过拥有一个会陪你工作、提醒你休息、甚至能跟你聊天…...

10个rom-rb最佳实践技巧:从入门到专家级

10个rom-rb最佳实践技巧:从入门到专家级 【免费下载链接】rom Data mapping and persistence toolkit for Ruby 项目地址: https://gitcode.com/gh_mirrors/ro/rom rom-rb是Ruby的强大数据映射和持久化工具包,它提供了灵活的方式来处理数据访问层…...

终极指南:深度解密Kotlin编译器后端IR从指令选择到平台优化的全流程

终极指南:深度解密Kotlin编译器后端IR从指令选择到平台优化的全流程 【免费下载链接】kotlin The Kotlin Programming Language. 项目地址: https://gitcode.com/GitHub_Trending/ko/kotlin Kotlin作为一门现代跨平台编程语言,其编译器后端的中间…...

手把手教你:用Wireshark抓包搞定‘哑巴’设备的IP地址(附三种情况实战)

工业设备IP定位实战:Wireshark抓包全流程解析 车间里那台新到的PLC控制器静静躺在工作台上,除了一个闪烁的绿色网口指示灯,没有任何显示界面。老张盯着它叹了口气——这已经是本周第三次遇到"哑巴"设备了。在工业物联网和智能硬件普…...

FontCenter:彻底解决AutoCAD字体缺失的终极方案,效率提升300%[特殊字符]

FontCenter:彻底解决AutoCAD字体缺失的终极方案,效率提升300%🚀 【免费下载链接】FontCenter AutoCAD自动管理字体插件 项目地址: https://gitcode.com/gh_mirrors/fo/FontCenter 你是否曾在打开AutoCAD图纸时遭遇字体缺失的困扰&…...

Phi-3-mini-4k-instruct-gguf实战:基于C++的高性能推理服务开发

Phi-3-mini-4k-instruct-gguf实战:基于C的高性能推理服务开发 1. 为什么选择C开发推理服务 在实时对话和智能客服这类对延迟敏感的在线服务场景中,C凭借其接近硬件的性能优势成为首选。与Python等解释型语言相比,C能直接管理内存、避免垃圾…...

别再只盯着激光了!聊聊生活中那些意想不到的偏振光应用(从手机屏幕到太阳镜)

别再只盯着激光了!聊聊生活中那些意想不到的偏振光应用(从手机屏幕到太阳镜) 清晨的阳光透过窗帘缝隙洒进房间,你拿起床头的手机查看消息——这个再普通不过的动作,其实已经和偏振光打了三次照面:液晶屏幕的…...

PCB布局翻车实录:一个开尔文连接没做好,我的电流检测误差直接飙升2.5%

PCB布局中的开尔文连接陷阱:如何避免电流检测误差飙升2.5% 在硬件电路设计中,电流检测是一个看似简单却暗藏玄机的环节。许多工程师在调试电路时都曾遇到过这样的困惑:明明选用了高精度的电流感应放大器和低阻值分流电阻,实测数据…...

告别重复操作:用Raspberry Pi Pico和CircuitPython搭建你的第一个游戏自动化项目

用Raspberry Pi Pico和CircuitPython打造智能自动化工具:从游戏辅助到生产力提升 1. 硬件自动化:一个全新的创客世界 当你第一次把Raspberry Pi Pico握在手中时,可能很难想象这个比U盘大不了多少的开发板能做什么。实际上,这款售价…...

终极量化交易学习指南:从零掌握Python金融编程的完整路径

终极量化交易学习指南:从零掌握Python金融编程的完整路径 【免费下载链接】Tutorials Jupyter notebook tutorials from QuantConnect website for Python, Finance and LEAN. 项目地址: https://gitcode.com/gh_mirrors/tutorials2/Tutorials QuantConnect量…...

Pixel Aurora Engine 赋能低代码平台:在Dify中集成AI图像生成能力

Pixel Aurora Engine 赋能低代码平台:在Dify中集成AI图像生成能力 1. 低代码平台与AI图像生成的完美结合 想象一下,你正在开发一个电商网站,需要为成千上万的商品自动生成展示图片。传统方式需要雇佣设计师团队,成本高昂且效率低…...