Dify中的自定义模型插件开发例子:以xinference为例
本文使用Dify v1.0.0-beta.1
版本。模型插件结构基本是模型供应商(模型公司,比如siliconflow
、xinference
)- 模型分类(模型类型,比如llm
、rerank
、speech2text
、text_embedding
、tts
)- 具体模型(比如,deepseek-v2.5
)。本文以xinference
为例,介绍Dify
中的自定义模型插件开发例子。
自定义模型指的是需要自行部署或配置的 LLM
,默认包含模型类型和模型名称两个参数,无需在供应商 yaml 文件定义。供应商配置文件无需实现 validate_provider_credential
。Runtime
会根据用户选择的模型类型或模型名称,自动调用对应模型层的 validate_credentials
方法进行验证。
一.xinference
模型插件
Xorbits Inference (Xinference)
是一个开源平台,用于简化各种 AI
模型的运行和集成。借助 Xinference
,可使用任何开源 LLM
、嵌入模型和多模态模型在云端或本地环境中运行推理,并创建强大的 AI
应用。
1.多层模型分类
│ xinference_helper.py
│
├─llm
│ llm.py
│ __init__.py
│
├─rerank
│ rerank.py
│ __init__.py
│
├─speech2text
│ speech2text.py
│ __init__.py
│
├─text_embedding
│ text_embedding.py
│ __init__.py
│
└─ttstts.py__init__.py
2.通过API秘钥配置
安装Xinference
插件后,通过输入API
密钥等信息进行配置。如下所示:
除社区支持开源版外,也提供企业版本,Xinference企业版和开源版本的对比[7],如下所示:
二.创建模型供应商
通过Dify
插件脚手架工具,创建项目就不再介绍了,主要是选择模型插件模版和配置插件权限等操作[1][2]。
1.创建模型供应商配置文件
明确自定义模型中所包含的模型类型。在插件项目的 /provider
路径下,新建 xinference.yaml
文件。Xinference
家族模型支持 LLM
、Text Embedding
和 Rerank
等模型类型,因此需要在xinference.yaml
文件中包含上述模型类型。
background: "#FAF5FF"
configurate_methods:- customizable-model
extra:python:model_sources:- models/llm/llm.py- models/rerank/rerank.py- models/text_embedding/text_embedding.py- models/tts/tts.py- models/speech2text/speech2text.pyprovider_source: provider/xinference.py
help:title:en_US: How to deploy Xinferencezh_Hans: 如何部署 Xinferenceurl:en_US: https://github.com/xorbitsai/inference
icon_large:en_US: icon_l_en.svg
icon_small:en_US: icon_s_en.svg
label:en_US: Xorbits Inference
model_credential_schema:credential_form_schemas:- label:en_US: Server urlzh_Hans: 服务器URLplaceholder:en_US: Enter the url of your Xinference, e.g. http://192.168.1.100:9997zh_Hans: 在此输入Xinference的服务器地址,如 http://192.168.1.100:9997required: truetype: secret-inputvariable: server_url- label:en_US: Model uidzh_Hans: 模型UIDplaceholder:en_US: Enter the model uidzh_Hans: 在此输入您的Model UIDrequired: truetype: text-inputvariable: model_uid- label:en_US: API keyzh_Hans: API密钥placeholder:en_US: Enter the api keyzh_Hans: 在此输入您的API密钥required: falsetype: secret-inputvariable: api_key- default: "60"label:en_US: invoke timeout (unit:second)zh_Hans: 调用超时时间 (单位:秒)placeholder:en_US: Enter invoke timeout valuezh_Hans: 在此输入调用超时时间required: truetype: text-inputvariable: invoke_timeout- default: "3"label:en_US: max retrieszh_Hans: 调用重试次数placeholder:en_US: Enter max retrieszh_Hans: 在此输入调用重试次数required: truetype: text-inputvariable: max_retriesmodel:label:en_US: Model Namezh_Hans: 模型名称placeholder:en_US: Enter your model namezh_Hans: 输入模型名称
provider: xinference
supported_model_types:- llm- text-embedding- rerank- speech2text- tts
configurate_methods
为customizable-model
,即Xinference
为本地部署的供应商,并且没有预定义模型,需要用什么模型需要根据 Xinference
的文档进行部署,因此此处的方法为自定义模型。如果接入的供应商提供自定义模型,需要添加model_credential_schema
字段。
2.编写模型供应商代码
对于像 Xinference
这样的自定义模型供应商,可跳过完整实现的步骤。只需创建一个名为 XinferenceProvider
的空类,并在其中实现一个空的 validate_provider_credentials
方法。
import logging
from dify_plugin import ModelProviderlogger = logging.getLogger(__name__)class XinferenceAIProvider(ModelProvider):def validate_provider_credentials(self, credentials: dict) -> None:pass
• XinferenceProvider
是一个占位类,用于标识自定义模型供应商。
• validate_provider_credentials
方法虽然不会被实际调用,但必须存在,这是因为其父类是抽象类,要求所有子类都实现这个方法。通过提供一个空实现,可以避免因未实现抽象方法而导致的实例化错误。
三.接入预定义模型
1.按模型类型创建不同模块结构
模型供应商下可能提供了不同的模型类型,需在供应商模块下创建相应的子模块,确保每种模型类型有独立的逻辑分层,便于维护和扩展[3]。当前支持模型类型如下:
2.编写模型调用代码
(1)llm.py
与预定义类型模型不同,由于没有在 yaml
文件中定义一个模型支持哪些参数,因此,需要动态时间模型参数的Schema
。比如 Xinference
支持max_tokens
、temperature
、top_p
这三个模型参数。但是有的供应商根据不同的模型支持不同的参数,比如供应商 OpenLLM
支持top_k
,但是并不是这个供应商提供的所有模型都支持 top_k
,这里举例A模型支持 top_k
,B 模型不支持top_k
,那么需要在这里动态生成模型参数的Schema
,如下所示:
def get_customizable_model_schema(self, model: str, credentials: dict) -> AIModelEntity | None:"""used to define customizable model schema"""rules = [ParameterRule(name='temperature', type=ParameterType.FLOAT,use_template='temperature',label=I18nObject(zh_Hans='温度', en_US='Temperature')),ParameterRule(name='top_p', type=ParameterType.FLOAT,use_template='top_p',label=I18nObject(zh_Hans='Top P', en_US='Top P')),ParameterRule(name='max_tokens', type=ParameterType.INT,use_template='max_tokens',min=1,default=512,label=I18nObject(zh_Hans='最大生成长度', en_US='Max Tokens'))]# if model is A, add top_k to rulesif model == 'A':rules.append(ParameterRule(name='top_k', type=ParameterType.INT,use_template='top_k',min=1,default=50,label=I18nObject(zh_Hans='Top K', en_US='Top K')))"""some NOT IMPORTANT code here"""entity = AIModelEntity(model=model,label=I18nObject(en_US=model),fetch_from=FetchFrom.CUSTOMIZABLE_MODEL,model_type=model_type,model_properties={ ModelPropertyKey.MODE: ModelType.LLM,},parameter_rules=rules)return entity
(2)rerank.py
(3)speech2text.py
(4)text_embedding.py
(5)tts.py
4.调试和发布插件
调试和发布插件不再介绍,具体操作参考文献[2]。
参考文献
[1] Model 插件:https://docs.dify.ai/zh-hans/plugins/quick-start/developing-plugins/model
[2] Dify中的GoogleSearch工具插件开发例子:https://z0yrmerhgi8.feishu.cn/wiki/Ib15wh1rSi8mWckvWROckoT2n6g
[3] https://github.com/langgenius/dify-official-plugins/tree/main/models/xinference
[4] 模型设计规则:https://docs.dify.ai/zh-hans/plugins/api-documentation/model/model-designing-specification
[5] 模型接口:https://docs.dify.ai/zh-hans/plugins/api-documentation/model/mo-xing-jie-kou
[6] AIModelEntity:https://docs.dify.ai/zh-hans/plugins/api-documentation/model/model-designing-specification#aimodelentity
[7] Xinference企业版和开源版本的对比:https://xorbits.cn/features
[8] Dify中的自定义模型插件开发例子:以xinference为例:https://z0yrmerhgi8.feishu.cn/wiki/Wi9Rw5lCPiNgUTkpkO5c3M5vn6d
相关文章:

Dify中的自定义模型插件开发例子:以xinference为例
本文使用Dify v1.0.0-beta.1版本。模型插件结构基本是模型供应商(模型公司,比如siliconflow、xinference)- 模型分类(模型类型,比如llm、rerank、speech2text、text_embedding、tts)- 具体模型(…...
crud方法命名示例
以下是基于表名dste_project_indicator(项目指标表)的完整命名示例,覆盖各类增删改查场景: 1. 表名与实体类映射 // 表名:dste_project_indicator // 实体类:DsteProjectIndicatorEntity public class Ds…...

尚硅谷redis7 33-36 redis持久化之RDB优缺点及数据丢失案例
官网说明优点: RDB是Redis数据的一个非常紧凑的单文件时间点表示,RDB文件非常适合备份。例如,您可能希望在最近的24小时内每小时旧档一次RDB文件,并在30天内每天保存一个RDB快照,这使您可以在发生来难时轻松恢复不同版本的数据集。RDB非常适合灾难恢复,它是一个可以…...
No such file or directory: ‘ffprobe‘
目录 详细信息: 解决方法: No such file or directory: ffprobe 详细信息: File "/usr/local/lib/python3.10/dist-packages/framepump/framepump.py", line 168, in get_duration return float(ffmpeg.probe(video_path)[form…...

计算机网络-WebSocket/DNS/Cookie/Session/Token/Jwt/Nginx
文章目录 WebSocketDNS什么是dns域名解析底层协议 cookie/sessionToken/JWTNginx WebSocket 一种网络通信协议,允许在单个 TCP(半双工) 连接上进行全双工通信(客户端和服务器可同时双向传输数据)。 HTTP是基于请求-响…...
功能“递归模式”在 C# 7.3 中不可用,请使用 8.0 或更高的语言版本的一种兼容处理方案
原程序: internal class ControllerParameterCreator : IParameterCreator {private Controller controller;public ControllerParameterCreator(Controller controller){this.controller controller;}public Parameter CreateSystem(string name, int unused){re…...
第4章-操作系统知识
存储管理 固定分区:一种静态分区方式请求分页存储管理覆盖技术:覆盖技术是指让作业中不同时运行的程序模块共同使用同一主存区域。...

将网页带格式转化为PDF
# 一、安装插件 SingleFile | 将完整的页面保存到一个 HTML 文件中 – 下载 🦊 Firefox 扩展(zh-CN) 打开火狐浏览器,安装上面的插件 # 二、下载html单文件 打开对应的网页,点击插件下载对应的html文件 # 三、打开…...

【ArcGIS】ArcGIS AI 助手----复现
github地址 korporalK/Archer-GIS-AI-Assitant:Archer 在 ArcGIS Pro 中将自然语言命令转换为自动化 GIS 工作流。它使用代理框架(计划-验证-执行)构建并由 LLM 提供支持,可简化空间分析、减少手动工作并使 GIS 更易于访问。Arch…...
使用 FFmpeg 将视频转换为高质量 GIF(保留原始尺寸和帧率)
在制作教程动图、产品展示、前端 UI 演示等场景中,我们经常需要将视频转换为体积合适且清晰的 GIF 动图。本文将详细介绍如何使用 FFmpeg 工具将视频转为高质量 GIF,包括: ✅ 保留原视频尺寸或自定义缩放✅ 保留原始帧率或自定义帧率✅ 使用调色板优化色彩质量✅ 降低体积同…...
《Java vs Go vs C++ vs C:四门编程语言的深度对比》
引言 从底层硬件操作到云端分布式系统,Java、Go、C 和 C 四门语言各自占据不同生态位。本文从设计哲学、语法范式、性能特性、应用场景等维度进行对比,为开发者提供技术选型参考。 一、设计哲学与历史定位…...

充电枪IEC62196/EN 62196测试内容
充电枪IEC62196/EN 62196测试内容 一、机械性能测试 插拔力测试 交流充电接口的插入/拔出力需≤100N,直流接口≤140N。若使用助力装置,操作力仍需满足上述要求。 测试方法:通过弹簧秤或专用试验机(如Sun-CB设备)测…...
有效的字母异位符--LeetCode
题目 给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的 字母异位词。 示例 1: 输入: s "anagram", t "nagaram" 输出: true示例 2: 输入: s "rat", t "car" 输出: false 思路一:排序 t 是 s …...

SAP ERP 系统拆分的七大挑战
在企业变革或管理运营风险时,剥离IT系统能带来显著效益,但SAP ERP系统的复杂性使得这项工作充满挑战。如果管理不当,可能会导致数据不一致、运营中断、合规风险和意外成本。由于SAP ERP系统深度集成于企业核心业务流程中,其拆分工…...

AcrelEMS 3.0智慧能源管理平台:构建企业微电网数智化中枢
安科瑞电气顾强 在"双碳"目标驱动下,企业能源管理正从粗放式运营向精细化、智能化转型。AcrelEMS 3.0智慧能源管理平台以微电网为核心载体,通过"感知-分析-决策-控制"的全链路数字化能力,助力工商企业、医疗机构、教育机…...
【HTML-12】HTML表格常用属性详解:从基础到高级应用
表格是HTML中最强大且常用的元素之一,它能够以结构化的方式展示数据。本文将全面介绍HTML表格的常用属性,帮助您创建美观、响应式且语义化的数据表格。 1. HTML表格基础结构 在深入了解属性之前,我们先回顾一下HTML表格的基本结构ÿ…...

Word转PDF--自动生成目录
1-Word文档中已经包含自动生成的目录; 2-选择“文件”; 3-另存为,PDF; 4-选择“选项”按钮,在弹出的窗口中,勾选“创建书签时使用标题”。...
MySQL组合索引优化策略
优化MySQL组合索引需要综合考虑查询模式、索引结构及数据库特性。以下是关键优化策略及示例: 1. 遵循最左前缀原则 策略:确保查询条件包含组合索引最左侧列。示例:索引(a,b,c)生效场景:WHERE a1 AND b2 -- ✔️ 使用a和b W…...
Spring MVC 的的核心原理与实践指南
一、Spring MVC 概述 Spring MVC 是 Spring 框架中的一个重要模块,用于构建基于 Java 的 Web 应用程序。它遵循模型-视图-控制器(MVC)设计模式,提供了一种结构化的方式来开发灵活、松耦合的 Web 应用。 Spring MVC 的特点…...

轻量级视觉语言模型 Dolphin:高效精准的文档结构化解析利器
在数字化办公和学术研究日益普及的今天,如何高效、准确地处理各类文档图像成为了一个亟需解决的问题。Dolphin 应运而生,作为一款基于异构锚点提示的多模态文档图像解析模型,它不仅打破了传统手动整理文档的繁琐流程,更以远超主流…...

如何安全配置数据库(MySQL/PostgreSQL/MongoDB)
数据库是许多应用程序的核心组成部分,因此保护数据库的安全性至关重要。无论是MySQL、PostgreSQL还是MongoDB,都需要经过适当的安全配置才能防止潜在的安全威胁。本文将介绍如何安全配置这些流行的数据库管理系统,以确保数据的保密性、完整性…...

将 Docker 镜像从服务器A迁移到服务器B的方法
在日常工作中,我们有时会需要将服务器 A上的镜像上传至服务器B上,下面给出具体操作方式,以镜像 postgres:15 为例进行讲解。 首先在服务器A上拉取 镜像 postgres:15 ,命令如下: docker pull postgres:15下面再将服务…...
git merge解冲突后,add、continue提交
git merge解冲突后,add、continue提交 git merge操作冲突后,需要手动解冲突,解完冲突后,需要: git add . 然后,进入一般的正常git代码提交流程。 git合并‘merge’其他分支的个别文件到当前branch_gitbash 合并branc…...
Lines of Thought in Large Language Models
Lines of Thought in Large Language Models 《Lines of Thought in Large Language Models》(大语言模型中的思维链)聚焦于分析大语言模型(LLMs)在生成文本时,其内部向量轨迹的统计特性。 核心目标是揭示LLMs复杂的“思维过程”(即文本生成时的隐藏状态变化)能否被简…...
八股战神-JVM知识速查
1.JVM组成 JVM由那些部分组成,运行流程是什么? JVM是Java程序的运行环境 组成部分: 类加载器:加载字节码文件到内存 运行时数据区:包括方法区,堆,栈,程序计数器,本地…...
机试 | STL | string | 文字处理软件
题目: P5734 【深基6.例6】文字处理软件 - 洛谷 不使用库函数 #include<stdio.h> #include <iostream> #include<string> using namespace std;int main() {int q;//第一行输入一个正整数q,表示操作次数string content;//第二行输入一…...

运动规划实战案例 | 图解基于状态晶格(State Lattice)的路径规划(附ROS C++/Python仿真)
目录 1 控制采样 vs 状态采样2 State Lattice路径规划2.1 算法流程2.2 Lattice运动基元生成2.3 几何代价函数2.4 运动学约束启发式 3 算法仿真3.1 ROS C仿真3.2 Python仿真 1 控制采样 vs 状态采样 控制采样的技术路线源自经典的运动学建模思想。这种方法将机器人的控制指令空…...
深入浅出对抗学习:概念、攻击、防御与代码实践
深入浅出对抗学习:概念、攻击、防御与代码实践 近年来,深度学习在图像识别、自然语言处理等领域取得了巨大成功。然而,研究表明,这些看似强大的模型却异常脆弱,容易受到**对抗样本(Adversarial Examples&a…...

Neo4j(二) - 使用Cypher操作Neo4j
文章目录 前言一、Cypher简介二、数据库操作1. 创建数据库2. 查看数据库3. 删除数据库4. 切换数据库 三、节点、关系及属性操作1. 创建节点与关系1.1 语法1.2 示例 2. 查询数据2.1 语法2.2 示例 3. 更新数据3.1 语法3.2 示例 4. 删除节点与关系4.1 语法4.2 示例 5. 合并数据5.1…...

09、供应商管理数字化转型:从潜在评估到战略合作的系统化方法
在全球化竞争和供应链日益复杂的商业环境下,供应商管理已成为企业核心竞争力的关键组成部分。优秀的供应商管理体系不仅能确保物料和服务的稳定供应,更能成为企业创新、降本增效的战略资源。本文将系统性地介绍供应商管理的完整框架,从潜在供…...