通义千问AI模型对接飞书机器人-模型配置(2-1)
一 背景
根据业务或者使用场景搭建自定义的智能ai模型机器人,可以较少我们人工回答的沟通成本,而且可以更加便捷的了解业务需求给出大家设定的业务范围的回答,目前基于阿里云的通义千问模型研究。
二 模型研究
参考阿里云帮助文档:
https://help.aliyun.com/document_detail/2784263.html
https://help.aliyun.com/document_detail/2784278.html?spm=a2c4g.2779977.0.0.41c247904gVRRu
https://help.aliyun.com/zh/model-studio/user-guide/model-tools/?spm=a2c4g.11186623.0.0.451d5f17l5DF7U
1.通过阿里云百炼平台构建我们的应用模型
2.搭建我们的数据中心&知识库
3.创建应用,关联知识库文档做模型
1、模型概览
| 模型服务 | 模型名称 | 模型描述 | 备注 |
| 通义千问 | qwen-long | qwen-long是在通义千问针对超长上下文处理场景的大语言模型,支持中文、英文等不同语言输入,支持最长1000万tokens(约1500万字或1.5万页文档)的超长上下文对话。配合同步上线的文档服务,可支持word、pdf、markdown、epub、mobi等多种文档格式的解析和对话。 | |
| qwen-turbo | 通义千问超大规模语言模型,支持中文、英文等不同语言输入。 | 百炼平台支持,智能思考度偏低响应较快 | |
| qwen-plus | 通义千问超大规模语言模型增强版,支持中文、英文等不同语言输入。 | 百炼平台支持,兼顾智能思考跟响应的 | |
| qwen-max | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。随着模型的升级,qwen-max将滚动更新。如果希望使用固定版本,请使用历史快照版本。当前qwen-max模型与qwen-max-0428快照版本等价,均为最新版本的qwen-max模型,同时也是当前通义千问2.5产品版本背后的API模型。 | 百炼平台支持,智能思考度较高响应较慢 | |
| qwen-max-0428 | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。该模型为qwen-max的2024年4月28号的历史快照稳定版本,预期维护到下个快照版本发布时间(待定)后一个月。 | ||
| qwen-max-0403 | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。该模型为qwen-max的2024年4月3号的历史快照稳定版本,预期维护到下个快照版本发布时间(待定)后一个月。 | ||
| qwen-max-0107 | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。该模型为qwen-max的2024年1月7号的历史快照稳定版本,仅推荐特定需求客户访问。 | ||
| qwen-max-1201 | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。该模型为qwen-max的2023年12月1号的历史快照稳定版本,预期维护到下个快照版本发布时间(待定)后一个月。 | ||
| qwen-max-longcontext | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。 |
| 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。随着模型的升级,qwen-max将滚动更新。如果希望使用固定版本,请使用历史快照版本。当前qwen-max模型与qwen-max-0428快照版本等价,均为最新版本的qwen-max模型,同时也是当前通义千问2.5产品版本背后的API模型。 | 百炼平台支持,智能思考度较高响应较慢 | |
| qwen-max-0428 | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。该模型为qwen-max的2024年4月28号的历史快照稳定版本,预期维护到下个快照版本发布时间(待定)后一个月。 | |
| qwen-max-0403 | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。该模型为qwen-max的2024年4月3号的历史快照稳定版本,预期维护到下个快照版本发布时间(待定)后一个月。 | |
| qwen-max-0107 | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。该模型为qwen-max的2024年1月7号的历史快照稳定版本,仅推荐特定需求客户访问。 | |
| qwen-max-1201 | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。该模型为qwen-max的2023年12月1号的历史快照稳定版本,预期维护到下个快照版本发布时间(待定)后一个月。 | |
| qwen-max-longcontext | 通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。 |
2、AI应用步骤搭建
Step 1:数据管理-导入数据


Step 2:创建知识索引

选择导入数据到知识库

获取知识索引ID,支持与百炼Assistant API结合使用,支持RAG和插件的组合调用;

查看切割文档


Step 3:创建应用
进入我的应用后,点击新增应用。然后在应用配置中,进行以下几步操作:
-
选择模型。目前仅支持qwen-max模型,后续将支持更多的模型。同时,也可以支持设置模型内容生成的相关参数,如temperature等。
-
开启“知识检索增强”。
-
选择知识库,即在Step2中创建的知识索引。
-
点击“保存并发布”按钮。

4、测试AI应用
4.1 简单问题

4.2、自定义插件
在某些场景下,我们除了需要根据文档回答问题之外,还需要根据我们自定义的内容给出答案,例如查询公司某些业务的数据项,指标项等,这些三方ai无法清除,那么我们就可以通过自定义插件。
创建自定义插件


5 SDK对接
1、获取应用appid apikey
2、对接的地址

5.1、普通请求
@RequestMapping(value = "/ask/test")
public AssistantResp ask(@RequestBody AssistantReq req) {long l = System.currentTimeMillis();log.info("ask start={} message={}", l, req.getMessage());try {if (req.getMessage() == null || req.getMessage().trim().length() == 0) {return AssistantResp.builder().message("请输入问题").build();}ApplicationParam param = ApplicationParam.builder().apiKey("sk-&&&&&&&&").appId("f8a%%%%%%%%%%%%%%").prompt(req.getMessage()).sessionId(req.getSessionId()).temperature(0.5F).build();Application application = new Application();ApplicationResult result = application.call(param);log.info("result={}", JSONUtil.toJsonStr(result));AssistantResp ask = AssistantResp.builder().message(result.getOutput().getText()).build();log.info("请求耗时:{}", System.currentTimeMillis() - l);log.info("ask end={},message={}", System.currentTimeMillis(), ask.getMessage());return ask;} catch (Exception e) {return AssistantResp.builder().message("系统繁忙,请稍后再试").build();}}
5.2 流式响应
@RequestMapping(value = "/stream", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
public ResponseEntity<StreamingResponseBody> stream(@RequestBody AssistantReq req) {try {ApplicationParam param = ApplicationParam.builder().apiKey("sk-&&&&&&&&&&").appId("**************").prompt(req.getMessage()).incrementalOutput(true).build();Application application = new Application();Flowable<ApplicationResult> resultFlowable = application.streamCall(param);StreamingResponseBody responseBody = outputStream -> {resultFlowable.blockingForEach(data -> {String content = data.getOutput().getText();log.info("content={}",content);outputStream.write(content.getBytes());outputStream.flush(); // 确保数据立即发送});};return ResponseEntity.ok().body(responseBody);} catch (NoApiKeyException e) {e.printStackTrace();} catch (InputRequiredException e) {e.printStackTrace();}return ResponseEntity.ok().body(null);
}
5.3 多轮会话
public void answer(String askStr,String tenantKey,String openId) throws Exception {//通过openId 获取 sessionIdString sessionId = map.get(openId);log.info("askStr start={}",askStr);ApplicationParam param = ApplicationParam.builder().apiKey("sk-b**********").appId("f**************").prompt(askStr).sessionId(sessionId).build();log.info("param={}",JSONUtil.toJsonStr(param));Application application = new Application();ApplicationResult result = application.call(param);if(result.getOutput().getSessionId()!=null){map.put(openId,result.getOutput().getSessionId());}String text = result.getOutput().getText();}
下一篇:通义千问AI模型对接飞书机器人-集成飞书机器人(2-2)-CSDN博客
相关文章:
通义千问AI模型对接飞书机器人-模型配置(2-1)
一 背景 根据业务或者使用场景搭建自定义的智能ai模型机器人,可以较少我们人工回答的沟通成本,而且可以更加便捷的了解业务需求给出大家设定的业务范围的回答,目前基于阿里云的通义千问模型研究。 二 模型研究 参考阿里云帮助文档…...
[k8s源码]6.reflector
Reflector 和 Informer 是 Kubernetes 客户端库中两个密切相关但职责不同的组件。Reflector 是一个较低级别的组件,主要负责与 Kubernetes API 服务器进行交互,执行资源的初始列表操作和持续的监视操作,将获取到的数据放入队列中。而 Informe…...
前台文本直接取数据库值doFieldSQL插入SQL
实现功能:根据选择的车间主任带出角色。 实现步骤:OA的“字段联动”功能下拉选项带不出表“hrmrolemembers”,所以采用此方法。 doFieldSQL("select roleid from HrmResource as a inner join hrmrolemembers as b on a.id b.resource…...
【06】LLaMA-Factory微调大模型——微调模型评估
上文【05】LLaMA-Factory微调大模型——初尝微调模型,对LLama-3与Qwen-2进行了指令微调,本文则介绍如何对微调后的模型进行评估分析。 一、部署微调后的LLama-3模型 激活虚拟环境,打开LLaMA-Factory的webui页面 conda activate GLM cd LLa…...
数学建模学习(1)遗传算法
一、简介 遗传算法(Genetic Algorithm, GA)是一种用于解决优化和搜索问题的进化算法。它基于自然选择和遗传学原理,通过模拟生物进化过程来寻找最优解。 以下是遗传算法的主要步骤和概念: 初始化种群(Initialization&a…...
NumPy冷知识66个
NumPy冷知识66个 多维切片: NumPy支持多维切片,可以通过指定多个索引来提取多维数组的子集。 复杂数支持: NumPy可以处理复数,提供了复数的基本运算和函数。 比特运算: NumPy支持比特运算,如与、或、异或等。 数据存储格式: NumPy可以将数…...
Wi-SUN无线通信技术 — 大规模分散式物联网应用首选
引言 在数字化浪潮的推动下,物联网(IoT)正逐渐渗透到我们生活的方方面面。Wi-SUN技术以其卓越的性能和广泛的应用前景,成为了大规模分散式物联网应用的首选。本文将深入探讨Wi-SUN技术的市场现状、核心优势、实际应用中的案例以及…...
在 Ubuntu Server 22.04 上安装 Docker 的详细步骤
在 Ubuntu Server 22.04 上安装 Docker 的详细步骤 本文档详细记录了在 Ubuntu Server 22.04 上安装 Docker 的完整过程,包括解决过程中遇到的问题。希望能对读者有所帮助。 安装过程,重点需要看官方文档。https://docs.docker.com/engine/install/ubu…...
前端使用 Konva 实现可视化设计器(18)- 素材嵌套 - 加载阶段
本章主要实现素材的嵌套(加载阶段)这意味着可以拖入画布的对象,不只是图片素材,还可以是嵌套的图片和图形。 请大家动动小手,给我一个免费的 Star 吧~ 大家如果发现了 Bug,欢迎来提 Issue 哟~ github源码 g…...
vue3 -layui项目-左侧导航菜单栏
1.创建目录结构 进入cmd,先cd到项目目录(项目vue3-project) cd vue3-project mkdir -p src\\views\\home\\components\\menubar 2.创建组件文件 3.编辑menu-item-content.vue <template><template v-if"item.icon"><lay-ic…...
Spring AOP(1)
目录 一、AOP 概述 什么是Spring AOP? 二、Spring AOP 快速入门 1、引入AOP依赖 2、编写AOP程序 三、Spring AOP 详解 1、Spring AOP的核心概念 (1)切点(Pointcut) (2)连接点ÿ…...
第1关 -- Linux 基础知识
闯关任务 完成SSH连接与端口映射并运行hello_world.py ssh -p 37367 rootssh.intern-ai.org.cn -CNg -L 7860:127.0.0.1:7860 -o StrictHostKeyCheckingno可选任务 1 将Linux基础命令在开发机上完成一遍 可选任务 2 使用 VSCODE 远程连接开发机并创建一个conda环境 …...
tensorflow keras Model.fit returning: ValueError: Unrecognized data type
题意:TensorFlow Keras 的 Model.fit 方法返回了一个 ValueError,提示数据类型无法识别 问题背景: Im trying to train a keras model with 2 inputs: an image part thats a tf.data.Dataset and a nor mal part represented by a pd.DataF…...
虚拟机固定配置IP
在Hyper-V中,vEthernet (Default Switch) 是Hyper-V自带的默认虚拟交换机,它允许虚拟机直接连接到宿主机网络或外部网络。这个虚拟交换机可以通过Hyper-V管理器或PowerShell等工具进行管理和配置。以下是具体的操作步骤: 一、通过Hyper-V管理…...
【Pytorch实用教程】pytorch中random_split用法的详细介绍
在 PyTorch 中,torch.utils.data.random_split 是一个非常有用的函数,用于将数据集随机分割成多个子集。这在机器学习和深度学习中非常常见,特别是当你需要将数据集分割成训练集和测试集或验证集时。这里是 random_split 的详细用法介绍: 功能 random_split 用于随机地将…...
第二讲:NJ网络配置
Ethernet/IP网络拓扑结构 一. NJ EtherNet/IP 1、网络端口位置 NJ的CPU上面有两个RJ45的网络接口,其中一个是EtherNet/IP网络端口(另一个是EtherCAT的网络端口) 2、网络作用 如图所示,EtherNet/IP网络既可以做控制器与控制器之间的通信,也可以实现与上位机系统的对接通…...
pytorch中常见的模型3种组织方式 nn.Sequential(OrderedDict)
在nn.Sequential中嵌套OrderedDict组织网络,以对层进行命名 import torch import torch.nn as nn from collections import OrderedDictclass OrderedDictCNN(nn.Module):def __init__(self):super(OrderedDictCNN, self).__init__()# 使用 OrderedDict 定义网络层self.model …...
达梦数据库DM8-索引篇
目录 一、前景二、名词三、语法1、命令方式创建索引1.1 创建索引空间1.2.1 创建普通索引并指定索引数据空间1.2.2 另一种没验证,官方写法1.3 复合索引1.4 唯一索引1.5 位图索引1.6 函数索引 2、创建表时候创建索引3、可视化方式创建索引3.1 打开DM管理工具3.2 找到要…...
【中项】系统集成项目管理工程师-第4章 信息系统架构-4.5技术架构
前言:系统集成项目管理工程师专业,现分享一些教材知识点。觉得文章还不错的喜欢点赞收藏的同时帮忙点点关注。 软考同样是国家人社部和工信部组织的国家级考试,全称为“全国计算机与软件专业技术资格(水平)考试”&…...
随机梯度下降 (Stochastic Gradient Descent, SGD)
SGD 是梯度下降法的一种变体。与批量梯度下降法不同,SGD 在每次迭代中仅使用一个样本(或一个小批量样本)的梯度来更新参数。它能更快地更新参数,并且可以更容易地跳出局部最优解。 原理 SGD 的基本思想是通过在每次迭代中使用不…...
CODESYS与C#共享内存通讯踩坑实录:从“找不到路径”到稳定运行的调试指南
CODESYS与C#共享内存通讯实战:从命名空间陷阱到工业级稳定方案 在工业自动化项目中,CODESYS与上位机程序的实时数据交换堪称"生命线"。共享内存作为性能最高的IPC方式,理论上能达到微秒级响应——直到你在部署现场遇到那个经典的&q…...
Arm服务器架构设计:虚拟化与安全增强解析
1. Arm服务器基础架构设计哲学 现代Arm服务器架构的设计核心在于"硬件虚拟化优先"理念。与传统x86架构渐进式添加虚拟化功能不同,Armv8/v9架构从设计之初就将虚拟化支持作为基础能力。这种设计哲学在SBSA(Server Base System Architecture&…...
在RK3399上跑通ORB-SLAM2和VINS-MONO,我踩过的那些坑(含RealSense D435i兼容性测试)
在RK3399上部署ORB-SLAM2与VINS-MONO的避坑实战指南 引言 当视觉SLAM算法遇上嵌入式平台,总会碰撞出意想不到的火花。作为一名长期在边缘计算设备上折腾SLAM算法的开发者,我最近在RK3399这块性能强劲的ARM开发板上部署ORB-SLAM2和VINS-MONO时,…...
从‘//’到‘///’:解锁C#注释的正确姿势与隐藏的IDE效率技巧
从‘//’到‘///’:解锁C#注释的正确姿势与隐藏的IDE效率技巧 在代码的世界里,注释就像地图上的标记,不仅指引着后来的开发者理解代码的意图,更是开发者与未来自己对话的桥梁。对于C#开发者而言,注释不仅仅是简单的代…...
跟着 MDN 学 HTML day_35:(深入解析 CharacterData 抽象接口)
在 DOM 的庞大体系中,并非所有节点都以可见的标签形式存在。当我们操作一段文本、一条注释甚至一条处理指令时,背后都有一个共同的基类在默默提供支持。这个基类就是 CharacterData。它是一个抽象接口,意味着你不会在代码中直接创建 Characte…...
跟着 MDN 学 HTML day_34:(深入XML 中的 CDATASection 接口)
在 Web 开发的学习旅程中,我们大部分时间都在与 HTML 打交道。然而,当涉及到数据存储、配置文件或 RSS 订阅时,XML 依然扮演着不可或缺的角色。今天,我们将聚焦于 XML 世界中一个看似不起眼但在特定场景下极其有用的接口ÿ…...
QMCDecode:如何在3分钟内破解QQ音乐加密格式限制?
QMCDecode:如何在3分钟内破解QQ音乐加密格式限制? 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录࿰…...
Royal TSX中文汉化:解锁macOS远程管理的母语体验
Royal TSX中文汉化:解锁macOS远程管理的母语体验 【免费下载链接】Royal_TSX_Chinese_Language_Pack Royal_TSX的简体中文汉化包 项目地址: https://gitcode.com/gh_mirrors/ro/Royal_TSX_Chinese_Language_Pack 对于macOS平台的专业用户来说,Roy…...
如何高效掌控视频播放:智能速度调节工具完全指南
如何高效掌控视频播放:智能速度调节工具完全指南 【免费下载链接】videospeed HTML5 video speed controller (for Google Chrome) 项目地址: https://gitcode.com/gh_mirrors/vi/videospeed 你是否曾因在线视频播放速度太慢而感到焦虑?是否希望在…...
Vue项目里用Video.js播m3u8直播流,我踩过的那些坑(videojs-contrib-hls版)
Vue项目中Video.js集成m3u8直播流的深度排坑指南 1. 引言:当流媒体遇上Vue生态 在Vue项目中实现m3u8直播流播放,看似只是简单的播放器集成,实则暗藏玄机。作为经历过多个企业级视频平台开发的老手,我必须坦言:官方文档…...
