CSGHub携手Nvidia NIM、阿里计算巢打造企业级私有化部署解决方案
强强联合
人工智能与大数据的迅速发展,大模型的推理应用和资产管理已成为企业数字化转型的重要组成部分,企业正寻求高效、安全的AI模型部署解决方案。为应对日益增长的计算需求和复杂的数据管理挑战,CSGHub、Nvidia和阿里云计算巢强强联手,推出了全新的私有化部署解决方案。该方案旨在为大模型应用研发团队提供全生命周期的模型、数据集和代码管理能力,以实现高效、安全的推理应用环境,助力企业在数字化浪潮中不断前行。
- CSGHub:是一个专注于大模型和数据集管理的平台,为大模型应用研发团队提供全生命周期的模型、数据集、代码等数字资产管理能力。通过CSGHub,团队能够更加高效地管理和利用庞大的数据资源,促进创新与研发。
- NVIDIA NIM: 微服务是NVIDIA提供基于NVIDIA推理软件的预构建容器,包括 Triton 推理服务器™ 和 TensorRT™-LLM,使开发者能够将部署时间从几周缩短至几分钟。并在A100,H800 等高性能显卡具有推理加速功能。
- 阿里计算巢服务:是一个开放给服务商(包括:企业应用服务商、IT集成服务商、交付服务商和管理服务提供商等)和用户的服务管理PaaS平台。计算巢服务为服务商和用户提供了高效、便捷、安全的服务使用体验,服务商能更好地在阿里云上部署、交付和管理服务,用户能集中管理在阿里云上订阅的各类服务商提供的服务。
合作亮点
01 优势互补
此次合作整合了三方的优势资源,为大模型应用研发团队提供完备的私有化部署方案。CSGHub的数字资产管理能力、Nvidia NIM的推理优化技术以及阿里云的基础设施优势,实现技术互补,确保团队在研发过程中得到最佳体验。
02 高效的私有化部署
通过在阿里计算巢进行私有化部署,用户能够享受到更高的安全性和灵活性。无论是本地计算、混合云,还是完全云化的环境,合作方案均能满足不同场景下的需求,助力效率提升。
03 强大的技术能力
借助Nvidia NIM,用户能够获得领先的模型推理优化和加速能力。而CSGHub则为用户提供了全面的模型数据集资产管理方案与丰富的资源。CSGHub社区已拥有10多万个开源模型,后续将会上架更多的优质模型和数据集,助力大模型应用的开发。
方案
01 环境准备
- 在阿里云上申请包含有GPU的ack集群用于推理服务,并绑定公网IP 用于网关服务
- 一台ecs 服务器用于部署CSGHub,并绑定一个公网IP用于外部访问
- 申请试用NVIDIA nim 服务,获取相关模型的推理镜像,本例中将使用Llama3-8b-instruct
02 ACK 集群安装
ACK 集群以及关键组件, knative,以及网关服务可以从阿里云一键安装。

代码

Note: 如果使用kourier,kourier 所在节点需要绑定公网IP用于网关服务
03 CSGHub安装
- 参考文档https://github.com/OpenCSGs/CSGHub/tree/main/deploy/all_in_one,完成初始化部署
- 配置coredns,使用ALB服务可跳过此步 (optional)
- 配置proxy nginx,使用ALB服务可跳过此步 (optional)
- 重启CSGHub
Csghub, nim, ack 基本架构如下图

04 登录并测试

- 注册测试账号并登录
- 上传llama3.1 和qwen2 模型
- 选择llama-3.1 模型并点击部署
- 测试问答效果
API 测试

UI测试

性能测试(2GPU in A10)



此次合作,CSGHub、Nvidia与阿里云计算巢共同为大模型应用研发团队提供了一个安全、高效、灵活的私有化部署解决方案,通过整合顶尖的技术和资源,企业将在快速变化的市场环境中,持续创新与前行。
相关文章:
CSGHub携手Nvidia NIM、阿里计算巢打造企业级私有化部署解决方案
强强联合 人工智能与大数据的迅速发展,大模型的推理应用和资产管理已成为企业数字化转型的重要组成部分,企业正寻求高效、安全的AI模型部署解决方案。为应对日益增长的计算需求和复杂的数据管理挑战,CSGHub、Nvidia和阿里云计算巢强强联手&a…...
opencv的球面投影
cv::detail::SphericalProjector 在全景图像拼接任务中,可能需要对多个图像进行球面投影以实现无缝拼接。每个cv::detail::SphericalProjector可以负责一个图像的球面投影操作。通过将多个这样的投影器存储在std::vector中,可以对一组图像依次进行投影处…...
5. 去中心化应用(dApp)
去中心化应用(dApp) 去中心化应用(dApp)是基于区块链技术构建的应用程序,其核心特性是去中心化、透明和开放。dApp与传统应用有许多显著的区别,它们在实现和功能上都带来了新的变革。以下是对dApp的详细介…...
k8s服务发布Ingress
Kubernetes暴露服务的方式目前只有三种:LoadBlancer Service、NodePort Service、Ingress,通俗来讲,ingress和之前提到的Service、Deployment,也是一个k8s的资源类型,ingress用于实现用域名的方式访问k8s内部应用。 In…...
区块链学习笔记1--比特币
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。 从狭义上来说:区块链是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构,并以密码学的方式保证的不可篡改和不可伪造的分布式账本。 意思就是…...
在 Vite 项目中自动为每个 Vue 文件导入 base.less
在 Vue.js 项目中,使用 Less 作为 CSS 预处理器时,我们通常会创建一个全局的样式文件(如 base.less),用于存放一些全局变量、混合、通用样式等。为了避免在每个 Vue 组件中手动导入这个文件,我们可以通过配…...
RUST 学习之全局变量
RUST 全局变量 rust 全局变量编译期初始化的全局变量静态常量静态变量原子类型的静态变量 运行期初始化的全局变量lazy_staticBox::leakOnceCell & OnceLock 参考文档 rust 全局变量 编译期初始化的全局变量 静态常量 在编译期初始化,所以其赋值只能是表达式…...
代码随想录八股训练营第三十九天| C++
前言 一、说一下 lambda函数? 1.1.Lambda 函数的一般语法如下: 1.2.捕获子句: 二、C 怎么实现一个单例模式? 2.1.懒汉式(线程不安全): 2.2.饿汉式(线程安全): 2.3.双重检查锁定ÿ…...
服务网关工作原理,如何获取用户真实IP?
文章目录 一、什么是网关二、网关工作原理 (★)三、SpringCloud Gateway3.1 Gateway 简介3.2 Gateway 环境搭建3.3 自定义路由规则 (★)3.4 局部过滤器3.5 全局过滤器(案例:获取用户真实IP地址) (★) 补充1:不同类型的客户端如何设…...
单链表的实现(C语言)
目录 1.单链表 1.1 实现单链表 1.1.1 文件创建 1.1.2 链表功能了解 1.1.3 链表的结点 1.1.4 链表的函数声明 1.1.5 链表功能的实现 链表是一种链式结构,物理结构不连续,逻辑结构是连续的,在计算机中链表的实际存储是按照一个结点内存放…...
sql语句的训练2024/9/9
1题 需要看清思路:不是将数据库中的device_id的名字改为user_infors_example,而是在查找的时候,需要将device_id看成user_infors_example来进行查找。 答案 select device_id AS user_infos_example FROM user_profile limit 2 2 当固定查找…...
【QT】常用控件-下
欢迎来到Cefler的博客😁 🕌博客主页:折纸花满衣 🏠个人专栏:QT 目录 👉🏻QComboBox👉🏻 QSpinBox👉🏻QDateTimeEdit👉🏻QD…...
828华为云征文|华为云Flexus X实例docker部署Jitsi构建属于自己的音视频会议系统
828华为云征文|华为云Flexus X实例docker部署Jitsi构建属于自己的音视频会议系统 华为云最近正在举办828 B2B企业节,Flexus X实例的促销力度非常大,特别适合那些对算力性能有高要求的小伙伴。如果你有自建MySQL、Redis、Nginx等服务的需求&a…...
25虾皮笔试shopee笔试测评sea笔试测评题型
虾皮笔试shopee笔试测评用的自己的笔试系统,全英文笔试: 1.Numerical Reasoning Test:10题,言语推断和数学计算 2. Verbal Reasoning Test:10题,言语理解,每题一段英文材料,选对错…...
启明云端乐鑫代理商,乐鑫ESP32无线芯片方案,物联网设备WiFi联动控制
随着智能和远程技术的飞速发展,物联网(IoT)逐渐出现在我们生活的每一个角落。乐鑫以其创新的无线通信技术,正成为智能家居、工业自动化和医疗设备等领域的推动者。 无线WiFi芯片模组不仅提供了强大的数据处理能力,还赋予了设备以直观的交互方…...
希尔排序/选择排序
前言: 本篇主要对常见的排序算法进行简要分析,代码中均以数组 arr[] { 5, 3, 9, 6, 2, 4, 7, 1, 8 } 为例,进行升序排列。 常见的排序算法有如下: 选择排序中,直接选择排序没有任何实际与教育意义,而堆排…...
漫谈设计模式 [16]:中介者模式
引导性开场 菜鸟:老鸟,我最近在开发一个聊天应用的时候遇到了点问题。每个用户都需要与其他用户直接通信,这让我在代码中写了很多复杂的逻辑来管理这些联系。这样下去,代码越来越难维护了。你有什么建议吗? 老鸟&…...
深度学习-物体检测YOLO(You only look once)
目录 一:YOLO算法的网络结构 流程 1.图像分割 2.图片在网格中的处理 3.非极大值抑制 二:训练 三:分类误差 四:与Faster R-CNN对比 一:YOLO算法的网络结构 GooleNet4个卷积2个全连接层 流程 输入原始图片resize到…...
redisson中的分布式锁
我的博客大纲 我的后端学习大纲 a.redisson概述: 1.Redisson是一个在Redis的基础上实现的Java驻内存数据网格(In-Memory Data Grid)2.redisson介绍官方文档地址:3.Redisson它不仅提供了一系列的分布式的Java常用对象,还…...
如何将镜像推送到docker hub
前言 这一篇应该是最近最后一篇关于docker的博客了,咱来个有始有终,将最后一步——上传镜像给他写完,废话不多说,直接进入正题。 登录 首先需要确保登录才能推送到你的仓库中去,在终端输入docker login,输入用户名和…...
抖音批量下载开源工具:3个核心模块打造高效无水印下载工作流
抖音批量下载开源工具:3个核心模块打造高效无水印下载工作流 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback…...
百考通:AI让每一份调研与设计都高效落地
在数字化时代,市场调研、产品设计、学术研究等场景中,问卷设计作为核心环节,直接影响着数据收集的质量与工作推进的效率。传统问卷设计往往面临流程繁琐、耗时耗力、问题设计不精准等痛点,而百考通(https://www.baikao…...
5个关键步骤掌握B站视频下载神器DownKyi:从新手到高手
5个关键步骤掌握B站视频下载神器DownKyi:从新手到高手 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印等&#…...
期货合约乘数与最小变动价位:从 Quote 读规格做下单预算
前言 写天勤量化下单逻辑时,若手数、保证金和盈亏对不上账,我一般会先查合约规格有没有读错。乘数、最小变动价位(一跳)、涨跌停价都在 Quote 里,用统一字段做预算,比手算或硬编码合约表更不容易在换月后踩…...
Multi-Agent 系统故障排查:常见问题与解决方案速查手册
Multi-Agent系统故障排查实战手册:从踩坑到精通的全场景解决方案 关键词 多智能体系统、故障排查、分布式系统、Agent通信故障、共识算法、容错机制、可观测性 摘要 随着大模型技术的爆发,Multi-Agent(多智能体)系统已经成为AI应用、工业互联网、分布式机器人、智能客服…...
C语言泛型编程与类型安全 - C11的高级特性
引言 C语言通常被认为不支持泛型编程,但实际上通过巧妙的设计模式和C11标准的新特性,我们可以在C语言中实现类型安全的泛型代码。 本文将深入讲解如何使用void指针、宏技巧和C11的_Generic关键字实现泛型编程,让你的代码更加灵活和可复用。 一、void指针泛型基础 1.1 vo…...
终极指南:如何用免费C工具快速管理天龙八部单机版游戏数据
终极指南:如何用免费C#工具快速管理天龙八部单机版游戏数据 【免费下载链接】TlbbGmTool 某网络游戏的单机版本GM工具 项目地址: https://gitcode.com/gh_mirrors/tl/TlbbGmTool 还在为《天龙八部》单机版的数据管理而烦恼吗?TlbbGmTool是一款专为…...
Unity3d之随机生成数字
UnityEngine.Random.Range(min,max)包含最小值不包含最大值Mathf.Clamp是限定范围...
边缘计算与机器视觉在产线质检中的实战应用与优化
1. 项目概述:当产线质检遇上边缘计算与机器视觉在制造业的车间里,质检环节一直是效率与质量的“卡脖子”点。传统的人工目检,不仅劳动强度大、易受疲劳和情绪影响,而且标准难以统一,漏检、误检时有发生。而将高清相机拍…...
AI技术总监的晋升密码:搞定这6件事,你也能领导AI团队
在AI技术重塑各行各业的当下,软件测试从业者正站在职业转型的关键路口。从测试工程师到AI技术总监,不仅是职位的跃迁,更是能力模型的全面升级。想要在AI浪潮中脱颖而出,成为引领团队的技术掌舵人,你需要搞定这6件事。一…...
