当前位置: 首页 > article >正文

NVIDIA RTX™ GPU 低成本启动零售 AI 场景开发

零售行业正在探索应用 AI 升级客户体验,同时优化内部流程。面对多重应用场景以及成本优化压力,团队可采用成本相对可控的方案,来应对多重场景的前期项目预演和落地,避免短期内大规模投入造成的资源浪费。

客户体验 AI 场景的研究目前集中在 AI 客服,内部流程主要是 AI 营销合同生成合规审查供应链优化等。在项目研究和前期预演阶段,采用 NVIDIA RTX™ 系列的高性能GPU,进行本地化部署大模型,已经可以经济又高效地应对多数的 AI 场景开发。

1、AI 客服场景与适配算力

很多零售企业在转型中开始基于 DeepSeek 搭建客服,客服场景以对话交互为主,输入与输出较短,对并发、首字延迟有一定需求。接下来列举几个常用模型场景,以及我们所测试的算力方案数据。

  • 选择模型 DeepSeek-R1 32B(FP16),采用4卡 NVIDIA RTX™ 5000 Ada(单卡32GB显存)的方案,可以支持约64个用户同时进行简单问答,来保障首字时延控制大约在1秒以内;采用 8卡 NVIDIA RTX 5000 Ada 则可以支持至120多个并发,首字时延保持在2秒以内。

*测试数据来源:赞奇科技

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。

  • 选择模型 DeepSeek-R1 70B(FP16),采用 8卡 NVIDIA RTX™ 5880 Ada(单卡48GB显存) 的平台方案,能够应对80多个并发,首字时延控制在3秒以内。

*测试数据来源:赞奇科技

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。

  • 通义千问 QWQ 32B 模型因其回答问题逻辑性强,逐渐被用户所认可,性能直逼 DeepSeek 满血版,采用4卡NVIDIA RTX™ 5000 Ada (单卡32GB显存)时,并发数在100以内时,平均用户吞吐率可以达到 14 tokens/s

*测试数据来源:赞奇科技

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。

*数据测试环境:

4卡测试环境:CPU:Intel(R)Xeon(R) w5-3433,内存:256GB DDR5,硬盘:1TB。

8卡测试环境:CPU:英特尔® 至强® Silver 4314,内存:256GB DDR4,硬盘:3.84TB。

2、AI 营销场景与适配算力

依托 DeepSeek 模型逐步开发企业自有的智能营销工作流,可以极大地降本增效。该场景则以知识库场景为主,需要流畅地对海量文档、数据库信息进行检索和输出内容,长输入长输出场景居多,对于并发、时延、吞吐率都有一定要求。

对于小型团队来说,采用4卡 NVIDIA RTX 5000 Ada 的机型方案,可以应对基本的扩散模型训练、文生图、文生视频等生成式 AI 设计需求,也能应对 AI 营销文案制作、数据分析处理等应用,可预期达到的性能效果如下:

  • 采用 DeepSeek-R1 32B(FP16)模型,长输入、长输出的场景中,能够支持64个并发,保证流畅地信息检索和输出;
  • 采用通义千问 QWQ 32B (FP16)模型,长输入长输出的场景里,能够较好地支持到80个并发。

*测试数据来源:赞奇科技

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。

对于大型项目或团队来说,搭载 8卡 NVIDIA RTX 5880 Ada 并行计算,预期的性能效果如下:

  • 采用 DeepSeek-R1 32B(FP16)模型,长输入、长输出的场景中,能够很好地支持80个并发;
  • 采用 DeepSeek-R1 70B(FP16)模型,长输入、长输出的场景中,可以较好地支持16个并发。

*测试数据来源:赞奇科技

*测试环境同上

*本表所列成本预估具有动态调整特性,如想及时了解最新价格可联系文末小助手。

生成式 AI 设计项目中,ComfyUI 工作流可以较好地帮助企业快速地制作产品营销图/视频,更快地迭代营销方案。所涉及的模型如 SDXL,Flux 等,在高 batch size 情形下的训练和推理,GPU 显存建议在24GB以上。我们测试了一些 batch size 模型训练和推理的场景数据,供大家在 GPU 选型时做参考:

*以上数据使用电商数据集进行测试,数据来源于赞奇科技

*数据测试环境:

GPU: NVIDIA RTX 5000 Ada (32GB) *1 / NVIDIA RTX 5880 Ada (48GB) *1

CPU: Intel i5-12600KF (3.7GHz) *1,

内存:64GB,系统:win 11

在生成式 AI+三维可视化结合开发产品配置器、线上导购、数字人导购员等数字孪生场景中,NVIDIA RTX GPU 既可以进行 AI 训练推理,又因为其具有 RT core,也可以用于支持图形可视化场景,这是其独到的优势。这类数字孪生的营销场景,需要由 NVIDIA RTX 5000 Ada 或 NVIDIA RTX 5880 Ada 来做助力,才能运行得起较为复杂的模型和高并发的场景。

3、其他 AI 应用场景

其他 AI 应用场景例如合同生成、合规审查、供应链优化、用户行为分析等,需要实时处理大量数据,进行复杂的模型推理与分析,可采取四卡乃至八卡 NVIDIA RTX 5880 Ada 的方案,凭借高显存与超强的并行计算能力来执行较为复杂的 AI 任务。例如合同生成,同样也是大语言模型推理中,主要涉及长输入、长输出的场景,数据可参考上方 AI 营销场景的数据。

供应链优化、用户行为分析等场景,需具体依据用户的数据库、系统等信息来做判断,赞奇目前开放免费为用户咨询评估,具体可复制下方链接登记。‎

‎​rlzqlo1asm.feishu.cn/share/base/form/shrcnCbOVoltOXPQjFxveqrrIQbhttps://link.zhihu.com/?target=https%3A//rlzqlo1asm.feishu.cn/share/base/form/shrcnCbOVoltOXPQjFxveqrrIQb

以上数据均为测试得出,为用户高效地选型提供参考。但涉及到用户的多重场景和特殊需求,建议大家提前做机器测试,以调整至最优方案。下面列出上方提到的两个型号显卡的具体参数。

这两个型号均为 NVIDIA RTX Ada Lovelace 架构的顶配显卡,AI 能力与图形性能都远远超过了上一代安培架构“卡皇”——NVIDIA RTX™ A6000。

NVIDIA RTX 系列高性能显卡参数概览

*与NVIDIA产品相关的图片或视频(完整或部分)的版权均归NVIDIA Corporation所有。

相关文章:

NVIDIA RTX™ GPU 低成本启动零售 AI 场景开发

零售行业正在探索应用 AI 升级客户体验,同时优化内部流程。面对多重应用场景以及成本优化压力,团队可采用成本相对可控的方案,来应对多重场景的前期项目预演和落地,避免短期内大规模投入造成的资源浪费。 客户体验 AI 场景的研究…...

【网络】IP层的重要知识

目录 1.IP层的作用 2.主机和节点 3.网络层和数据链路层的关系 4.路由控制 4.1.路由控制的过程 4.2. IP地址与路由控制 4.3.路由控制表的聚合 4.4.静态路由和动态路由 4.5.动态路由的基础 5.数据链路的抽象化 5.1.数据链路不同,MTU则相异 5.2.路径MTU发…...

数理逻辑(Mathematical Logic)综论与跨学科应用

李升伟 整理 数理逻辑(Mathematical Logic)是现代逻辑学与数学交叉的核心学科,以严格的数学方法研究逻辑推理的形式与规律。其发展深刻影响了数学基础、计算机科学、语言哲学等领域。以下从多个维度综论数理逻辑: 1. 核心分支 命…...

OpenCV 模板匹配方法详解

文章目录 1. 什么是模板匹配?2. 模板匹配的原理2.1数学表达 3. OpenCV 实现模板匹配3.1基本步骤 4. 模板匹配的局限性5. 总结 1. 什么是模板匹配? 模板匹配(Template Matching)是计算机视觉中的一种基础技术,用于在目…...

一键解锁Landsat 9地表温度计算!ENVI与ArcGIS Pro全流程详解(无需NASA大气校正)

为什么选择Landsat 9的L2SP数据? 之前:《ArcGIS与ENVI——基于landsat与Modis影像的遥感技术的生态环境质量评价》,基于Landsat前期的产品计算温度反演数据需要一系列复杂的步骤。 现在: Landsat 8-9的Collection 2 Level-2&…...

RK3588的linux下实现HDMI输出分辨率及帧率的裁剪

bug反馈:客户现场反馈hdmi接显示屏出现概率性闪黑屏,排除线材,显示屏及GND等外部因素后,提出尝试降低hdmi的输出分辨率和帧率对比测试看看。 Step1:先直接在linux的sdk中找到板卡编译生成后的dts找到hdmi节点 然后找到…...

XR技术赋能艺术展演|我的宇宙推动东方美学体验化

本次广州展览现场引入我的宇宙XR体验模块,通过空间计算与动作捕捉技术,让观众在潮玩艺术氛围中体验虚拟互动,打造“看得懂也玩得动”的展演新场景。 作为科技与文化融合的推动者,我的宇宙正在以“体验科技”为媒介,为潮…...

多线程进阶知识篇(二)

文章目录 一、Synchronized 锁二、ReentrantLock 锁三、两阶段终止阶段一:通知终止阶段二:响应中断 四、线程池为什么要使用线程池?如何创建线程池?ExecutorsThreadPoolExecutor 线程池的基本参数 五、线程池处理任务的流程 一、S…...

Python深度学习基础——深度神经网络(DNN)(PyTorch)

张量 数组与张量 PyTorch 作为当前首屈一指的深度学习库,其将 NumPy 数组的语法尽数吸收,作为自己处理张量的基本语法,且运算速度从使用 CPU 的数组进步到使用 GPU 的张量。 NumPy 和 PyTorch 的基础语法几乎一致,具体表现为&am…...

简单实现单点登录

单点登录 单点登录(Single Sign-On, SSO) SSO是一种统一身份认证技术,用户只需在认证平台登录一次,即可访问所有关联的应用程序或网站,无需重复输入凭据。例如,企业员工登录内部系统后,可直接…...

c++基础三

1.继承 继承表示,子类可以获取父类的属性和方法,然后可以写子类独有的属性和方法,或者修改父类的方法。类可以继承父类的公共成员(public),但不能继承私有成员(private),私有成员只能在父类内部访问。 1.1 案例一单继承 #include <iostream>using namespace …...

如何将自己的项目推送到GitHub上面去

将项目推送到GitHub的流程总结 以下是将本地项目推送到GitHub仓库的完整流程&#xff1a; 1. 初始化Git仓库&#xff08;如果尚未初始化&#xff09; cd 项目目录 git init2. 配置远程仓库 # 添加远程仓库地址 git remote add origin https://github.com/用户名/仓库名.git…...

Java动态批量生成logback日志文件

应用场景举个例子&#xff1a; 当我一个服务需要启动n个端口&#xff0c;来监听n个来源的数据&#xff0c;并且处理数据逻辑一致&#xff1b;但是我想要它们的日志分开文件夹来打印&#xff0c;从而更好的分析问题&#xff0c;那么就可以用我下面提供的模版了&#xff1b; 动态…...

02、GPIO外设(一):基础知识

基础知识 1、ZET6的引脚分布2、引脚输出3、引脚输入4、最大输出速度 1、ZET6的引脚分布 下面使用C8T6的引脚来类比ZET6的引脚&#xff0c;ZET6中的特殊功能引脚和C8T6的特殊功能引脚是一样。而通用IO引脚比C8T6多而已。下面的C8T6的特殊功能引脚的介绍&#xff1a; STM32F103C8…...

智能Todo协作系统开发日志(二):架构优化与安全增强

&#x1f4c5; 2025年4月14日 | 作者&#xff1a;Aphelios380 &#x1f31f; 今日优化目标 在原Todo单机版基础上进行三大核心升级&#xff1a; 组件化架构改造 - 提升代码可维护性 本地数据加密存储 - 增强隐私安全性 无障碍访问支持 - 践行W3C标准 一、组件化架构改造 …...

【C++初阶】第14课—缝合怪deque和优先队列、仿函数

文章目录 1. 双端队列deque1.1 认识deque1.2 deque的迭代器1.3 deque的常用接口1.4 deque的优缺点 2. 优先队列priority_queue2.1 认识priority_queue2.2 模拟实现优先队列priority_queue 3. 仿函数 在学习deque之前&#xff0c;回顾一下vector和list各自的优缺点 数据结构优点…...

方德桌面操作系统V5.0-G23安装Docker并配置DockerHub镜像加速器

为什么要使用debina的docker源&#xff0c;因为查询os-release和uname 显示是基于debina 11的操作系统 rootyuhua-virtualmachine:~# cat /etc/os-release NAME"方德桌面操作系统" NAME_EN"NFSDesktop" VERSION"5.0" VERSION_ID"5.0"…...

parameter和localparam的区别(verilog中)

在Verilog中&#xff0c;parameter 和 localparam 都用于定义常量&#xff0c;但是它们之间有一些重要的区 作用范围&#xff1a; parameter&#xff1a;可以在模块外部被修改或重定义。它可以被作为模块的参数传递给其他模块&#xff0c;因此具有较广泛的作用范围&#xff0c;…...

紫光同创FPGA实现HSSTLP光口视频点对点传输,基于Aurora 8b/10b编解码架构,提供6套PDS工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目紫光同创FPGA相关方案推荐我这里已有的 GT 高速接口解决方案Xilinx系列FPGA实现GTP光口视频传输方案推荐Xilinx系列FPGA实现GTX光口视频传输方案推荐Xilinx系列FPGA实…...

数字孪生城市技术应用典型实践案例汇编(22个典型案例)(附下载)

近年来&#xff0c;数字孪生技术在我国从战略框架逐步向系统性落地推进&#xff0c;成为推动数字中国建设的重要技术引擎。随着《数字中国建设整体布局规划》《"十四五"数字经济发展规划》《深化智慧城市发展推进城市全域数字化转型的指导意见》等政策的实施&#xf…...

主流物理仿真引擎和机器人/强化学习仿真平台对比

以下是当前主流的物理仿真引擎和机器人/强化学习仿真平台的特点和适用场景&#xff0c;方便根据需求选择&#xff1a; &#x1f9e0; NVIDIA 系列 ✅ Isaac Lab v1.4 / v2 特点&#xff1a; 基于 Omniverse Isaac Sim&#xff0c;属于高端视觉机器人仿真框架v2 更加模块化&a…...

Hyperf (Swoole)的多进程 + 单线程协程、Gin (Go)Go的单进程 + 多 goroutine 解说

1. 核心概念解析 (1) Hyperf (Swoole): 多进程 单线程协程 Swoole 并发模型详解 Swoole 的并发模型基于多进程架构&#xff0c;每个进程是单线程的&#xff0c;线程内运行多个协程。以下是其结构的关键点&#xff1a; 多进程&#xff1a;Swoole 应用程序启动时&#xff0c;…...

Intel(R) Wi-Fi 6 AX201 160MHz

本文来源 &#xff1a; 腾讯元宝 ​​Intel(R) Wi-Fi 6 AX201 160MHz​​ 是一款支持最新 Wi-Fi 6&#xff08;802.11ax&#xff09;标准的无线网卡&#xff0c;专为现代笔记本电脑和台式机设计。以下是其主要特点和规格&#xff1a; ​​主要特性&#xff1a;​​ ​​Wi-Fi …...

Java 工厂设计模式详解:用统一入口打造灵活可扩展的登录系统----掌握 Spring 源码的基础第一步

一、前言 在实际开发中&#xff0c;我们经常面临以下场景&#xff1a; 系统支持多种登录方式&#xff08;用户名密码、管理员登录、OAuth 登录、短信登录等&#xff09; 每种登录方式的认证逻辑不同 我们希望对外提供一个统一的接口调用&#xff0c;而不暴露具体实现 这个…...

Spring Boot管理Spring MVC

Spring Boot真正的核心功能是自动配置和快速整合&#xff0c;通常Spring Boot应用的前端MVC框架依然使用Spring MVC。Spring Boot提供的spring-boot-starter-web启动器嵌入了Spring MVC的依赖&#xff0c;并为Spring MVC提供了大量自动配置&#xff0c;可以适用于大多数Web开发…...

在 Kali Linux 上安装 Java OpenJDK 8(详细指南)

前置知识 Kali Linux&#xff1a;本文假设你使用的是最新版本的 Kali Linux&#xff0c;且具有管理员权限&#xff08;sudo 或 root 权限&#xff09;。OpenJDK 8&#xff1a;OpenJDK 是 Java Development Kit (JDK) 的开源实现&#xff0c;包含运行 Java 程序所需的 Java Run…...

Windows单机模拟MySQL主从复制

这里写自定义目录标题 下载MySQL ZIP压缩包安装主库1、创建配置文件2、安装服务3、初始化数据库4、启动服务5、配置主库 安装从库1、配置ini文件2、安装服务3、初始化数据库4、启动服务5、配置从库6、验证从库状态 操作主库验证 下载MySQL ZIP压缩包 https://dev.mysql.com/do…...

Wifi密码查看软件V1.0

⭐本软件用于查看电脑连接过所有WiFi密码&#xff0c;不具备破解功能。 可在忘记WiFi密码或他人输入密码自己不知道的情况下使用。 ⭐⭐为便于快速分享&#xff0c;加入双击【密码】列可将WIFI密码复制在粘贴板。 ⭐⭐⭐双击【名称】列可生成用于手机连接的二维码进行显示&…...

分布式日志治理:Log4j2自定义Appender写日志到RocketMQ

&#x1f9d1; 博主简介&#xff1a;CSDN博客专家&#xff0c;历代文学网&#xff08;PC端可以访问&#xff1a;https://literature.sinhy.com/#/?__c1000&#xff0c;移动端可微信小程序搜索“历代文学”&#xff09;总架构师&#xff0c;15年工作经验&#xff0c;精通Java编…...

【口腔粘膜鳞状细胞癌】文献阅读3

文献 Single-cell transcriptomic analysis uncovers the origin and intratumoral heterogeneity of parotid pleomorphic adenoma 单细胞转录组学分析揭示了腮腺多形性腺瘤的起源和瘤内异质性 IF:10.8中科院分区:1区 医学WOS分区:Q1 摘要 多形性腺瘤 &#xff08;PA&#…...