当前位置: 首页 > news >正文

Nvidia 携手 RTX 推出的本地运行 AI 聊天机器人

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

Nvidia 今天推出了 Chat with RTX 的早期版本,这是一个演示应用程序,允许你在个人电脑上运行一个私人 AI 聊天机器人。你可以向它提供 YouTube 视频和你自己的文档,以创建摘要和基于你自己的数据获取相关答案。这一切都在个人电脑上本地运行,你所需要的只是一块至少拥有 8GB VRAM 的 RTX 30 或 40 系列 GPU。

我在过去的一天里对 Chat with RTX 进行了简短的测试,尽管这个应用程序还有点粗糙,但我已经可以看到这将成为数据研究的有价值部分,特别是对于需要分析一系列文档的记者或任何人来说。

Chat with RTX 能够处理 YouTube 视频,所以你只需输入一个 URL,它就会让你搜索特定提及的字幕或总结整个视频。我发现这对于搜索视频播客非常理想,特别是在寻找过去一周关于微软新 Xbox 策略转变的传言中的特定提及时。

然而,搜索 YouTube 视频并不是完美的。我尝试搜索一段 The Verge YouTube 视频的字幕,但 Chat with RTX 下载了一个完全不同视频的字幕。这甚至不是我之前查询过的视频,所以在这个早期演示中显然存在漏洞。

Chat with RTX 在搜索你本地的文档方面表现出色。当它正常工作时,我能够在几秒内找到视频中的参考内容。我还为 Chat with RTX 创建了一个 FTC 诉微软文档的数据集进行分析。当我去年覆盖这个法庭案件时,快速搜索文档经常让人感到不堪重负,但 Chat with RTX 帮助我几乎立即在我的电脑上查询它们。

例如,聊天机器人很好地总结了在审判中揭示的微软整个 Xbox Game Pass 策略:

根据提供的上下文信息,Xbox Game Pass 是一项游戏内容订阅服务,它提供单一月费访问游戏库的权限。它被视为一个能让玩家在任何地方玩他们的游戏,并允许发布商在各处触达玩家的平台。该服务由 Project xCloud 和 Xbox Series X 支持,旨在为发布商创造一个利润丰厚的游戏环境。游戏 CSA 的主要战略目标是扩大 Xbox Game Pass 的规模,认为全球有着高达 7.5 亿的订阅者机会。该服务面临三个主要的内容动态,包括需要差异化的内容、扩展到控制台之外和有限的内容供应。

我还发现这对于扫描 PDF 和事实核查数据非常有用。微软自己的 Copilot 系统在 Word 中处理 PDF 并不好,但 Nvidia 的 Chat with RTX 没有问题地拉出所有关键信息。响应几乎是即时的,没有你通常在使用基于云的 ChatGPT 或 Copilot 聊天机器人时看到的延迟。

Chat with RTX 的一个大缺点是,它真的感觉像是一个早期的开发者演示。Chat with RTX 实质上在你的电脑上安装了一个网络服务器和 Python 实例,然后利用 Mistral 或 Llama 2 模型来查询你提供的数据。然后,它利用 Nvidia 的 Tensor 核心在 RTX GPU 上加速你的查询。

Chat with RTX 并不总是准确的。它在我的电脑上安装大约需要 30 分钟,我的电脑配备了一个 Intel Core i9-14900K 处理器和一个 RTX 4090 GPU。这个应用程序几乎有 40GB 大小,Python 实例占用了系统中可用的 64GB RAM 中的大约 3GB。一旦运行起来,你就可以通过浏览器访问 Chat with RTX,同时在后台运行的命令提示符会输出正在处理的内容和任何错误代码。

Nvidia 并不是将这个作为所有 RTX 拥有者都应该立即下载和安装的成熟应用程序来提供。存在许多已知的问题和限制,包括源归属并不总是准确。我最初尝试让 Chat with RTX 索引 25,000 个文档,但这似乎使应用程序崩溃了,我不得不清除首选项才能再次开始。

Chat with RTX 也不记得上下文,所以后续问题不能基于之前问题的上下文。它还在你要求它索引的文件夹内创建 JSON 文件,所以我不建议在你的整个 Windows 文档文件夹中使用这个。

我喜欢一个好的技术演示,Nvidia 在这里确实提供了这样的演示。它展示了未来在你的个人电脑上本地运行的 AI 聊天机器人的可能性,特别是如果你不想订阅像 Copilot Pro 或 ChatGPT Plus 这样的服务就能分析你的个人文件。

相关文章:

Nvidia 携手 RTX 推出的本地运行 AI 聊天机器人

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…...

年假作业day2

1.打印字母图形 #include<stdio.h> #include<string.h> int main(int argc, const char *argv[]) { int i,j; char k; for(i1;i<7;i) { for(j1;j<i;j) { printf("%c",_); } for(j0,…...

HTML-多媒体嵌入-MDN文档学习笔记

HTML-多媒体与嵌入 查看更多学习笔记&#xff1a;GitHub&#xff1a;LoveEmiliaForever MDN中文官网 HTML-中的图片 将图片放入网页 可以使用<img/>来将图片嵌入网页&#xff0c;它是一个空元素&#xff0c;最少只需src属性即可工作 <img src"图片链接"…...

openJudge | 距离排序 C语言

总时间限制: 1000ms 内存限制: 65536kB 描述 给出三维空间中的n个点&#xff08;不超过10个&#xff09;,求出n个点两两之间的距离,并按距离由大到小依次输出两个点的坐标及它们之间的距离。 输入 输入包括两行&#xff0c;第一行包含一个整数n表示点的个数&#xff0c;第二…...

【教程】MySQL数据库学习笔记(三)——数据定义语言DDL(持续更新)

写在前面&#xff1a; 如果文章对你有帮助&#xff0c;记得点赞关注加收藏一波&#xff0c;利于以后需要的时候复习&#xff0c;多谢支持&#xff01; 【MySQL数据库学习】系列文章 第一章 《认识与环境搭建》 第二章 《数据类型》 第三章 《数据定义语言DDL》 文章目录 【MyS…...

[leetcode]买卖股票的最佳时机 (动态规划)

121. 买卖股票的最佳时机 给定一个数组 prices &#xff0c;它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票&#xff0c;并选择在 未来的某一个不同的日子 卖出该股票。设计一个算法来计算你所能获取的最大利润。 返回你可以从…...

隐函数的求导【高数笔记】

1. 什么是隐函数&#xff1f; 2. 隐函数的做题步骤&#xff1f; 3. 隐函数中的复合函数求解法&#xff0c;与求导中复合函数求解法有什么不同&#xff1f; 4. 隐函数求导的过程中需要注意什么&#xff1f;...

SG3225EEN晶体振荡器规格书

SG3225EEN 晶振是EPSON/爱普生的一款额定频率25 MHz至500 MHz的石英晶体振荡器&#xff0c;6脚贴片&#xff0c;LV-PECL输出&#xff0c;3225封装常规有源晶振&#xff0c;具有小尺寸&#xff0c;轻薄型&#xff0c;高稳定性&#xff0c;低相位抖动&#xff0c;低电源电压&…...

ESP8266 常用AT指令

一、ESP8266的AT指令要点、常见错误 AT指令要大写;以"\r\n"作结尾;串口通信&#xff0c;115200-None-8-1;支持2.4G频段&#xff0c;不支持5G频段 &#xff08;如果用手机创建热点&#xff0c;注意选择2.4G&#xff09;不支持中文的wifi名称工作模式&#xff0c;上电…...

esbuild 构建工具为什么很快?

esbuild 构建工具之所以很快&#xff0c;主要有以下几个原因&#xff1a; Go语言编写&#xff1a;esbuild 是用 Go 语言编写的&#xff0c;Go 语言以其高效的并发模型和编译速度而闻名。与一些其他构建工具相比&#xff0c;Go 语言在并发处理和内存管理方面表现出色&#xff0c…...

解决vscode报错,在赋值前使用了变量“XXX“

问题&#xff1a;如图所示 解决方法&#xff1a; 法一&#xff1a; 补全函数使其完整 法二&#xff1a; 使用断言...

python自动定时任务schedule库的使用方法

当你需要在 Python 中定期执行任务时&#xff0c;schedule 库是一个非常实用的工具。它可以帮助你自动化定时任务。以下是一些使用示例&#xff1a; 基本使用&#xff1a; import schedule import timedef job():print("Im working...")schedule.every(10).minutes.d…...

用机器学习方法重构期货商品板块

用机器学习方法重构期货商品板块 阿岛格 参考专栏:低门槛搭建个人量化平台 https://www.zhihu.com/column/c_1441014235068944386 摘 要 金融市场商品期货的板块分类,通常根据不同交易所、监管机构和证券商标准,按照期货标的属性、或产业链关系等进行分类,各自分类略有差…...

51单片机项目(29)——基于51单片机的避障跟随小车

1.功能设计 按键模式&#xff1a;按下按键&#xff0c;小车可以前后左右地运动 自动模式&#xff1a;根据红外传感器的状态&#xff0c;自行决定运动状态。检测到前方有物体时&#xff0c;车子移动&#xff0c;起到一个跟随的效果。 演示视频如下&#xff1a; 51单片机智能避障…...

人工智能学习与实训笔记(六):百度飞桨套件使用方法

目录 八、百度飞桨套件使用 8.1 飞桨预训练模型套件PaddleHub 8.1.1 一些本机CPU可运行的飞桨预训练简单模型&#xff08;亲测可用&#xff09; 8.1.1.1 人脸检测模型 8.1.1.2 中文分词模型 8.1.2 预训练模型Fine-tune 8.2 飞桨开发套件 8.2.1 PaddleSeg - 图像分割 8…...

Linux第一个小程序-进度条

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言 一、回车和换行 二、行缓冲区概念 三、倒计时 四、进度条代码 版本一&#xff1a; ​编辑 版本二&#xff1a; 总结 前言 世上有两种耀眼的光芒&#xff0c;一…...

YoloV8改进策略:Block改进|Mamba-UNet改进YoloV8,打造全新的Yolo-Mamba网络

摘要 本文尝试使用Mamba的VSSBlock替换YoloV8的Bottleneck,打造最新的Yolo-Mamba网络。 论文:《Mamba-UNet:用于医学图像分割的类似UNet的纯视觉Mamba网络》 在医学图像分析的最新进展中,卷积神经网络(CNN)和视觉转换器(ViT)都取得了显著的基准成绩。前者通过其卷积…...

数据分析基础之《pandas(8)—综合案例》

一、需求 1、现在我们有一组从2006年到2016年1000部最流行的电影数据 数据来源&#xff1a;https://www.kaggle.com/damianpanek/sunday-eda/data 2、问题1 想知道这些电影数据中评分的平均分&#xff0c;导演的人数等信息&#xff0c;我们应该怎么获取&#xff1f; 3、问题…...

(17)Hive ——MR任务的map与reduce个数由什么决定?

一、MapTask的数量由什么决定&#xff1f; MapTask的数量由以下参数决定 文件个数文件大小blocksize 一般而言&#xff0c;对于每一个输入的文件会有一个map split&#xff0c;每一个分片会开启一个map任务&#xff0c;很容易导致小文件问题&#xff08;如果不进行小文件合并&…...

define和typedef

目录 一、define 二、typedef 三、二者之间的区别 一、define 在我们写代码的日常中&#xff0c;经常会用到define去配合数组的定义使用 #define N 10 arr[N]{0}; define不仅仅能做这些 #define是一种宏&#xff0c;我们首先来了解一下宏定义。 宏定义一般作用在C语言的预…...

PyQt5开发避坑:别再手动编译.ui文件了,试试uic.loadUi()动态加载

PyQt5高效开发&#xff1a;uic.loadUi()动态加载技术深度解析 在快速迭代的GUI开发过程中&#xff0c;PyQt5开发者常陷入一个效率陷阱——每次修改界面后都需要手动执行pyuic编译命令。这种重复性操作不仅打断开发流状态&#xff0c;还会在频繁调整阶段浪费大量时间。本文将揭示…...

初创公司如何利用Taotoken以可控成本试用多模型

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 初创公司如何利用Taotoken以可控成本试用多模型 对于资源有限的初创团队而言&#xff0c;在产品开发中引入大模型能力是一个充满机…...

PaddleOCR-VL 1.5 + ROCm:让开发者从文档解析 Demo 走向高性能生产部署

很多文档解析 Demo 看起来都很惊艳&#xff1a;上传一张图片&#xff0c;模型识别出文字、表格、公式&#xff0c;甚至还能输出 Markdown。但真正进入生产环境后&#xff0c;问题很快就会暴露出来。企业里的文档不是干净样例&#xff0c;而是 PDF、扫描件、合同、票据、财报、检…...

GAD7980 ADC在振动数据采集中的实战应用与设计要点

1. 项目概述&#xff1a;为什么我们需要“快、精、高”的振动数据采集&#xff1f;在工业设备状态监测、精密仪器分析乃至消费电子性能评估领域&#xff0c;振动数据就像设备的“心电图”。它直接反映了机械结构的健康状况、运动部件的平衡性以及系统运行的稳定性。过去&#x…...

BOX工控机在无人机机载系统中有什么优势?这 3 点是普通工控机比不了的

现在的无人机机载系统&#xff0c;越来越多的人选择用 BOX工控机。很多人问我&#xff0c;BOX工控机到底是什么?它和普通的工控机有什么区别?为什么大家都在用它?今天我就跟大家好好聊聊这个话题。我会从一个 17 年工控人的角度&#xff0c;给大家讲透 BOX工控机在无人机机载…...

信息学奥赛刷题技巧:用‘整型转布尔’这道题,教你举一反三理解数据类型隐式转换

从整型转布尔看C隐式类型转换的艺术 在信息学竞赛的刷题过程中&#xff0c;很多同学会止步于"这道题我做对了"的层面&#xff0c;却忽略了题目背后蕴含的语言特性宝藏。以OpenJudge 1.2.09这道经典的整型与布尔型转换题目为例&#xff0c;表面上看只是考察基本数据类…...

实战指南:vCenter Server Appliance 核心账户密码恢复与安全策略配置

1. 紧急救援前的准备工作 遇到vCenter Server Appliance密码丢失的情况&#xff0c;千万别急着操作。我见过太多同行因为心急直接动手&#xff0c;结果把问题搞得更复杂。咱们先做好这三件事&#xff0c;能避免90%的意外状况。 首先必须创建虚拟机快照&#xff0c;这个步骤的重…...

CCPD车牌数据集预处理避坑指南:透视变换原理详解与OpenCV实战

CCPD车牌数据集预处理避坑指南&#xff1a;透视变换原理详解与OpenCV实战 车牌识别系统中&#xff0c;数据预处理的质量直接影响模型性能。CCPD作为目前最全面的中文车牌数据集&#xff0c;其四点标注特性为透视变换提供了基础&#xff0c;但也暗藏诸多陷阱。本文将手把手带您穿…...

Flutter GetX实战:从Provider迁移到GetX,我的开发效率提升了多少?

Flutter GetX实战&#xff1a;从Provider迁移到GetX的效率革命 当Flutter开发团队面临状态管理方案的选择时&#xff0c;往往会陷入一种甜蜜的烦恼——官方推荐的Provider虽然稳定可靠&#xff0c;但第三方库GetX却以"全家桶"式的解决方案不断吸引开发者的目光。作为…...

QMCFLAC2MP3终极指南:免费快速解锁QQ音乐格式限制

QMCFLAC2MP3终极指南&#xff1a;免费快速解锁QQ音乐格式限制 【免费下载链接】qmcflac2mp3 直接将qmcflac文件转换成mp3文件&#xff0c;突破QQ音乐的格式限制 项目地址: https://gitcode.com/gh_mirrors/qm/qmcflac2mp3 你是否曾经在QQ音乐下载了心爱的歌曲&#xff0…...