史上最强大的 S3 API?介绍 Prompt API。

迄今为止,对象存储世界已由 PUT 和 GET 的 S3 API 概念定义。然而,我们现在生活的世界需要更多。鉴于 MinIO 的 S3 部署甚至比 Amazon 还多,因此我们不得不提出下一个出色的 S3 API。
这个新 API 就是 Prompt API,它很可能成为有史以来最强大的 S3 API 扩展。它将 PUT 和 GET 范例更改为 PUT 和 PROMPT 范例,以及用户和应用程序与数据交互的方式。它在新的 AIStor 中可用。在最基本的层面上,MinIO promptObject API 允许用户或应用程序与非结构化对象通信,就像他们正在与 LLM一样。这意味着您可以要求一个对象描述自身,以查找与其他对象的相似之处,并查找与其他对象的差异。这将导致可以直接与 MinIO 上的数据对话的应用程序激增。更重要的是,promptObject API 对用户/应用程序实际上是透明的。不需要事先了解 RAG 模型、矢量数据库或其他 AI 概念。promptObject API 开箱即用,适用于多代理架构,其中内置了编排功能,可与小规模的域 AI 特定模型配合使用。这遵循了 MinIO 关于简单性的核心口号。对于组织来说,让基本的 AI 工作应该不复杂或昂贵 - 您只需要能够将 promptObject API 指向您的数据。promptObject API 以 API 的形式提供其功能。它不是一个独立的应用程序,也不是我们控制台的扩展(尽管控制台中提供了它的用户界面),而是我们 SDK 的扩展(我们支持所有主要的编程语言)。简而言之,promptObject 可以丰富现有应用程序或构建新应用程序。让我们先演示一下 promptObject API 的工作原理,然后再介绍支撑它的细节。
类似 Expensify 的应用程序的构成
promptObject API 适用于任何非结构化对象。图像就是这样一种非结构化对象,费用收据就是一个很好的例子。这里有一个:

有两种方法可以 “talk” 这个对象。一种是使用 promptObject 框直接通过控制台,另一种是通过开发人员的 Jupyter Notebook。我们将从 Jupyter Notebook 开始,因为它显示了我们正在处理的图像,并将为读者提供更多的上下文。下面是 Notebook 的示例。我们在 Notebooks 中浏览来自 AIStor 的对象,并使用 prompt_object 与对象通信

控制台中提供了相同的功能。如果需要,对象浏览器用于手动验证图像。在这里,我们询问对象有多少人来吃晚饭。

无论哪种情况,用户几乎可以询问有关收据的任何问题。平均支票大小是多少,在哪个城市,顶部的图像是什么,最贵的菜是什么?MinIO 在后端运行多模态 LLM) 并处理所有事情。它对 IT 用户或应用程序开发人员是完全透明的(但自然对数据科学团队开放以供检查)。这确实需要 GPU,但团队可以从一个 GPU 开始。还支持一次查询多个对象。在这种情况下,用户识别了三个收据,并要求 promptObject API 查找两个差异和两个相似之处。

从用户和应用程序的角度来看,可能性实际上是无穷无尽的。一个简单但非常强大的示例是向对象附加标签的概念。通常,对象进入 AIStor 时几乎没有描述性标签。它们由计算机或音频或视频生成。使用 promptObject API 和一些代码,应用程序可以要求每个新对象描述自身、总结自身、提供有关自身的特定数据。然后,它可以将该信息附加到对象本身 - 从而使搜索效果更好(请参阅目录功能)或其他应用程序更有效。在下面的 GIF 中,您将看到用户为多个对象添加了新标签。这些标签会自动检测内容是否具有个人身份信息、是否受 GDPR 约束,或者是否具有将其限制为仅供内部使用的敏感度级别。这可以与 Catalog 结合使用,以搜索特定标记及其相应值的对象。

请记住,元数据规则在此处仍然适用。第三方元数据数据库无法扩展。您需要采用元数据对对象是原子的架构(例如 AIStor)。尽管如此,更多的元数据/标签是一件好事,并且在数据到达时拥有 AI 标签数据完全改变了游戏规则。
改变业务的游戏规则
这样做的商业利益应该是显而易见的。数据是组织的核心价值。非结构化数据占企业中所有数据的 90% 以上。更多地了解这些数据并能够轻松地与非结构化数据交互 - 而无需具备 RAG 或矢量数据库技能,这非常重要。应用程序开发人员可以开发业务需要的任何内容。数据像往常一样存储在 MinIO 中。业务团队提出了一个概念,他们可以自己在 Console 中测试它,或者向应用程序团队描述它。应用程序团队可以构建一些东西 - 可能在几个小时内。AI 的目标是从数据中提取更多商业价值。以下是由 promptObject 提供支持的企业的一些好处:
1 . 将数据转化为业务洞察的直接资源。无需专业技能。
传统上,企业存储大量非结构化数据,但从中挖掘可操作的见解需要专门的数据团队、昂贵的分析工具和复杂的 ETL(提取、转换、加载)流程。promptObject API 可以消除许多这些瓶颈,使企业内的任何人都可以直接自然地查询数据。这有效地将数据存储转变为主动资源,而不是被动存档。企业可以直接询问有关其数据的问题并获得有价值的回复,无论是关于客户行为、合规性还是运营洞察,而无需单独的数据管道或专家干预。此功能可加快决策速度,并支持跨部门采取主动的数据驱动型行动。
2 . 降低 AI 技能门槛,让 AI 在整个组织中都可以使用
通过抽象出复杂的 AI 概念(例如,检索增强生成、矢量数据库),promptObject 使非技术团队能够利用 AI 驱动的见解。例如,合规官可以验证文档合规性,客户服务可以分析交互历史记录,营销团队可以直接从存储中评估营销活动绩效。AI 的这种民主化大大减少了对专业数据科学团队的依赖,使 AI 工具更容易被业务用户使用和访问。企业可以跨部门进行自助数据分析,这不仅可以提高生产力,还可以让团队在数据方面更具创新性。这对于可能难以招聘或留住 AI 人才的企业尤其有价值,尤其是在技术以外的行业。
3 . 降低与数据分析相关的基础设施和运营成本
大多数从事 AI 驱动型数据分析的企业都需要额外的基础设施,例如数据仓库或单独的 AI 处理平台。通过将 AI 驱动的查询直接嵌入到存储中,企业可以潜在地消除或减少对其他数据处理层的依赖,从而简化基础设施并降低运营开销。这将大大节省基础设施和/或云费用的成本。企业不需要专用的 AI 平台或第三方分析解决方案,而是可以利用 promptObject 进行原位分析,从而简化其数据架构并将成本整合到一个多功能存储平台上。
4 . 加快获得洞察的时间,实现实时运营敏捷性
传统的数据处理工作流程涉及许多步骤,从数据检索和清理到分析。promptObject API 允许企业通过直接与存储格式的数据交互来绕过这些步骤。这对于实时或近乎实时的洞察特别有价值,因为与传统数据处理相关的滞后太慢。更快地访问洞察意味着企业可以在数据最相关的时候对数据采取行动,这对于时间敏感型应用程序至关重要。例如,制造商可以监控设备数据以进行预测性维护,金融公司可以更快地检测欺诈行为,零售商可以实时调整定价策略。这种实时敏捷性提高了跨行业的竞争力和响应能力。
5 . 增强合规性和治理能力
随着监管要求的不断提高,许多企业都在努力保持对其非结构化数据的控制和可见性。promptObject API 直接查询数据的能力使合规官能够更有效地识别敏感信息、验证文档完整性或审计数据使用情况。API 使合规性和治理团队能够更好地管理监管风险,而无需大量的数据工作流。他们可以直接在存储中执行按需审计或合规性检查,从而大大改进数据治理实践并降低不合规风险。
6 . 通过降低实验成本来促进创新
数据驱动的实验(例如测试新产品或探索客户洞察)通常会产生与数据提取、模型训练和基础设施相关的成本。promptObject API 使实验更易于访问,使团队能够以最少的准备工作查询数据,并且不需要复杂的模型。通过降低成本和数据实验的障碍,企业可以通过鼓励团队自由探索数据洞察来培养创新文化。这可能会带来更快的原型设计、更好的客户理解以及从以前未开发的数据中得出的创新解决方案。
下一步
今天,promptObject 适用于任何非结构化对象。这包括图像、PDF、GIF 等。较长的视频仍需要一些优化。我们还需要添加对音频的支持。
期待
我们通常不是那种夸大其词的人。我们通常以产品为主导,让它来说话。随着时间的推移,它对我们来说效果很好。话虽如此,这个功能感觉很特别。在撰写这篇博文期间,我们扩展了它的功能,并提出了 API 的多个新应用程序。你用它做的越多,你对新事物的思考就越多。我们怀疑这就是 OpenAI 的团队在第一次了解他们正在处理的问题时的感受。显然,这些在量级方面差异很大,但对于存储类型,它们将立即掌握 Prompt 范式的量级。我们总是很高兴看到人们如何推动 MinIO,但我们对此功能感到特别兴奋。
相关文章:
史上最强大的 S3 API?介绍 Prompt API。
迄今为止,对象存储世界已由 PUT 和 GET 的 S3 API 概念定义。然而,我们现在生活的世界需要更多。鉴于 MinIO 的 S3 部署甚至比 Amazon 还多,因此我们不得不提出下一个出色的 S3 API。 这个新 API 就是 Prompt API,它很可能成为有…...
单片机设计智能翻译手势识别系统
目录 前言 一、本设计主要实现哪些很“开门”功能? 二、电路设计原理图 电路图采用Altium Designer进行设计: 三、实物设计图 四、程序源代码设计 五、获取资料内容 前言 在全球化的浪潮下,语言的多样性也为人们的交流带来了不小的挑战…...
「Mac玩转仓颉内测版12」PTA刷题篇3 - L1-003 个位数统计
本篇将继续讲解PTA平台上的题目 L1-003 个位数统计,通过对数字的处理与统计,掌握基础的字符串操作与数组计数功能,进一步提升Cangjie编程语言的实际应用能力。 关键词 PTA刷题数字统计数组操作字符串处理编程技巧 一、L1-003 个位数统计 题…...
飞书文档只读限制复制
飞书文档只读限制复制 场景描述解决方式插件安装测试 场景描述 当使用飞书时,可能会存在无对方文档编辑/管理权限,对方只给自己开放只读权限的时候,此时如果文档较重要,需要本地保存一份,但是又无法复制文档或直接屏蔽…...
【WPF】Prism学习(二)
Prism Commands 1.命令(Commanding) 1.1. ViewModel的作用: ViewModel不仅提供在视图中显示或编辑的数据,还可能定义一个或多个用户可以执行的动作或操作。这些用户可以通过用户界面(UI)执行的动作或操作…...
【鸿蒙开发】第二十一章 Location位置服务
目录 1 简介 1.1 Location Kit简介 1.2 运作机制 1.3 约束与限制 2 位置服务开发 2.1 申请位置权限开发指导 2.1.1 场景概述 2.2 获取设备的位置信息开发指导 2.2.1 场景概述 2.2.2 接口说明 2.2.3 开发步骤 2.3(逆)地理编码转化开发指导 2.…...
《目标检测》R-CNN网络基础(RCNN,Fast-RCNN)
文章目录 1.Overfeat模型2.RCNN网络2.1 算法流程2.1.1 候选区域的生成(了解,已经不再使用了)2.1.2 CNN网络提取特征2.1.3 目标分类(SVM)2.1.4 目标回归(线性回归修正坐标)2.1.5 预测过程 2.2 算…...
iOS中的定位实现(逆地理编码)及Info.plist位置权限详解
引言 在现代移动应用开发中,位置服务已经成为不可或缺的一部分。无论是地图导航、社交分享,还是基于位置的个性化推荐,位置数据都为用户提供了更加丰富和智能的体验。然而,随着用户隐私保护的不断加强,iOS对位置权限的…...
【从零开始的LeetCode-算法】3270. 求出数字答案
给你三个 正 整数 num1 ,num2 和 num3 。 数字 num1 ,num2 和 num3 的数字答案 key 是一个四位数,定义如下: 一开始,如果有数字 少于 四位数,给它补 前导 0 。答案 key 的第 i 个数位(1 < …...
Web认证机制 Cookie、Token、Session、JWT、OAuth2 解析
标题 一、Cookie二、Session三、Token四、JWTSSO(单点登录) 五、OAuth2如何设计权限系统区别总结 Cookie、Token、Session 和 JWT 都是在 Web 开发中常用的身份验证和授权技术,它们各有优缺点,适用于不同的场景。 Cookie 简单易用…...
Docker 基础命令介绍和常见报错解决
介绍一些 docker 可能用到的基础命令,并解决三个常见报错: 权限被拒绝(Permission Denied)无法连接到 Docker 仓库(Timeout Exceeded)磁盘空间不足(No Space Left on Device) 命令以…...
如何轻松导出所有 WordPress URL 为纯文本格式
作为一名多年的 WordPress 使用者,我深知管理一个网站的复杂性。从迁移网站、设置重定向到整理内容结构,每一步都需要精细处理。而拥有所有 URL 的清单,不仅能让这些工作变得更加简单,还能为后续的管理提供极大的便利。其实&#…...
【进程概念精讲】
Susan,在那命运月台前面,再上车,春天开始落叶.................................................................. 文章目录 前言 一、【认识进程】 1、【进程基本概念引入】 2、【进程的描述与组织——进程控制块(PCB)与进程…...
帽子矩阵--记录
帽子矩阵 H是一个重要的统计工具,用于评估数据点对模型拟合结果的影响。通过计算帽子矩阵的对角线元素(杠杆值),我们可以识别出高杠杆点,这些点对模型的影响较大,可能需要特别关注。...
MySQL深入:B+树的演化、索引和索引结构
提示:内容是读《MySQL技术内幕:InnoDB存储引擎》,笔记摘要 文章目录 二叉查找树平衡二叉树(AVL) B树(BTree)B树(BTree)InnoDB B树索引索引结构(InnoDB B树)B树存放的数据量 二叉查找树 在二叉查找树中,左子…...
axios 实现 无感刷新方案
实现思路 首次登录前端通过接口获取到两个 token;分别是 accessToken、refreshToken; accessToken:正常请求需要传递的 token ;refreshToken:当某个请求 401 ,就可以通过 refreshToken 获取到新的 accessToken 特殊场…...
Python 三种方式实现自动化任务
在这篇文章中,我们将介绍一些用Python实现机器人过程自动化的包。机器人流程自动化(Robotic process automation,简称RPA)是指将鼠标点击和键盘按压自动化的过程,即模拟人类用户的操作。RPA用于各种应用程序࿰…...
新型创业模式:退休创业。没有工资,不用投资,有时间就干,不强制做,赚钱按贡献分。
这种“退休创业”的创业模式具有独特的吸引力和灵活性,适合那些已退休但希望继续贡献社会价值、赚取额外收入且无需承担太多责任的群体。以下是一个详细的设计思路: 模式概述 目标人群:退休人员,具有一定技能或经验,但…...
Android 项目依赖库无法找到的解决方案
目录 错误信息解析 解决方案 1. 检查依赖版本 2. 检查 Maven 仓库配置 3. 强制刷新 Gradle 缓存 4. 检查网络连接 5. 手动下载依赖 总结 相关推荐 最近,我在编译一个 Android 老项目时遇到了一个问题,错误信息显示无法找到 com.gyf.immersionba…...
在Node.js中如何使用TypeScript
第一步:创建一个Node.js项目的package.json文件 npm init -y第二步:添加TypeScript、添加node.d.ts npm install typescript -D npm install types/node -D第三步:初始化一个tsconfig.json文件 npx tsc --init --rootDir src --outDir lib…...
利用最小二乘法找圆心和半径
#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …...
HTML 列表、表格、表单
1 列表标签 作用:布局内容排列整齐的区域 列表分类:无序列表、有序列表、定义列表。 例如: 1.1 无序列表 标签:ul 嵌套 li,ul是无序列表,li是列表条目。 注意事项: ul 标签里面只能包裹 li…...
Spring AI 入门:Java 开发者的生成式 AI 实践之路
一、Spring AI 简介 在人工智能技术快速迭代的今天,Spring AI 作为 Spring 生态系统的新生力量,正在成为 Java 开发者拥抱生成式 AI 的最佳选择。该框架通过模块化设计实现了与主流 AI 服务(如 OpenAI、Anthropic)的无缝对接&…...
【JavaSE】绘图与事件入门学习笔记
-Java绘图坐标体系 坐标体系-介绍 坐标原点位于左上角,以像素为单位。 在Java坐标系中,第一个是x坐标,表示当前位置为水平方向,距离坐标原点x个像素;第二个是y坐标,表示当前位置为垂直方向,距离坐标原点y个像素。 坐标体系-像素 …...
【开发技术】.Net使用FFmpeg视频特定帧上绘制内容
目录 一、目的 二、解决方案 2.1 什么是FFmpeg 2.2 FFmpeg主要功能 2.3 使用Xabe.FFmpeg调用FFmpeg功能 2.4 使用 FFmpeg 的 drawbox 滤镜来绘制 ROI 三、总结 一、目的 当前市场上有很多目标检测智能识别的相关算法,当前调用一个医疗行业的AI识别算法后返回…...
(一)单例模式
一、前言 单例模式属于六大创建型模式,即在软件设计过程中,主要关注创建对象的结果,并不关心创建对象的过程及细节。创建型设计模式将类对象的实例化过程进行抽象化接口设计,从而隐藏了类对象的实例是如何被创建的,封装了软件系统使用的具体对象类型。 六大创建型模式包括…...
如何应对敏捷转型中的团队阻力
应对敏捷转型中的团队阻力需要明确沟通敏捷转型目的、提升团队参与感、提供充分的培训与支持、逐步推进敏捷实践、建立清晰的奖励和反馈机制。其中,明确沟通敏捷转型目的尤为关键,团队成员只有清晰理解转型背后的原因和利益,才能降低对变化的…...
DAY 26 函数专题1
函数定义与参数知识点回顾:1. 函数的定义2. 变量作用域:局部变量和全局变量3. 函数的参数类型:位置参数、默认参数、不定参数4. 传递参数的手段:关键词参数5 题目1:计算圆的面积 任务: 编写一…...
数据库正常,但后端收不到数据原因及解决
从代码和日志来看,后端SQL查询确实返回了数据,但最终user对象却为null。这表明查询结果没有正确映射到User对象上。 在前后端分离,并且ai辅助开发的时候,很容易出现前后端变量名不一致情况,还不报错,只是单…...
高抗扰度汽车光耦合器的特性
晶台光电推出的125℃光耦合器系列产品(包括KL357NU、KL3H7U和KL817U),专为高温环境下的汽车应用设计,具备以下核心优势和技术特点: 一、技术特性分析 高温稳定性 采用先进的LED技术和优化的IC设计,确保在…...
