当前位置: 首页 > news >正文

web3与AI结合-Sahara AI 项目介绍

背景介绍

Sahara AI 于 2023 年创立,是一个 "区块链+AI" 领域的项目。其项目愿景是,利用区块链和隐私技术将现有的 AI 商业模式去中心化,打造公平、透明、低门槛的 “协作 AI 经济” 体系,旨在重构新的利益分配机制以及交易、协作市场,在资产化和上链 AI 资源的同时,确保 AI 构建的每个环节都公开透明、可溯源。

目前已完成 A 轮融资,金额为 4300 万,由 Binance、Polychain 等机构领投。项目的核心创始人包括:

  • Sean Ren (CEO):南加州大学计算机系终身副教授,拥有 15 年 AI 领域的研究经验。(技术代表)
  • Tyler Zhou (联合创始人):前 Binance Labs 投资总监。(融资代表)

该项目于 2024 年 12 月 9 日开启第一期小范围测试,白名单人数约 1 万人,开放体验的功能为数据标注与审查。项目的核心技术方案细节和代码尚未公开。

项目概览

Sahara AI 平台的目标是打造一个涵盖整个 AI 生命周期的所有开发需求的一站式市场——从数据收集与标注,到模型训练与服务、AI 代理的创建与部署、多代理通信、AI 资产交易以及 AI 资源的众包。

通过使人工智能开发过程民主化并降低现有系统的进入门槛,Sahara AI 为个人、企业和社区提供平等的机会,共同建设人工智能的未来。

整个 AI 服务搭建的完整流水线流程如下:

首先对原始数据进行标注,然后将标注好的优质数据喂给特定的算法,并在算力的加持下进行训练,最终产出 AI 模型。随后,基于训练好的模型,设计服务于特定目的的 AI 代理(Agent)。

整个过程对标传统商业:

【Scale AI 等公司提供标注好的优质数据(依赖旗下大量廉价劳动力构建的众包网络) → Nvidia、云计算厂商等提供算力 → ChatGPT 等公司提供算法并训练模型】 → 开发者使用 ChatGPT 提供的模型和工具制作自己的 Agent 并提供特定服务 → 普通用户使用 Agent。

在整个 AI 产业链的上游,数据、算力、算法和模型基本上被这些大型商业公司所承包。普通人、小型公司以及社区很难参与其中并获得相应的收益。

Sahara AI 和传统的 AI 公司还有一个显著的区别:传统 AI 公司致力于打造 AI 模型与产品,而 Sahara AI 的目标是打造一个更为纯粹和开放的 AI 协作市场。它提供基础平台,并鼓励大众参与内容的生产(AI 资源和服务)。

任何有能力的人都可以自由地加入到 AI 服务搭建的任意环节中,并贡献自己的力量。同时,每个人的贡献将被公正记录,并参与到后续的收益分配中。

然而,如何整合资源、调配各个环节中不同个体之间的协作,如何界定利益分配的比例,仍然存在不小的技术挑战。从目前测试网的状况来看,Sahara AI 已初步构建了数据标注板块,但更大的挑战在于后续整个流水线和市场的搭建。

单单“数据标注”这一块市场,其份额也是相当可观的,但由于入局门槛较低,如何促成商业合作以及构建技术“护城河”才是关键。可以对标 Scale AI,这家公司是数据标注领域的独角兽,估值达到 138 亿美元,且在 AI 自动/辅助标注工具和数据质量审查方面积累了较强的技术优势。

如果 Sahara AI 能在数据标注领域站稳脚跟,并成功构建市场,那么其后续的长远布局或许就能建立一个稳固的基础。

发展现状

测试网 - 仅开放数据标注功能

Sahara AI 于12月9日开启了测试网。由于完整落地的技术挑战较大,目前的测试功能仅开放数据标注。参与需要申请白名单,第一批参与者大约有1万人。为了帮助参与者更好地了解平台操作,官方提供了详细的交互操作教材和视频教学:Sahara Labs 数据服务。

为了确保数据标注的质量,Sahara AI 设计了双重审核机制,将参与者分为“标注者”和“审核者”两类:

  • 标注者:根据任务要求进行数据标注。
  • 审核者:负责审核标注者提交的任务,确保标注质量。

此外,为了进一步保障数据质量,Sahara AI 设立了惩罚机制,低评分的标注者会被封禁,从而确保平台的标注工作维持高标准。参与者可以通过完成标注和审核任务获得积分和经验,进而参与空投转化和声誉提升。

与行业领先的 Scale AI 相比,Sahara AI 在工具和配套设施的完善度上还有较大差距。Scale AI 提供了成熟的工具帮助标注者完成数据标注,但目前 Sahara AI 缺乏这些工具,且测试中标注任务的难度较高,这可能会影响参与者的热情。

其它项目 - 数据标注领域

web3数据标注项目 - Sapien AI,Human Protocol

Sahara AI 数据标注部分的设计,本质上就是依赖区块链构建了一个去中心化的劳动力众包平台。

  • Human Protocol:该项目在 2018 年便尝试通过区块链技术构建去中心化的劳动力众包平台。囿于当时的市场环境(AI 大模型还未火爆),项目主要专注于预言机领域,但也涵盖了数据标注。
  • Sapien AI:与 Sahara AI 不同,Sapien AI 专注于数据标注领域,目的是打造数据标注领域的 “全球化 Uber” 并为市场提供更加多元化的标注数据。目前已融资近1500万美元。

传统数据标注公司 - Scale AI

数据标注领域,Scale AI 是目前传统公司里面的独角兽,也是大模型时代最大的受益者之一。

数据标注领域的市场竞争,无非就是争抢市场的上下游(数据需求方 和 标注劳动力)。

  • 对于上游,在意的无非就是数据的质量和价格。
  • 而下游,在意的无非就是标注工作的强度和收益。

除了 toB 销售以外,如何管理和辅助下游劳动力群体,也是中介平台的核心工作内容之一。因为这决定了能否为上游提供低价、优质的数据。

通过在线标注的模式,Scale AI 的众包劳动力主要来自东南亚等低收入地区,这对于降低标注成本有很大的裨益。

而同时,为了提高标注数据的质量和标注的效率,Scale AI 提供了很多成熟的管理和辅助标注工作开展的工具,例如:

  • Scale Rapid: ML 团队快速开发生产质量的训练数据的标注平台。它允许用户上传数据、设置标注说明,并在几小时内获得初步标签的反馈和校准,以便快速扩展数据标注过程以处理更大的数据量。Scale AI 提供了标注数据所需的标注员工。
  • Scale Studio:是用于管理公司标注项目和员工的平台。该产品提供了一个工具,用于跟踪和可视化标注员工的指标,并提供 ML 辅助标注工具以加速标注。它跟踪吞吐量、效率和准确性等指标。
  • Nucleus:允许进行数据探索、调试错误标签、比较不同版本 ML 模型的准确度指标,并找出失败案例,从而更好地管理和评估数据。

除了 Scale AI,标注市场上还有 Amazon Mechanical Turk、Labelbox、Appen 和 Hive 等。本质上开展标注业务的门槛很低,而 Scale AI 的主要竞争优势也是来自于其内部机器学习标注算法,使整个人工标注更加自动化和便宜,从而实现规模经济效益。随着时间的发展,Scale AI 掌握的大量标注数据优势会持续累积,在自动标注领域的优势也会不断扩大。

在这一方面上,Sahara AI 目前主要还是处于纯人力标注和审核的阶段,可以提升的空间还很大。

Sahara 能否维持住生态参与者的热情的同时,保证数据标注的质量很关键。毕竟,目前区块链领域的早期参与者对于收益的需求比较强烈,和传统的低收入地区的人群有一定的区别。虽然利用区块链技术,一定程度上去掉了劳动力市场和数据需求方之间的中介平台,但能否长期产出优质低价的数据还有待观望。

不过 Sahara AI 的独特之处在于其愿景——构建一个开放的 AI 协作市场,而不仅仅是一家数据标注公司。Sahara AI 并不单纯与 Scale AI 竞争,而是通过去中心化的方式重新定义 AI 生态系统的合作模式。如果能够成功实现这一愿景,传统的数据标注公司,如 Scale AI,或许可能成为 Sahara AI 生态的一部分。

相关文章:

web3与AI结合-Sahara AI 项目介绍

背景介绍 Sahara AI 于 2023 年创立,是一个 "区块链AI" 领域的项目。其项目愿景是,利用区块链和隐私技术将现有的 AI 商业模式去中心化,打造公平、透明、低门槛的 “协作 AI 经济” 体系,旨在重构新的利益分配机制以及…...

Nginx——反向代理(三/五)

目录 1.Nginx 反向代理1.1.Nginx 反向代理概述1.2.Nginx 反向代理的配置语法1.2.1.proxy_pass1.2.2.proxy_set_header1.2.3.proxy_redirect 1.3.Nginx 反向代理实战1.4.Nginx 的安全控制1.4.1.如何使用 SSL 对流量进行加密1.4.2.Nginx 添加 SSL 的支持1.4.3.Nginx 的 SSL 相关指…...

环动科技平均售价波动下滑:大客户依赖明显,应收账款周转率骤降

《港湾商业观察》施子夫 2024年12月18日,浙江环动机器人关节科技股份有限公司(以下简称,环动科技)的上市审核状态变更为“已问询”,公司在11月25日科创板IPO获上交所受理,独家保荐机构为广发证券。 此次环…...

源网荷储:构建智慧能源生态的关键方案设计

一、技术融合基石 多元能源采集技术:在 “源” 端,除了常见的光伏、风电、火电,生物质能发电、地热能利用技术也应纳入考量。例如在有丰富生物质原料的农村地区,小型生物质发电厂可实现废物利用与供电双赢;地热资源丰…...

进程间通讯

简介: 进程间通讯方式有: 1.内存映射(mmap): 使用mmap函数将磁盘空间映射到内存 2.管道 3.信号 4.套接字(socket) 5.信号机制 通过进程中kill函数,去给另一个函数发送信号&a…...

STM32-笔记33-OLED实验

实验目的 驱动 OLED 屏幕,显示点、线、字符、字符串、汉字、图片等内容。 项目实现-OLED通讯协议 复制项目文件19-串口打印功能 重命名为47-OLED实验 打开项目文件 加载文件 代码书写顺序: oled.c #include "oled.h"//初始化oled的gpio …...

低空管控技术-无人机云监视技术详解!

一、无人机监听技术的原理 无人机监听技术主要依赖于射频(RF)探测、光学和红外传感器等技术手段。这些技术通过被动监听和监测无人机与飞行员(或控制器)之间的通信链路传输,以确定无人机的位置,甚至在某些…...

RedisTemplate执行lua脚本及Lua 脚本语言详解

使用RedisTemplate执行lua脚本 在开发中,我们经常需要与Redis数据库进行交互,而Redis是一个基于内存的高性能键值存储数据库,它支持多种数据结构,并提供了丰富的命令接口。在某些情况下,我们可能需要执行一些复杂的逻…...

基于springboot的网上商城购物系统

作者:学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等 文末获取“源码数据库万字文档PPT”,支持远程部署调试、运行安装。 目录 项目包含: 开发说明: 系统功能: 项目截图…...

服务器攻击方式有哪几种?

随着互联网的快速发展,网络攻击事件频发,已泛滥成互联网行业的重病,受到了各个行业的关注与重视,因为它对网络安全乃至国家安全都形成了严重的威胁。面对复杂多样的网络攻击,想要有效防御就必须了解网络攻击的相关内容…...

【Unity3D】AB包加密(AssetBundle加密)

加密前: 加密后,直接无法加载ab,所以无法正常看到ab内容。 using UnityEngine; using UnityEditor; using System.IO; public static class AssetBundleDemoTest {[MenuItem("Tools/打包!")]public static void Build(){//注意:St…...

【FTP 协议】FTP主动模式

一、测试工具 服务器:FileZilla_Server-cn-0_9_60_2.exe 中文版本 客户端:FileZilla_3.66.5_win64 客户端IP: 192.168.9.186 服务端 IP: 192.168.9.161 在客户端请求PORT之前,抓包测试的结果跟被动模式流程相同。 二、客户端主动模式命令…...

十五、Vue 响应接口

文章目录 一、响应式系统基础什么是响应式系统响应式数据的声明与使用二、响应式原理深入Object.defineProperty () 方法的应用(Vue2)Proxy 对象的应用(Vue3)三、响应式接口之 ref 和 reactive(Vue3)ref 函数的使用reactive 函数的使用四、计算属性(computed)作为响应式…...

至强6搭配美光CZ122,证明CXL可以提高生成式AI的性能表现

最近发现了英特尔官网公布的一项最新测试报告,报告显示,将美光的CZ122 CXL内存模块放到英特尔至强6平台上,显著提升了HPC和AI工作负载的内存带宽,特别是在采用基于软件的交错配置(interleave configuration&#xff09…...

一文理解ssh,ssl协议以及应用

在使用基于密钥的认证方式的时候,私钥的位置一定要符合远程服务器规定的位置,否则找不到私钥的位置会导致建立ssh连接失败 SSH 全称是 “Secure Shell”,即安全外壳协议。 它是一种网络协议,用于在不安全的网络中安全地进行远程登…...

电子应用设计方案87:智能AI收纳箱系统设计

智能 AI 收纳箱系统设计 一、引言 智能 AI 收纳箱系统旨在为用户提供更高效、便捷和智能的物品收纳与管理解决方案,通过融合人工智能技术和创新设计,提升用户的生活品质和物品整理效率。 二、系统概述 1. 系统目标 - 实现物品的自动分类和整理&#xf…...

BloombergGPT: A Large Language Model for Finance——面向金融领域的大语言模型

这篇文章介绍了BloombergGPT,一个专门为金融领域设计的大语言模型(LLM)。以下是文章的主要内容总结: 背景与动机: 大语言模型(如GPT-3)在多个任务上表现出色,但尚未有针对金融领域的…...

LeetCode - #180 Swift 实现连续数字查询

文章目录 摘要描述SQL 解法Swift 题解代码Swift 题解代码分析核心逻辑关键函数 示例测试及结果测试 1测试 2 时间复杂度空间复杂度总结 摘要 本文将解决如何从日志数据中找出连续出现至少三次的数字。通过 SQL 查询语句结合 Swift 数据库操作,我们将完成这一任务。…...

为什么ip属地一会河南一会江苏

在使用互联网的过程中,许多用户可能会遇到这样一个问题:自己的IP属地一会儿显示为河南,一会儿又变成了江苏。这种现象可能会让人感到困惑,甚至产生疑虑,担心自己的网络活动是否受到了某种影响。为了解答这一疑问&#…...

使用最广泛的FastAPI项目结构推荐,命名规范等

使用最广泛的FastAPI项目结构推荐,命名规范等 一、FastAPI项目结构如下:二、组件管理:使用依赖注入三、命名约定四、建议分层架构的设计五、文档和测试六、版本控制和持续集成七、环境和配置管理工具八、性能优化与权限安全 一、FastAPI项目结…...

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...

<6>-MySQL表的增删查改

目录 一,create(创建表) 二,retrieve(查询表) 1,select列 2,where条件 三,update(更新表) 四,delete(删除表&#xf…...

Qt Widget类解析与代码注释

#include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this); }Widget::~Widget() {delete ui; }//解释这串代码,写上注释 当然可以!这段代码是 Qt …...

1.3 VSCode安装与环境配置

进入网址Visual Studio Code - Code Editing. Redefined下载.deb文件,然后打开终端,进入下载文件夹,键入命令 sudo dpkg -i code_1.100.3-1748872405_amd64.deb 在终端键入命令code即启动vscode 需要安装插件列表 1.Chinese简化 2.ros …...

python爬虫:Newspaper3k 的详细使用(好用的新闻网站文章抓取和解析的Python库)

更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 一、Newspaper3k 概述1.1 Newspaper3k 介绍1.2 主要功能1.3 典型应用场景1.4 安装二、基本用法2.2 提取单篇文章的内容2.2 处理多篇文档三、高级选项3.1 自定义配置3.2 分析文章情感四、实战案例4.1 构建新闻摘要聚合器…...

QT: `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中,将 long long 类型转换为 QString 可以通过以下两种常用方法实现: 方法 1:使用 QString::number() 直接调用 QString 的静态方法 number(),将数值转换为字符串: long long value 1234567890123456789LL; …...

Swagger和OpenApi的前世今生

Swagger与OpenAPI的关系演进是API标准化进程中的重要篇章,二者共同塑造了现代RESTful API的开发范式。 本期就扒一扒其技术演进的关键节点与核心逻辑: 🔄 一、起源与初创期:Swagger的诞生(2010-2014) 核心…...

稳定币的深度剖析与展望

一、引言 在当今数字化浪潮席卷全球的时代,加密货币作为一种新兴的金融现象,正以前所未有的速度改变着我们对传统货币和金融体系的认知。然而,加密货币市场的高度波动性却成为了其广泛应用和普及的一大障碍。在这样的背景下,稳定…...

使用 SymPy 进行向量和矩阵的高级操作

在科学计算和工程领域,向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能,能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作,并通过具体…...

SAP学习笔记 - 开发26 - 前端Fiori开发 OData V2 和 V4 的差异 (Deepseek整理)

上一章用到了V2 的概念,其实 Fiori当中还有 V4,咱们这一章来总结一下 V2 和 V4。 SAP学习笔记 - 开发25 - 前端Fiori开发 Remote OData Service(使用远端Odata服务),代理中间件(ui5-middleware-simpleproxy)-CSDN博客…...