web3与AI结合-Sahara AI 项目介绍
背景介绍
Sahara AI 于 2023 年创立,是一个 "区块链+AI" 领域的项目。其项目愿景是,利用区块链和隐私技术将现有的 AI 商业模式去中心化,打造公平、透明、低门槛的 “协作 AI 经济” 体系,旨在重构新的利益分配机制以及交易、协作市场,在资产化和上链 AI 资源的同时,确保 AI 构建的每个环节都公开透明、可溯源。
目前已完成 A 轮融资,金额为 4300 万,由 Binance、Polychain 等机构领投。项目的核心创始人包括:
- Sean Ren (CEO):南加州大学计算机系终身副教授,拥有 15 年 AI 领域的研究经验。(技术代表)
- Tyler Zhou (联合创始人):前 Binance Labs 投资总监。(融资代表)
该项目于 2024 年 12 月 9 日开启第一期小范围测试,白名单人数约 1 万人,开放体验的功能为数据标注与审查。项目的核心技术方案细节和代码尚未公开。
项目概览
Sahara AI 平台的目标是打造一个涵盖整个 AI 生命周期的所有开发需求的一站式市场——从数据收集与标注,到模型训练与服务、AI 代理的创建与部署、多代理通信、AI 资产交易以及 AI 资源的众包。
通过使人工智能开发过程民主化并降低现有系统的进入门槛,Sahara AI 为个人、企业和社区提供平等的机会,共同建设人工智能的未来。
![]() |
整个 AI 服务搭建的完整流水线流程如下: 首先对原始数据进行标注,然后将标注好的优质数据喂给特定的算法,并在算力的加持下进行训练,最终产出 AI 模型。随后,基于训练好的模型,设计服务于特定目的的 AI 代理(Agent)。 整个过程对标传统商业: 【Scale AI 等公司提供标注好的优质数据(依赖旗下大量廉价劳动力构建的众包网络) → Nvidia、云计算厂商等提供算力 → ChatGPT 等公司提供算法并训练模型】 → 开发者使用 ChatGPT 提供的模型和工具制作自己的 Agent 并提供特定服务 → 普通用户使用 Agent。 在整个 AI 产业链的上游,数据、算力、算法和模型基本上被这些大型商业公司所承包。普通人、小型公司以及社区很难参与其中并获得相应的收益。 |
Sahara AI 和传统的 AI 公司还有一个显著的区别:传统 AI 公司致力于打造 AI 模型与产品,而 Sahara AI 的目标是打造一个更为纯粹和开放的 AI 协作市场。它提供基础平台,并鼓励大众参与内容的生产(AI 资源和服务)。
任何有能力的人都可以自由地加入到 AI 服务搭建的任意环节中,并贡献自己的力量。同时,每个人的贡献将被公正记录,并参与到后续的收益分配中。
然而,如何整合资源、调配各个环节中不同个体之间的协作,如何界定利益分配的比例,仍然存在不小的技术挑战。从目前测试网的状况来看,Sahara AI 已初步构建了数据标注板块,但更大的挑战在于后续整个流水线和市场的搭建。
单单“数据标注”这一块市场,其份额也是相当可观的,但由于入局门槛较低,如何促成商业合作以及构建技术“护城河”才是关键。可以对标 Scale AI,这家公司是数据标注领域的独角兽,估值达到 138 亿美元,且在 AI 自动/辅助标注工具和数据质量审查方面积累了较强的技术优势。
如果 Sahara AI 能在数据标注领域站稳脚跟,并成功构建市场,那么其后续的长远布局或许就能建立一个稳固的基础。
发展现状
测试网 - 仅开放数据标注功能
Sahara AI 于12月9日开启了测试网。由于完整落地的技术挑战较大,目前的测试功能仅开放数据标注。参与需要申请白名单,第一批参与者大约有1万人。为了帮助参与者更好地了解平台操作,官方提供了详细的交互操作教材和视频教学:Sahara Labs 数据服务。
为了确保数据标注的质量,Sahara AI 设计了双重审核机制,将参与者分为“标注者”和“审核者”两类:
- 标注者:根据任务要求进行数据标注。
- 审核者:负责审核标注者提交的任务,确保标注质量。
此外,为了进一步保障数据质量,Sahara AI 设立了惩罚机制,低评分的标注者会被封禁,从而确保平台的标注工作维持高标准。参与者可以通过完成标注和审核任务获得积分和经验,进而参与空投转化和声誉提升。
与行业领先的 Scale AI 相比,Sahara AI 在工具和配套设施的完善度上还有较大差距。Scale AI 提供了成熟的工具帮助标注者完成数据标注,但目前 Sahara AI 缺乏这些工具,且测试中标注任务的难度较高,这可能会影响参与者的热情。
其它项目 - 数据标注领域
web3数据标注项目 - Sapien AI,Human Protocol
Sahara AI 数据标注部分的设计,本质上就是依赖区块链构建了一个去中心化的劳动力众包平台。
- Human Protocol:该项目在 2018 年便尝试通过区块链技术构建去中心化的劳动力众包平台。囿于当时的市场环境(AI 大模型还未火爆),项目主要专注于预言机领域,但也涵盖了数据标注。
- Sapien AI:与 Sahara AI 不同,Sapien AI 专注于数据标注领域,目的是打造数据标注领域的 “全球化 Uber” 并为市场提供更加多元化的标注数据。目前已融资近1500万美元。
传统数据标注公司 - Scale AI
数据标注领域,Scale AI 是目前传统公司里面的独角兽,也是大模型时代最大的受益者之一。
数据标注领域的市场竞争,无非就是争抢市场的上下游(数据需求方 和 标注劳动力)。
- 对于上游,在意的无非就是数据的质量和价格。
- 而下游,在意的无非就是标注工作的强度和收益。
除了 toB 销售以外,如何管理和辅助下游劳动力群体,也是中介平台的核心工作内容之一。因为这决定了能否为上游提供低价、优质的数据。
通过在线标注的模式,Scale AI 的众包劳动力主要来自东南亚等低收入地区,这对于降低标注成本有很大的裨益。
而同时,为了提高标注数据的质量和标注的效率,Scale AI 提供了很多成熟的管理和辅助标注工作开展的工具,例如:
- Scale Rapid: ML 团队快速开发生产质量的训练数据的标注平台。它允许用户上传数据、设置标注说明,并在几小时内获得初步标签的反馈和校准,以便快速扩展数据标注过程以处理更大的数据量。Scale AI 提供了标注数据所需的标注员工。
- Scale Studio:是用于管理公司标注项目和员工的平台。该产品提供了一个工具,用于跟踪和可视化标注员工的指标,并提供 ML 辅助标注工具以加速标注。它跟踪吞吐量、效率和准确性等指标。
- Nucleus:允许进行数据探索、调试错误标签、比较不同版本 ML 模型的准确度指标,并找出失败案例,从而更好地管理和评估数据。
除了 Scale AI,标注市场上还有 Amazon Mechanical Turk、Labelbox、Appen 和 Hive 等。本质上开展标注业务的门槛很低,而 Scale AI 的主要竞争优势也是来自于其内部机器学习标注算法,使整个人工标注更加自动化和便宜,从而实现规模经济效益。随着时间的发展,Scale AI 掌握的大量标注数据优势会持续累积,在自动标注领域的优势也会不断扩大。
在这一方面上,Sahara AI 目前主要还是处于纯人力标注和审核的阶段,可以提升的空间还很大。
Sahara 能否维持住生态参与者的热情的同时,保证数据标注的质量很关键。毕竟,目前区块链领域的早期参与者对于收益的需求比较强烈,和传统的低收入地区的人群有一定的区别。虽然利用区块链技术,一定程度上去掉了劳动力市场和数据需求方之间的中介平台,但能否长期产出优质低价的数据还有待观望。
不过 Sahara AI 的独特之处在于其愿景——构建一个开放的 AI 协作市场,而不仅仅是一家数据标注公司。Sahara AI 并不单纯与 Scale AI 竞争,而是通过去中心化的方式重新定义 AI 生态系统的合作模式。如果能够成功实现这一愿景,传统的数据标注公司,如 Scale AI,或许可能成为 Sahara AI 生态的一部分。
相关文章:

web3与AI结合-Sahara AI 项目介绍
背景介绍 Sahara AI 于 2023 年创立,是一个 "区块链AI" 领域的项目。其项目愿景是,利用区块链和隐私技术将现有的 AI 商业模式去中心化,打造公平、透明、低门槛的 “协作 AI 经济” 体系,旨在重构新的利益分配机制以及…...

Nginx——反向代理(三/五)
目录 1.Nginx 反向代理1.1.Nginx 反向代理概述1.2.Nginx 反向代理的配置语法1.2.1.proxy_pass1.2.2.proxy_set_header1.2.3.proxy_redirect 1.3.Nginx 反向代理实战1.4.Nginx 的安全控制1.4.1.如何使用 SSL 对流量进行加密1.4.2.Nginx 添加 SSL 的支持1.4.3.Nginx 的 SSL 相关指…...

环动科技平均售价波动下滑:大客户依赖明显,应收账款周转率骤降
《港湾商业观察》施子夫 2024年12月18日,浙江环动机器人关节科技股份有限公司(以下简称,环动科技)的上市审核状态变更为“已问询”,公司在11月25日科创板IPO获上交所受理,独家保荐机构为广发证券。 此次环…...

源网荷储:构建智慧能源生态的关键方案设计
一、技术融合基石 多元能源采集技术:在 “源” 端,除了常见的光伏、风电、火电,生物质能发电、地热能利用技术也应纳入考量。例如在有丰富生物质原料的农村地区,小型生物质发电厂可实现废物利用与供电双赢;地热资源丰…...

进程间通讯
简介: 进程间通讯方式有: 1.内存映射(mmap): 使用mmap函数将磁盘空间映射到内存 2.管道 3.信号 4.套接字(socket) 5.信号机制 通过进程中kill函数,去给另一个函数发送信号&a…...

STM32-笔记33-OLED实验
实验目的 驱动 OLED 屏幕,显示点、线、字符、字符串、汉字、图片等内容。 项目实现-OLED通讯协议 复制项目文件19-串口打印功能 重命名为47-OLED实验 打开项目文件 加载文件 代码书写顺序: oled.c #include "oled.h"//初始化oled的gpio …...

低空管控技术-无人机云监视技术详解!
一、无人机监听技术的原理 无人机监听技术主要依赖于射频(RF)探测、光学和红外传感器等技术手段。这些技术通过被动监听和监测无人机与飞行员(或控制器)之间的通信链路传输,以确定无人机的位置,甚至在某些…...

RedisTemplate执行lua脚本及Lua 脚本语言详解
使用RedisTemplate执行lua脚本 在开发中,我们经常需要与Redis数据库进行交互,而Redis是一个基于内存的高性能键值存储数据库,它支持多种数据结构,并提供了丰富的命令接口。在某些情况下,我们可能需要执行一些复杂的逻…...

基于springboot的网上商城购物系统
作者:学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等 文末获取“源码数据库万字文档PPT”,支持远程部署调试、运行安装。 目录 项目包含: 开发说明: 系统功能: 项目截图…...

服务器攻击方式有哪几种?
随着互联网的快速发展,网络攻击事件频发,已泛滥成互联网行业的重病,受到了各个行业的关注与重视,因为它对网络安全乃至国家安全都形成了严重的威胁。面对复杂多样的网络攻击,想要有效防御就必须了解网络攻击的相关内容…...

【Unity3D】AB包加密(AssetBundle加密)
加密前: 加密后,直接无法加载ab,所以无法正常看到ab内容。 using UnityEngine; using UnityEditor; using System.IO; public static class AssetBundleDemoTest {[MenuItem("Tools/打包!")]public static void Build(){//注意:St…...

【FTP 协议】FTP主动模式
一、测试工具 服务器:FileZilla_Server-cn-0_9_60_2.exe 中文版本 客户端:FileZilla_3.66.5_win64 客户端IP: 192.168.9.186 服务端 IP: 192.168.9.161 在客户端请求PORT之前,抓包测试的结果跟被动模式流程相同。 二、客户端主动模式命令…...

十五、Vue 响应接口
文章目录 一、响应式系统基础什么是响应式系统响应式数据的声明与使用二、响应式原理深入Object.defineProperty () 方法的应用(Vue2)Proxy 对象的应用(Vue3)三、响应式接口之 ref 和 reactive(Vue3)ref 函数的使用reactive 函数的使用四、计算属性(computed)作为响应式…...

至强6搭配美光CZ122,证明CXL可以提高生成式AI的性能表现
最近发现了英特尔官网公布的一项最新测试报告,报告显示,将美光的CZ122 CXL内存模块放到英特尔至强6平台上,显著提升了HPC和AI工作负载的内存带宽,特别是在采用基于软件的交错配置(interleave configuration)…...

一文理解ssh,ssl协议以及应用
在使用基于密钥的认证方式的时候,私钥的位置一定要符合远程服务器规定的位置,否则找不到私钥的位置会导致建立ssh连接失败 SSH 全称是 “Secure Shell”,即安全外壳协议。 它是一种网络协议,用于在不安全的网络中安全地进行远程登…...

电子应用设计方案87:智能AI收纳箱系统设计
智能 AI 收纳箱系统设计 一、引言 智能 AI 收纳箱系统旨在为用户提供更高效、便捷和智能的物品收纳与管理解决方案,通过融合人工智能技术和创新设计,提升用户的生活品质和物品整理效率。 二、系统概述 1. 系统目标 - 实现物品的自动分类和整理…...

BloombergGPT: A Large Language Model for Finance——面向金融领域的大语言模型
这篇文章介绍了BloombergGPT,一个专门为金融领域设计的大语言模型(LLM)。以下是文章的主要内容总结: 背景与动机: 大语言模型(如GPT-3)在多个任务上表现出色,但尚未有针对金融领域的…...

LeetCode - #180 Swift 实现连续数字查询
文章目录 摘要描述SQL 解法Swift 题解代码Swift 题解代码分析核心逻辑关键函数 示例测试及结果测试 1测试 2 时间复杂度空间复杂度总结 摘要 本文将解决如何从日志数据中找出连续出现至少三次的数字。通过 SQL 查询语句结合 Swift 数据库操作,我们将完成这一任务。…...

为什么ip属地一会河南一会江苏
在使用互联网的过程中,许多用户可能会遇到这样一个问题:自己的IP属地一会儿显示为河南,一会儿又变成了江苏。这种现象可能会让人感到困惑,甚至产生疑虑,担心自己的网络活动是否受到了某种影响。为了解答这一疑问&#…...
使用最广泛的FastAPI项目结构推荐,命名规范等
使用最广泛的FastAPI项目结构推荐,命名规范等 一、FastAPI项目结构如下:二、组件管理:使用依赖注入三、命名约定四、建议分层架构的设计五、文档和测试六、版本控制和持续集成七、环境和配置管理工具八、性能优化与权限安全 一、FastAPI项目结…...

接口测试中缓存处理策略
在接口测试中,缓存处理策略是一个关键环节,直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性,避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明: 一、缓存处理的核…...

LeetCode - 394. 字符串解码
题目 394. 字符串解码 - 力扣(LeetCode) 思路 使用两个栈:一个存储重复次数,一个存储字符串 遍历输入字符串: 数字处理:遇到数字时,累积计算重复次数左括号处理:保存当前状态&a…...
【Go】3、Go语言进阶与依赖管理
前言 本系列文章参考自稀土掘金上的 【字节内部课】公开课,做自我学习总结整理。 Go语言并发编程 Go语言原生支持并发编程,它的核心机制是 Goroutine 协程、Channel 通道,并基于CSP(Communicating Sequential Processes࿰…...
反射获取方法和属性
Java反射获取方法 在Java中,反射(Reflection)是一种强大的机制,允许程序在运行时访问和操作类的内部属性和方法。通过反射,可以动态地创建对象、调用方法、改变属性值,这在很多Java框架中如Spring和Hiberna…...
【git】把本地更改提交远程新分支feature_g
创建并切换新分支 git checkout -b feature_g 添加并提交更改 git add . git commit -m “实现图片上传功能” 推送到远程 git push -u origin feature_g...
浅谈不同二分算法的查找情况
二分算法原理比较简单,但是实际的算法模板却有很多,这一切都源于二分查找问题中的复杂情况和二分算法的边界处理,以下是博主对一些二分算法查找的情况分析。 需要说明的是,以下二分算法都是基于有序序列为升序有序的情况…...
CSS设置元素的宽度根据其内容自动调整
width: fit-content 是 CSS 中的一个属性值,用于设置元素的宽度根据其内容自动调整,确保宽度刚好容纳内容而不会超出。 效果对比 默认情况(width: auto): 块级元素(如 <div>)会占满父容器…...
Mysql8 忘记密码重置,以及问题解决
1.使用免密登录 找到配置MySQL文件,我的文件路径是/etc/mysql/my.cnf,有的人的是/etc/mysql/mysql.cnf 在里最后加入 skip-grant-tables重启MySQL服务 service mysql restartShutting down MySQL… SUCCESS! Starting MySQL… SUCCESS! 重启成功 2.登…...

AI+无人机如何守护濒危物种?YOLOv8实现95%精准识别
【导读】 野生动物监测在理解和保护生态系统中发挥着至关重要的作用。然而,传统的野生动物观察方法往往耗时耗力、成本高昂且范围有限。无人机的出现为野生动物监测提供了有前景的替代方案,能够实现大范围覆盖并远程采集数据。尽管具备这些优势…...

搭建DNS域名解析服务器(正向解析资源文件)
正向解析资源文件 1)准备工作 服务端及客户端都关闭安全软件 [rootlocalhost ~]# systemctl stop firewalld [rootlocalhost ~]# setenforce 0 2)服务端安装软件:bind 1.配置yum源 [rootlocalhost ~]# cat /etc/yum.repos.d/base.repo [Base…...