毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏
AI训练数据服务第一股海天瑞声终于迎来了“曙光”。
日前,海天瑞声发布2024年半年报显示,上半年其实现营收9242.63万,同比增长24.13%;实现净利润41.64 万元,不过同比去年同期的亏损1724.14万元,扭亏为盈。
其在财报中解释,主要是因为报告期内整体营业收入增长的同时,标准化数据集产品收入占比也持续提升,同时训练数据定制服务的毛利率也同比显著增长,共同驱动公司整体毛利率增加至 70.34%,而在2023年,其业务整体毛利率显示为56.01%。
并且其还提到,2024年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。另外相关法规出台,使得其境外业务大幅增长,拉动公司整体营业收入快速增长。
数据显示,2024 年上半年,海天瑞声的境外业务的收入达到4369.53万元,同比增长50.00%。
资料显示,海天瑞声作为我国领先的AI算法训练数据与解决方案提供商。其训练数据业务覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个AI核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。
其业务主要分为智能语音、计算机视觉、自然语言、训练数据相关的应用服务四大类,其中智能语音业务收入占比超过7成,其次是计算机视觉业务,占比约18%,另外两大业务占比相对较小。
在2024年上半年,四大业务中智能语音业务和自然语言收入均同比有所增长,其中主力业务智能语音业务收入增幅超过37%。
过去的几年间,海天瑞声的业绩一直显得较为艰难,包括智能语音、智能驾驶以及大模型等下游AI 应用行业的大规模商业化发展也呈现震荡趋势。
海天瑞声在2021年,也就是上市当年就发生了营收和净利润双双下跌;随后的2022年,其营收重新恢复增长并创下了2.6亿元的新高,同比增长27.32%,但净利润继续下滑,当年其实现净利润2945.41万元,同比下降6.81%。
2023年再次出现营收和净利润双跌,净利润还出现大幅亏损。
2023年公司实现营业收入1.7亿元,较上年同期下降35.33%;归属于母公司所有者的净利润亏损了3038.52万元,较上年同期减少203.16%;归属于母公司所有者的扣除非经常性损益的净利润亏损达到4,347.07万元,较上年同期减少528.32%;经营性现金流净额-3,104.62万元,较上年同期下降201.26%。
在2023年年报中,几大板块的营收均处于下滑态势,这也导致了整体业绩的下滑明显。
不过,刚刚跨过盈亏衡点的海天瑞声,业绩能否进一步飘红还有待观察。
2022 年底 ChatGPT 的爆火,AI大模型开始席卷各大行业,一时间各互联网大厂、科技公司、初创企业等都在下场投入大模型,这也带动全球 AI 产业进入新一轮发展期。
以上趋势对海天瑞声来说,将对旗下智能语音、自然语言几块业务形成利好。其也在财报中表示,2024 年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。
根据资料显示,海天瑞声的客户包括阿里巴巴、Meta、腾讯、百度、字节跳动、微软、三星等大型科技公司,另外还包括科大讯飞、商汤科技、云知声、海康威视等人工智能企业,以上公司基本上均在AI大模型领域有所部署。
不过观察当前市场情况,各大大模型企业自身的大模型业务的商业化模式还处于探索阶段,很明显,只有大模型应用的渗透率达到一定程度,并在各大应用场景中真正落地实现了商业价值,跑通了商业路径,大模型客户外购训练数据的需求才会明显增长。
这也意味着,数据供应商期待大模型产业拉动相关业务线高速增长,还需要待以时日。
并且,当前AI大模型还需要持续的高投入,这包括研发、人力和算力等各项高额投入也带来不小的压力,这从几家AI客户的业绩也可见一斑。
例如云从科技2024 年上半年营收1.21亿,同比减少26.35%;亏损 3.56亿。科大讯飞今年上半年净利润亏损4.01亿元;而商汤科技今年上半年总收入为人民币17.4亿元,同比增长21.4%,上半年净亏损24.77亿元,相比去年同期亏损收窄21.2%。来自下游应用端的压力,恐怕也会向上游供应链传导。
在大模型应用趋势下,同时也对训练数据业务也将带来新的变化和挑战。
例如大模型范式下的训练数据与传统深度学习训练数据处理方式存在显著差异,数据标注技术呈现“智能化”,大模型数据服务将更加依赖算法的参与等等。
另外,人工智能技术加速向各产业内深度渗透,对数据处理更加注重专业性,这需要构建面向垂直行业的数据资源等等。
这也意味着,海天瑞声这类AI训练数据供应商还需要持续在算法、平台工具升级、大模型数据处理等方面进行大笔的研投入,以及针对各大行业垂直领域进行资源投入等等。
海天瑞声方面也透露,公司将继续在大模型数据领域进行研发投入,在大模型领域的部署主要分为两部分:首先在研发数据生产中使用的大模型工具;其次也在积极打造大模型数据集的矩阵,主要包括通用大模型数据集和行业大模型数据集。在行业数据上,已经研发出汽车、金融、教育、医疗等行业大模型所需的高质量数据集。
例如2023年在公司亏损的情况下,海天瑞声的研发费用共计5849.09 万元,占当期营业收入的 34.40%。2023年其还计划募集资金6.67亿元用于“AI 大模型训练数据集建设项目”和“数据生产垂直大模型研发项目”。
此外,以智能驾驶场景作为核心的计算机视觉业务也被视作海天瑞声的第二增长曲线。
2023年4月,海天瑞声推出专为自动驾驶场景设计的全栈式数据标注平台“DOTS-AD自动驾驶数据平台”。官方资料显示,目前公司至今已服务超过70家智能驾驶领域客户。
2024年上半年,公司加大了对高级别数据标注工具的研发力度,截至6月底,DOTS-D平台新增 3D动静分离标注工具,BEV多图层 4D车道线标注工具,并升级点云分割工具支持连续帧叠加标注和4D分段加载等核心能力,有效支撑了自动驾驶 BEV和 OCC主流算法演进对数据标注工具的需求。
此外,公司开发了 2D-3D 融合的动静分离检测追踪算法,在点云连续帧融合产线实现提效 30%以上,迭代优化点云分割算法和地面检测算法,在点云分割产线实现提效 20%以上。
而为进一步支撑自主品牌车企的国际化战略,公司在全球范围内扩展了道路采集业务,可提供包括采集方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。
2024年上半年,公司采集业务已覆盖包括德国、西班牙、捷克等多个国家,为公司构建智能驾驶全球化数据服务能力奠定了基础。
在2022年财报中,其首次披露了智能驾驶业务收入情况:2022年,公司智能驾驶业务收入4174.51 万元,同比增长115.12%; 但在后续的2023年年报和2024年半年报中均未明确披露。不过其在2023年半年报中提到其智能驾驶业务收入同比增长178.96%。
不过2024年半年报中显示,根据合同分类来自计算机视觉业务的营收数据同比上一年同期的来看,呈现下滑趋势。
相关文章:
毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏
AI训练数据服务第一股海天瑞声终于迎来了“曙光”。 日前,海天瑞声发布2024年半年报显示,上半年其实现营收9242.63万,同比增长24.13%;实现净利润41.64 万元,不过同比去年同期的亏损1724.14万元,扭亏为盈。…...

本地部署高颜值某抑云音乐播放器Splayer并实现无公网IP远程听歌
💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…...

图像压缩编码(4)--H.26x系列视频压缩编码_2
目录 H.261 视频编码标准 H.261的编码与解码 1) 帧内/帧间编码 2)运动补偿 3)量化 4)环路滤波器 5)缓存器 压缩数据的分层 数据复用结构 H.264的编码与解码 H.261 视频编码标准 实际应用时,要求有…...

JS渲染锻炼输入表单
前言 上篇文章为大家展现了好看的信息窗口,接下来我们跟着流程图看下一步 之前我们的带点击事件已经添加完毕,下一步就是当用户点击的时候,渲染锻炼形式,当然这是一个标签,可以提供给用户输入锻炼形式 实例 ● 我…...

proteus仿真学习(1)
一,创建工程 一般选择默认模式,不配置pcb文件 可以选用芯片型号也可以不选 不选则从零开始布局,没有初始最小系统。选用则有初始最小系统以及基础的main函数 本次学习使用从零开始,不配置固件 二,上手软件 1.在元件…...

决策树+随机森林模型实现足球大小球让球预测软件
文章目录 前言一、决策树是什么?二、数据收集与整理1.数据收集2.数据清洗3.特征选择 三、决策树构建3.1绘制训练数据图像3.2 训练决策树模型3.3 依据模型绘制决策树的决策边界3.4 树模型可视化 四、模型预测五、随机森林模型总结 前言 之前搞足球数据分析的时候&…...

31省市农业地图大数据
1.北京市 谷类作物种植结构(万亩) 农作物种植结构(万亩) 2.天津市 谷类作物种植结构(万亩) 农作物种植结构(万亩) 3.黑龙江省 谷类作物种植结构(万亩) 农作物…...
http请求包含什么
HTTP请求通常包含以下几个主要部分: 请求行(Request Line): 包含请求方法(如 GET、POST、PUT、DELETE 等)、请求的目标 URI 和 HTTP 版本。例如:GET /index.html HTTP/1.1 请求头部(…...

【基础算法总结】模拟篇
目录 一,算法介绍二,算法原理和代码实现1576.替换所有的问号495.提莫攻击6.Z字形变换38.外观数列1419.数青蛙 三,算法总结 一,算法介绍 模拟算法本质就是"依葫芦画瓢",就是在题目中已经告诉了我们该如何操作…...

《深度学习》PyTorch 手写数字识别 案例解析及实现 <下>
目录 一、回顾神经网络框架 1、单层神经网络 2、多层神经网络 二、手写数字识别 1、续接上节课代码,如下所示 2、建立神经网络模型 输出结果: 3、设置训练集 4、设置测试集 5、创建损失函数、优化器 参数解析: 1)para…...

【笔记】材料分析测试:晶体学
晶体与晶体结构Crystal and Crystal Structure 1.晶体主要特征 固态物质可以分为晶态和非晶态两大类,分别称为晶体和非晶体。 晶体和非晶体在微观结构上的区别在于是否具有长程有序。 晶体(长程有序)非晶(短程有序)…...
飞塔Fortigate7.4.4的DNS劫持功能
基础网络配置、上网策略、与Server的VIP配置(略)。 在FortiGate上配置DNS Translation,将DNS请求结果为202.103.12.2的DNS响应报文中的IP地址修改为Server的内网IP 10.10.2.100。 config firewall dnstranslationedit 1set src 2.13.12.2set…...

Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】
Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】 目录 Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】 一、简单介绍 二、状态模式(State Pattern) 1、什么时候使用状态模式 2、使用状态模式的…...

【RabbitMQ】RabbitMQ 的概念以及使用RabbitMQ编写生产者消费者代码
目录 1. RabbitMQ 核心概念 1.1生产者和消费者 1.2 Connection和Channel 1.3 Virtual host 1.4 Queue 1.5 Exchange 1.6 RabbitMO工作流程 2. AMQP 3.RabbitMO快速入门 3.1.引入依赖 3.2.编写生产者代码 3.3.编写消费者代码 4.源码 1. RabbitMQ 核心概念 在安装…...

openmv与stm32通信
控制小车视觉循迹使用 OpenMV 往往是不够的。一般使用 OpenMV 对图像进行处理,将处理过后的数据使用串口发送给STM32,使用STM32控制小车行驶。本文主要讲解 OpenMV 模块与 STM32 间的串口通信以及两种循迹方案,分别是划分检测区域和线性回归。…...

C++ STL全面解析:六大核心组件之一----序列式容器(vector和List)(STL进阶学习)
目录 序列式容器 Vector vector概述 vector的迭代器 vector的数据结构 vector的构造和内存管理 vector的元素操作 List List概述 List的设计结构 List的迭代器 List的数据结构 List的内存构造 List的元素操作 C标准模板库(STL)是一组高效的…...

【c数据结构】OJ练习篇 帮你更深层次理解链表!(相交链表、相交链表、环形链表、环形链表之寻找环形入口点、判断链表是否是回文结构、 随机链表的复制)
目录 一. 相交链表 二. 环形链表 三. 环形链表之寻找环形入口点 四. 判断链表是否是回文结构 五. 随机链表的复制 一. 相交链表 最简单粗暴的思路,遍历两个链表,分别寻找是否有相同的对应的结点。 我们对两个链表的每个对应的节点进行判断比较&…...
微软开源GraphRAG的使用教程(最全,非常详细)
GraphRAG的介绍 目前微软已经开源了GraphRAG的完整项目代码。对于某一些LLM的下游任务则可以使用GraphRAG去增强自己业务的RAG的表现。项目给出了两种使用方式: 在打包好的项目状态下运行,可进行尝试使用。在源码基础上运行,适合为了下游任…...
使用Refine构建项目(1)初始化项目
要初始化一个空的Refine项目,你可以使用Refine提供的CLI工具create-refine-app。以下是初始化步骤: 使用npx命令: 在命令行中运行以下命令来创建一个新的Refine项目: npx create-refine-applatest my-refine-project这将引导你通过…...
【Docker】安装及使用
1. 安装Docker Desktop Docker Desktop是官方提供的桌面版Docker客户端,在Mac上使用Docker需要安装这个工具。 访问 Docker官方页面 并下载Docker Desktop for Mac。打开下载的.dmg文件,并拖动Docker图标到应用程序文件夹。安装完成后,打开…...

C++_核心编程_多态案例二-制作饮品
#include <iostream> #include <string> using namespace std;/*制作饮品的大致流程为:煮水 - 冲泡 - 倒入杯中 - 加入辅料 利用多态技术实现本案例,提供抽象制作饮品基类,提供子类制作咖啡和茶叶*//*基类*/ class AbstractDr…...

微软PowerBI考试 PL300-选择 Power BI 模型框架【附练习数据】
微软PowerBI考试 PL300-选择 Power BI 模型框架 20 多年来,Microsoft 持续对企业商业智能 (BI) 进行大量投资。 Azure Analysis Services (AAS) 和 SQL Server Analysis Services (SSAS) 基于无数企业使用的成熟的 BI 数据建模技术。 同样的技术也是 Power BI 数据…...

linux arm系统烧录
1、打开瑞芯微程序 2、按住linux arm 的 recover按键 插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 (忘了有没有这步了 估计有) 刷机程序 和 镜像 就不提供了。要刷的时…...

【2025年】解决Burpsuite抓不到https包的问题
环境:windows11 burpsuite:2025.5 在抓取https网站时,burpsuite抓取不到https数据包,只显示: 解决该问题只需如下三个步骤: 1、浏览器中访问 http://burp 2、下载 CA certificate 证书 3、在设置--隐私与安全--…...
【AI学习】三、AI算法中的向量
在人工智能(AI)算法中,向量(Vector)是一种将现实世界中的数据(如图像、文本、音频等)转化为计算机可处理的数值型特征表示的工具。它是连接人类认知(如语义、视觉特征)与…...

《基于Apache Flink的流处理》笔记
思维导图 1-3 章 4-7章 8-11 章 参考资料 源码: https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...
Web中间件--tomcat学习
Web中间件–tomcat Java虚拟机详解 什么是JAVA虚拟机 Java虚拟机是一个抽象的计算机,它可以执行Java字节码。Java虚拟机是Java平台的一部分,Java平台由Java语言、Java API和Java虚拟机组成。Java虚拟机的主要作用是将Java字节码转换为机器代码&#x…...

群晖NAS如何在虚拟机创建飞牛NAS
套件中心下载安装Virtual Machine Manager 创建虚拟机 配置虚拟机 飞牛官网下载 https://iso.liveupdate.fnnas.com/x86_64/trim/fnos-0.9.2-863.iso 群晖NAS如何在虚拟机创建飞牛NAS - 个人信息分享...

MacOS下Homebrew国内镜像加速指南(2025最新国内镜像加速)
macos brew国内镜像加速方法 brew install 加速formula.jws.json下载慢加速 🍺 最新版brew安装慢到怀疑人生?别怕,教你轻松起飞! 最近Homebrew更新至最新版,每次执行 brew 命令时都会自动从官方地址 https://formulae.…...

关于easyexcel动态下拉选问题处理
前些日子突然碰到一个问题,说是客户的导入文件模版想支持部分导入内容的下拉选,于是我就找了easyexcel官网寻找解决方案,并没有找到合适的方案,没办法只能自己动手并分享出来,针对Java生成Excel下拉菜单时因选项过多导…...