毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏
AI训练数据服务第一股海天瑞声终于迎来了“曙光”。
日前,海天瑞声发布2024年半年报显示,上半年其实现营收9242.63万,同比增长24.13%;实现净利润41.64 万元,不过同比去年同期的亏损1724.14万元,扭亏为盈。
其在财报中解释,主要是因为报告期内整体营业收入增长的同时,标准化数据集产品收入占比也持续提升,同时训练数据定制服务的毛利率也同比显著增长,共同驱动公司整体毛利率增加至 70.34%,而在2023年,其业务整体毛利率显示为56.01%。
并且其还提到,2024年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。另外相关法规出台,使得其境外业务大幅增长,拉动公司整体营业收入快速增长。
数据显示,2024 年上半年,海天瑞声的境外业务的收入达到4369.53万元,同比增长50.00%。
资料显示,海天瑞声作为我国领先的AI算法训练数据与解决方案提供商。其训练数据业务覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个AI核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。
其业务主要分为智能语音、计算机视觉、自然语言、训练数据相关的应用服务四大类,其中智能语音业务收入占比超过7成,其次是计算机视觉业务,占比约18%,另外两大业务占比相对较小。
在2024年上半年,四大业务中智能语音业务和自然语言收入均同比有所增长,其中主力业务智能语音业务收入增幅超过37%。
过去的几年间,海天瑞声的业绩一直显得较为艰难,包括智能语音、智能驾驶以及大模型等下游AI 应用行业的大规模商业化发展也呈现震荡趋势。
海天瑞声在2021年,也就是上市当年就发生了营收和净利润双双下跌;随后的2022年,其营收重新恢复增长并创下了2.6亿元的新高,同比增长27.32%,但净利润继续下滑,当年其实现净利润2945.41万元,同比下降6.81%。
2023年再次出现营收和净利润双跌,净利润还出现大幅亏损。
2023年公司实现营业收入1.7亿元,较上年同期下降35.33%;归属于母公司所有者的净利润亏损了3038.52万元,较上年同期减少203.16%;归属于母公司所有者的扣除非经常性损益的净利润亏损达到4,347.07万元,较上年同期减少528.32%;经营性现金流净额-3,104.62万元,较上年同期下降201.26%。
在2023年年报中,几大板块的营收均处于下滑态势,这也导致了整体业绩的下滑明显。
不过,刚刚跨过盈亏衡点的海天瑞声,业绩能否进一步飘红还有待观察。
2022 年底 ChatGPT 的爆火,AI大模型开始席卷各大行业,一时间各互联网大厂、科技公司、初创企业等都在下场投入大模型,这也带动全球 AI 产业进入新一轮发展期。
以上趋势对海天瑞声来说,将对旗下智能语音、自然语言几块业务形成利好。其也在财报中表示,2024 年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。
根据资料显示,海天瑞声的客户包括阿里巴巴、Meta、腾讯、百度、字节跳动、微软、三星等大型科技公司,另外还包括科大讯飞、商汤科技、云知声、海康威视等人工智能企业,以上公司基本上均在AI大模型领域有所部署。
不过观察当前市场情况,各大大模型企业自身的大模型业务的商业化模式还处于探索阶段,很明显,只有大模型应用的渗透率达到一定程度,并在各大应用场景中真正落地实现了商业价值,跑通了商业路径,大模型客户外购训练数据的需求才会明显增长。
这也意味着,数据供应商期待大模型产业拉动相关业务线高速增长,还需要待以时日。
并且,当前AI大模型还需要持续的高投入,这包括研发、人力和算力等各项高额投入也带来不小的压力,这从几家AI客户的业绩也可见一斑。
例如云从科技2024 年上半年营收1.21亿,同比减少26.35%;亏损 3.56亿。科大讯飞今年上半年净利润亏损4.01亿元;而商汤科技今年上半年总收入为人民币17.4亿元,同比增长21.4%,上半年净亏损24.77亿元,相比去年同期亏损收窄21.2%。来自下游应用端的压力,恐怕也会向上游供应链传导。
在大模型应用趋势下,同时也对训练数据业务也将带来新的变化和挑战。
例如大模型范式下的训练数据与传统深度学习训练数据处理方式存在显著差异,数据标注技术呈现“智能化”,大模型数据服务将更加依赖算法的参与等等。
另外,人工智能技术加速向各产业内深度渗透,对数据处理更加注重专业性,这需要构建面向垂直行业的数据资源等等。
这也意味着,海天瑞声这类AI训练数据供应商还需要持续在算法、平台工具升级、大模型数据处理等方面进行大笔的研投入,以及针对各大行业垂直领域进行资源投入等等。
海天瑞声方面也透露,公司将继续在大模型数据领域进行研发投入,在大模型领域的部署主要分为两部分:首先在研发数据生产中使用的大模型工具;其次也在积极打造大模型数据集的矩阵,主要包括通用大模型数据集和行业大模型数据集。在行业数据上,已经研发出汽车、金融、教育、医疗等行业大模型所需的高质量数据集。
例如2023年在公司亏损的情况下,海天瑞声的研发费用共计5849.09 万元,占当期营业收入的 34.40%。2023年其还计划募集资金6.67亿元用于“AI 大模型训练数据集建设项目”和“数据生产垂直大模型研发项目”。
此外,以智能驾驶场景作为核心的计算机视觉业务也被视作海天瑞声的第二增长曲线。
2023年4月,海天瑞声推出专为自动驾驶场景设计的全栈式数据标注平台“DOTS-AD自动驾驶数据平台”。官方资料显示,目前公司至今已服务超过70家智能驾驶领域客户。
2024年上半年,公司加大了对高级别数据标注工具的研发力度,截至6月底,DOTS-D平台新增 3D动静分离标注工具,BEV多图层 4D车道线标注工具,并升级点云分割工具支持连续帧叠加标注和4D分段加载等核心能力,有效支撑了自动驾驶 BEV和 OCC主流算法演进对数据标注工具的需求。
此外,公司开发了 2D-3D 融合的动静分离检测追踪算法,在点云连续帧融合产线实现提效 30%以上,迭代优化点云分割算法和地面检测算法,在点云分割产线实现提效 20%以上。
而为进一步支撑自主品牌车企的国际化战略,公司在全球范围内扩展了道路采集业务,可提供包括采集方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。
2024年上半年,公司采集业务已覆盖包括德国、西班牙、捷克等多个国家,为公司构建智能驾驶全球化数据服务能力奠定了基础。
在2022年财报中,其首次披露了智能驾驶业务收入情况:2022年,公司智能驾驶业务收入4174.51 万元,同比增长115.12%; 但在后续的2023年年报和2024年半年报中均未明确披露。不过其在2023年半年报中提到其智能驾驶业务收入同比增长178.96%。
不过2024年半年报中显示,根据合同分类来自计算机视觉业务的营收数据同比上一年同期的来看,呈现下滑趋势。
相关文章:

毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏
AI训练数据服务第一股海天瑞声终于迎来了“曙光”。 日前,海天瑞声发布2024年半年报显示,上半年其实现营收9242.63万,同比增长24.13%;实现净利润41.64 万元,不过同比去年同期的亏损1724.14万元,扭亏为盈。…...

本地部署高颜值某抑云音乐播放器Splayer并实现无公网IP远程听歌
💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…...

图像压缩编码(4)--H.26x系列视频压缩编码_2
目录 H.261 视频编码标准 H.261的编码与解码 1) 帧内/帧间编码 2)运动补偿 3)量化 4)环路滤波器 5)缓存器 压缩数据的分层 数据复用结构 H.264的编码与解码 H.261 视频编码标准 实际应用时,要求有…...

JS渲染锻炼输入表单
前言 上篇文章为大家展现了好看的信息窗口,接下来我们跟着流程图看下一步 之前我们的带点击事件已经添加完毕,下一步就是当用户点击的时候,渲染锻炼形式,当然这是一个标签,可以提供给用户输入锻炼形式 实例 ● 我…...

proteus仿真学习(1)
一,创建工程 一般选择默认模式,不配置pcb文件 可以选用芯片型号也可以不选 不选则从零开始布局,没有初始最小系统。选用则有初始最小系统以及基础的main函数 本次学习使用从零开始,不配置固件 二,上手软件 1.在元件…...

决策树+随机森林模型实现足球大小球让球预测软件
文章目录 前言一、决策树是什么?二、数据收集与整理1.数据收集2.数据清洗3.特征选择 三、决策树构建3.1绘制训练数据图像3.2 训练决策树模型3.3 依据模型绘制决策树的决策边界3.4 树模型可视化 四、模型预测五、随机森林模型总结 前言 之前搞足球数据分析的时候&…...

31省市农业地图大数据
1.北京市 谷类作物种植结构(万亩) 农作物种植结构(万亩) 2.天津市 谷类作物种植结构(万亩) 农作物种植结构(万亩) 3.黑龙江省 谷类作物种植结构(万亩) 农作物…...

http请求包含什么
HTTP请求通常包含以下几个主要部分: 请求行(Request Line): 包含请求方法(如 GET、POST、PUT、DELETE 等)、请求的目标 URI 和 HTTP 版本。例如:GET /index.html HTTP/1.1 请求头部(…...

【基础算法总结】模拟篇
目录 一,算法介绍二,算法原理和代码实现1576.替换所有的问号495.提莫攻击6.Z字形变换38.外观数列1419.数青蛙 三,算法总结 一,算法介绍 模拟算法本质就是"依葫芦画瓢",就是在题目中已经告诉了我们该如何操作…...

《深度学习》PyTorch 手写数字识别 案例解析及实现 <下>
目录 一、回顾神经网络框架 1、单层神经网络 2、多层神经网络 二、手写数字识别 1、续接上节课代码,如下所示 2、建立神经网络模型 输出结果: 3、设置训练集 4、设置测试集 5、创建损失函数、优化器 参数解析: 1)para…...

【笔记】材料分析测试:晶体学
晶体与晶体结构Crystal and Crystal Structure 1.晶体主要特征 固态物质可以分为晶态和非晶态两大类,分别称为晶体和非晶体。 晶体和非晶体在微观结构上的区别在于是否具有长程有序。 晶体(长程有序)非晶(短程有序)…...

飞塔Fortigate7.4.4的DNS劫持功能
基础网络配置、上网策略、与Server的VIP配置(略)。 在FortiGate上配置DNS Translation,将DNS请求结果为202.103.12.2的DNS响应报文中的IP地址修改为Server的内网IP 10.10.2.100。 config firewall dnstranslationedit 1set src 2.13.12.2set…...

Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】
Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】 目录 Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】 一、简单介绍 二、状态模式(State Pattern) 1、什么时候使用状态模式 2、使用状态模式的…...

【RabbitMQ】RabbitMQ 的概念以及使用RabbitMQ编写生产者消费者代码
目录 1. RabbitMQ 核心概念 1.1生产者和消费者 1.2 Connection和Channel 1.3 Virtual host 1.4 Queue 1.5 Exchange 1.6 RabbitMO工作流程 2. AMQP 3.RabbitMO快速入门 3.1.引入依赖 3.2.编写生产者代码 3.3.编写消费者代码 4.源码 1. RabbitMQ 核心概念 在安装…...

openmv与stm32通信
控制小车视觉循迹使用 OpenMV 往往是不够的。一般使用 OpenMV 对图像进行处理,将处理过后的数据使用串口发送给STM32,使用STM32控制小车行驶。本文主要讲解 OpenMV 模块与 STM32 间的串口通信以及两种循迹方案,分别是划分检测区域和线性回归。…...

C++ STL全面解析:六大核心组件之一----序列式容器(vector和List)(STL进阶学习)
目录 序列式容器 Vector vector概述 vector的迭代器 vector的数据结构 vector的构造和内存管理 vector的元素操作 List List概述 List的设计结构 List的迭代器 List的数据结构 List的内存构造 List的元素操作 C标准模板库(STL)是一组高效的…...

【c数据结构】OJ练习篇 帮你更深层次理解链表!(相交链表、相交链表、环形链表、环形链表之寻找环形入口点、判断链表是否是回文结构、 随机链表的复制)
目录 一. 相交链表 二. 环形链表 三. 环形链表之寻找环形入口点 四. 判断链表是否是回文结构 五. 随机链表的复制 一. 相交链表 最简单粗暴的思路,遍历两个链表,分别寻找是否有相同的对应的结点。 我们对两个链表的每个对应的节点进行判断比较&…...

微软开源GraphRAG的使用教程(最全,非常详细)
GraphRAG的介绍 目前微软已经开源了GraphRAG的完整项目代码。对于某一些LLM的下游任务则可以使用GraphRAG去增强自己业务的RAG的表现。项目给出了两种使用方式: 在打包好的项目状态下运行,可进行尝试使用。在源码基础上运行,适合为了下游任…...

使用Refine构建项目(1)初始化项目
要初始化一个空的Refine项目,你可以使用Refine提供的CLI工具create-refine-app。以下是初始化步骤: 使用npx命令: 在命令行中运行以下命令来创建一个新的Refine项目: npx create-refine-applatest my-refine-project这将引导你通过…...

【Docker】安装及使用
1. 安装Docker Desktop Docker Desktop是官方提供的桌面版Docker客户端,在Mac上使用Docker需要安装这个工具。 访问 Docker官方页面 并下载Docker Desktop for Mac。打开下载的.dmg文件,并拖动Docker图标到应用程序文件夹。安装完成后,打开…...

[大语言模型-论文精读] 以《黑神话:悟空》为研究案例探讨VLMs能否玩动作角色扮演游戏?
1. 论文简介 论文《Can VLMs Play Action Role-Playing Games? Take Black Myth Wukong as a Study Case》是阿里巴巴集团的Peng Chen、Pi Bu、Jun Song和Yuan Gao,在2024.09.19提交到arXiv上的研究论文。 论文: https://arxiv.org/abs/2409.12889代码和数据: h…...

提升动态数据查询效率:应对数据库成为性能瓶颈的优化方案
引言 在现代软件系统中,数据库性能是决定整个系统响应速度和处理能力的关键因素之一。然而,当系统负载增加,特别是在高并发、大数据量场景下,数据库性能往往会成为瓶颈,导致查询响应时间延长,影响用户体验…...

Prometheus+grafana+kafka_exporter监控kafka运行情况
使用Prometheus、Grafana和kafka_exporter来监控Kafka的运行情况是一种常见且有效的方案。以下是详细的步骤和说明: 1. 部署kafka_exporter 步骤: 从GitHub下载kafka_exporter的最新版本:kafka_exporter项目地址(注意ÿ…...

在vue中:style 的几种使用方式
在日常开发中:style的使用也是比较常见的: 亲测有效 1.最通用的写法 <p :style"{fontFamily:arr.conFontFamily,color:arr.conFontColor,backgroundColor:arr.conBgColor}">{{con.title}}</p> 2.三元表达式 <a :style"{height:…...

商城小程序后端开发实践中出现的问题及其解决方法
前言 商城小程序后端开发中,开发者可能会面临多种问题。以下是一些常见的问题及其解决方法: 一、性能优化 问题:随着用户量的增加和功能的扩展,商城小程序可能会出现响应速度慢、处理效率低的问题。 解决方法: 对数…...

阿里Arthas-Java诊断工具,基本操作和命令使用
Arthas 是阿里巴巴开源的一款Java诊断工具,深受开发者喜爱。它可以帮助开发者在不需要修改代码的情况下,对运行中的Java程序进行问题诊断和性能分析。 软件具体使用方法 1 启动 Arthas,此时可能会出现好几个jvm的进程号,输入序号…...

Go 1.19.4 路径和目录-Day 15
1. 路径介绍 存储设备保存着数据,但是得有一种方便的模式让用户可以定位资源位置,操作系统采用一种路径字符 串的表达方式,这是一棵倒置的层级目录树,从根开始。 相对路径:不是以根目录开始的路径,例如 a/b…...

jEasyUI 创建标签页
jEasyUI 创建标签页 jEasyUI(jQuery EasyUI)是一个基于jQuery的框架,它为Web应用程序提供了丰富的用户界面组件。标签页(Tabs)是jEasyUI中的一个常用组件,用于在一个页面内组织多个面板,用户可…...

鸿蒙HarmonyOS开发:一次开发,多端部署(界面级)天气应用案例
文章目录 一、布局简介二、典型布局场景三、侧边栏 SideBarContainer1、子组件2、属性3、事件 四、案例 天气应用1、UX设计2、实现分析3、主页整体实现4、具体代码 五、运行效果 一、布局简介 布局可以分为自适应布局和响应式布局,二者的介绍如下表所示。 名称简介…...

使用 Python 模拟光的折射,反射,和全反射
✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏…...