毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏
AI训练数据服务第一股海天瑞声终于迎来了“曙光”。
日前,海天瑞声发布2024年半年报显示,上半年其实现营收9242.63万,同比增长24.13%;实现净利润41.64 万元,不过同比去年同期的亏损1724.14万元,扭亏为盈。
其在财报中解释,主要是因为报告期内整体营业收入增长的同时,标准化数据集产品收入占比也持续提升,同时训练数据定制服务的毛利率也同比显著增长,共同驱动公司整体毛利率增加至 70.34%,而在2023年,其业务整体毛利率显示为56.01%。
并且其还提到,2024年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。另外相关法规出台,使得其境外业务大幅增长,拉动公司整体营业收入快速增长。
数据显示,2024 年上半年,海天瑞声的境外业务的收入达到4369.53万元,同比增长50.00%。
资料显示,海天瑞声作为我国领先的AI算法训练数据与解决方案提供商。其训练数据业务覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个AI核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。
其业务主要分为智能语音、计算机视觉、自然语言、训练数据相关的应用服务四大类,其中智能语音业务收入占比超过7成,其次是计算机视觉业务,占比约18%,另外两大业务占比相对较小。
在2024年上半年,四大业务中智能语音业务和自然语言收入均同比有所增长,其中主力业务智能语音业务收入增幅超过37%。
过去的几年间,海天瑞声的业绩一直显得较为艰难,包括智能语音、智能驾驶以及大模型等下游AI 应用行业的大规模商业化发展也呈现震荡趋势。
海天瑞声在2021年,也就是上市当年就发生了营收和净利润双双下跌;随后的2022年,其营收重新恢复增长并创下了2.6亿元的新高,同比增长27.32%,但净利润继续下滑,当年其实现净利润2945.41万元,同比下降6.81%。
2023年再次出现营收和净利润双跌,净利润还出现大幅亏损。
2023年公司实现营业收入1.7亿元,较上年同期下降35.33%;归属于母公司所有者的净利润亏损了3038.52万元,较上年同期减少203.16%;归属于母公司所有者的扣除非经常性损益的净利润亏损达到4,347.07万元,较上年同期减少528.32%;经营性现金流净额-3,104.62万元,较上年同期下降201.26%。
在2023年年报中,几大板块的营收均处于下滑态势,这也导致了整体业绩的下滑明显。
不过,刚刚跨过盈亏衡点的海天瑞声,业绩能否进一步飘红还有待观察。
2022 年底 ChatGPT 的爆火,AI大模型开始席卷各大行业,一时间各互联网大厂、科技公司、初创企业等都在下场投入大模型,这也带动全球 AI 产业进入新一轮发展期。
以上趋势对海天瑞声来说,将对旗下智能语音、自然语言几块业务形成利好。其也在财报中表示,2024 年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。
根据资料显示,海天瑞声的客户包括阿里巴巴、Meta、腾讯、百度、字节跳动、微软、三星等大型科技公司,另外还包括科大讯飞、商汤科技、云知声、海康威视等人工智能企业,以上公司基本上均在AI大模型领域有所部署。
不过观察当前市场情况,各大大模型企业自身的大模型业务的商业化模式还处于探索阶段,很明显,只有大模型应用的渗透率达到一定程度,并在各大应用场景中真正落地实现了商业价值,跑通了商业路径,大模型客户外购训练数据的需求才会明显增长。
这也意味着,数据供应商期待大模型产业拉动相关业务线高速增长,还需要待以时日。
并且,当前AI大模型还需要持续的高投入,这包括研发、人力和算力等各项高额投入也带来不小的压力,这从几家AI客户的业绩也可见一斑。
例如云从科技2024 年上半年营收1.21亿,同比减少26.35%;亏损 3.56亿。科大讯飞今年上半年净利润亏损4.01亿元;而商汤科技今年上半年总收入为人民币17.4亿元,同比增长21.4%,上半年净亏损24.77亿元,相比去年同期亏损收窄21.2%。来自下游应用端的压力,恐怕也会向上游供应链传导。
在大模型应用趋势下,同时也对训练数据业务也将带来新的变化和挑战。
例如大模型范式下的训练数据与传统深度学习训练数据处理方式存在显著差异,数据标注技术呈现“智能化”,大模型数据服务将更加依赖算法的参与等等。
另外,人工智能技术加速向各产业内深度渗透,对数据处理更加注重专业性,这需要构建面向垂直行业的数据资源等等。
这也意味着,海天瑞声这类AI训练数据供应商还需要持续在算法、平台工具升级、大模型数据处理等方面进行大笔的研投入,以及针对各大行业垂直领域进行资源投入等等。
海天瑞声方面也透露,公司将继续在大模型数据领域进行研发投入,在大模型领域的部署主要分为两部分:首先在研发数据生产中使用的大模型工具;其次也在积极打造大模型数据集的矩阵,主要包括通用大模型数据集和行业大模型数据集。在行业数据上,已经研发出汽车、金融、教育、医疗等行业大模型所需的高质量数据集。
例如2023年在公司亏损的情况下,海天瑞声的研发费用共计5849.09 万元,占当期营业收入的 34.40%。2023年其还计划募集资金6.67亿元用于“AI 大模型训练数据集建设项目”和“数据生产垂直大模型研发项目”。
此外,以智能驾驶场景作为核心的计算机视觉业务也被视作海天瑞声的第二增长曲线。
2023年4月,海天瑞声推出专为自动驾驶场景设计的全栈式数据标注平台“DOTS-AD自动驾驶数据平台”。官方资料显示,目前公司至今已服务超过70家智能驾驶领域客户。
2024年上半年,公司加大了对高级别数据标注工具的研发力度,截至6月底,DOTS-D平台新增 3D动静分离标注工具,BEV多图层 4D车道线标注工具,并升级点云分割工具支持连续帧叠加标注和4D分段加载等核心能力,有效支撑了自动驾驶 BEV和 OCC主流算法演进对数据标注工具的需求。
此外,公司开发了 2D-3D 融合的动静分离检测追踪算法,在点云连续帧融合产线实现提效 30%以上,迭代优化点云分割算法和地面检测算法,在点云分割产线实现提效 20%以上。
而为进一步支撑自主品牌车企的国际化战略,公司在全球范围内扩展了道路采集业务,可提供包括采集方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。
2024年上半年,公司采集业务已覆盖包括德国、西班牙、捷克等多个国家,为公司构建智能驾驶全球化数据服务能力奠定了基础。
在2022年财报中,其首次披露了智能驾驶业务收入情况:2022年,公司智能驾驶业务收入4174.51 万元,同比增长115.12%; 但在后续的2023年年报和2024年半年报中均未明确披露。不过其在2023年半年报中提到其智能驾驶业务收入同比增长178.96%。
不过2024年半年报中显示,根据合同分类来自计算机视觉业务的营收数据同比上一年同期的来看,呈现下滑趋势。
相关文章:
毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏
AI训练数据服务第一股海天瑞声终于迎来了“曙光”。 日前,海天瑞声发布2024年半年报显示,上半年其实现营收9242.63万,同比增长24.13%;实现净利润41.64 万元,不过同比去年同期的亏损1724.14万元,扭亏为盈。…...

本地部署高颜值某抑云音乐播放器Splayer并实现无公网IP远程听歌
💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…...

图像压缩编码(4)--H.26x系列视频压缩编码_2
目录 H.261 视频编码标准 H.261的编码与解码 1) 帧内/帧间编码 2)运动补偿 3)量化 4)环路滤波器 5)缓存器 压缩数据的分层 数据复用结构 H.264的编码与解码 H.261 视频编码标准 实际应用时,要求有…...

JS渲染锻炼输入表单
前言 上篇文章为大家展现了好看的信息窗口,接下来我们跟着流程图看下一步 之前我们的带点击事件已经添加完毕,下一步就是当用户点击的时候,渲染锻炼形式,当然这是一个标签,可以提供给用户输入锻炼形式 实例 ● 我…...

proteus仿真学习(1)
一,创建工程 一般选择默认模式,不配置pcb文件 可以选用芯片型号也可以不选 不选则从零开始布局,没有初始最小系统。选用则有初始最小系统以及基础的main函数 本次学习使用从零开始,不配置固件 二,上手软件 1.在元件…...

决策树+随机森林模型实现足球大小球让球预测软件
文章目录 前言一、决策树是什么?二、数据收集与整理1.数据收集2.数据清洗3.特征选择 三、决策树构建3.1绘制训练数据图像3.2 训练决策树模型3.3 依据模型绘制决策树的决策边界3.4 树模型可视化 四、模型预测五、随机森林模型总结 前言 之前搞足球数据分析的时候&…...

31省市农业地图大数据
1.北京市 谷类作物种植结构(万亩) 农作物种植结构(万亩) 2.天津市 谷类作物种植结构(万亩) 农作物种植结构(万亩) 3.黑龙江省 谷类作物种植结构(万亩) 农作物…...
http请求包含什么
HTTP请求通常包含以下几个主要部分: 请求行(Request Line): 包含请求方法(如 GET、POST、PUT、DELETE 等)、请求的目标 URI 和 HTTP 版本。例如:GET /index.html HTTP/1.1 请求头部(…...

【基础算法总结】模拟篇
目录 一,算法介绍二,算法原理和代码实现1576.替换所有的问号495.提莫攻击6.Z字形变换38.外观数列1419.数青蛙 三,算法总结 一,算法介绍 模拟算法本质就是"依葫芦画瓢",就是在题目中已经告诉了我们该如何操作…...

《深度学习》PyTorch 手写数字识别 案例解析及实现 <下>
目录 一、回顾神经网络框架 1、单层神经网络 2、多层神经网络 二、手写数字识别 1、续接上节课代码,如下所示 2、建立神经网络模型 输出结果: 3、设置训练集 4、设置测试集 5、创建损失函数、优化器 参数解析: 1)para…...

【笔记】材料分析测试:晶体学
晶体与晶体结构Crystal and Crystal Structure 1.晶体主要特征 固态物质可以分为晶态和非晶态两大类,分别称为晶体和非晶体。 晶体和非晶体在微观结构上的区别在于是否具有长程有序。 晶体(长程有序)非晶(短程有序)…...
飞塔Fortigate7.4.4的DNS劫持功能
基础网络配置、上网策略、与Server的VIP配置(略)。 在FortiGate上配置DNS Translation,将DNS请求结果为202.103.12.2的DNS响应报文中的IP地址修改为Server的内网IP 10.10.2.100。 config firewall dnstranslationedit 1set src 2.13.12.2set…...

Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】
Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】 目录 Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】 一、简单介绍 二、状态模式(State Pattern) 1、什么时候使用状态模式 2、使用状态模式的…...

【RabbitMQ】RabbitMQ 的概念以及使用RabbitMQ编写生产者消费者代码
目录 1. RabbitMQ 核心概念 1.1生产者和消费者 1.2 Connection和Channel 1.3 Virtual host 1.4 Queue 1.5 Exchange 1.6 RabbitMO工作流程 2. AMQP 3.RabbitMO快速入门 3.1.引入依赖 3.2.编写生产者代码 3.3.编写消费者代码 4.源码 1. RabbitMQ 核心概念 在安装…...

openmv与stm32通信
控制小车视觉循迹使用 OpenMV 往往是不够的。一般使用 OpenMV 对图像进行处理,将处理过后的数据使用串口发送给STM32,使用STM32控制小车行驶。本文主要讲解 OpenMV 模块与 STM32 间的串口通信以及两种循迹方案,分别是划分检测区域和线性回归。…...

C++ STL全面解析:六大核心组件之一----序列式容器(vector和List)(STL进阶学习)
目录 序列式容器 Vector vector概述 vector的迭代器 vector的数据结构 vector的构造和内存管理 vector的元素操作 List List概述 List的设计结构 List的迭代器 List的数据结构 List的内存构造 List的元素操作 C标准模板库(STL)是一组高效的…...

【c数据结构】OJ练习篇 帮你更深层次理解链表!(相交链表、相交链表、环形链表、环形链表之寻找环形入口点、判断链表是否是回文结构、 随机链表的复制)
目录 一. 相交链表 二. 环形链表 三. 环形链表之寻找环形入口点 四. 判断链表是否是回文结构 五. 随机链表的复制 一. 相交链表 最简单粗暴的思路,遍历两个链表,分别寻找是否有相同的对应的结点。 我们对两个链表的每个对应的节点进行判断比较&…...
微软开源GraphRAG的使用教程(最全,非常详细)
GraphRAG的介绍 目前微软已经开源了GraphRAG的完整项目代码。对于某一些LLM的下游任务则可以使用GraphRAG去增强自己业务的RAG的表现。项目给出了两种使用方式: 在打包好的项目状态下运行,可进行尝试使用。在源码基础上运行,适合为了下游任…...
使用Refine构建项目(1)初始化项目
要初始化一个空的Refine项目,你可以使用Refine提供的CLI工具create-refine-app。以下是初始化步骤: 使用npx命令: 在命令行中运行以下命令来创建一个新的Refine项目: npx create-refine-applatest my-refine-project这将引导你通过…...
【Docker】安装及使用
1. 安装Docker Desktop Docker Desktop是官方提供的桌面版Docker客户端,在Mac上使用Docker需要安装这个工具。 访问 Docker官方页面 并下载Docker Desktop for Mac。打开下载的.dmg文件,并拖动Docker图标到应用程序文件夹。安装完成后,打开…...

华为云AI开发平台ModelArts
华为云ModelArts:重塑AI开发流程的“智能引擎”与“创新加速器”! 在人工智能浪潮席卷全球的2025年,企业拥抱AI的意愿空前高涨,但技术门槛高、流程复杂、资源投入巨大的现实,却让许多创新构想止步于实验室。数据科学家…...
SciencePlots——绘制论文中的图片
文章目录 安装一、风格二、1 资源 安装 # 安装最新版 pip install githttps://github.com/garrettj403/SciencePlots.git# 安装稳定版 pip install SciencePlots一、风格 简单好用的深度学习论文绘图专用工具包–Science Plot 二、 1 资源 论文绘图神器来了:一行…...

相机Camera日志实例分析之二:相机Camx【专业模式开启直方图拍照】单帧流程日志详解
【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了: 这一篇我们开始讲: 目录 一、场景操作步骤 二、日志基础关键字分级如下 三、场景日志如下: 一、场景操作步骤 操作步…...
2024年赣州旅游投资集团社会招聘笔试真
2024年赣州旅游投资集团社会招聘笔试真 题 ( 满 分 1 0 0 分 时 间 1 2 0 分 钟 ) 一、单选题(每题只有一个正确答案,答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录 【答案】: D 2.1864年,()预言了电磁波的存在,并指出…...
Auto-Coder使用GPT-4o完成:在用TabPFN这个模型构建一个预测未来3天涨跌的分类任务
通过akshare库,获取股票数据,并生成TabPFN这个模型 可以识别、处理的格式,写一个完整的预处理示例,并构建一个预测未来 3 天股价涨跌的分类任务 用TabPFN这个模型构建一个预测未来 3 天股价涨跌的分类任务,进行预测并输…...

最新SpringBoot+SpringCloud+Nacos微服务框架分享
文章目录 前言一、服务规划二、架构核心1.cloud的pom2.gateway的异常handler3.gateway的filter4、admin的pom5、admin的登录核心 三、code-helper分享总结 前言 最近有个活蛮赶的,根据Excel列的需求预估的工时直接打骨折,不要问我为什么,主要…...
安卓基础(aar)
重新设置java21的环境,临时设置 $env:JAVA_HOME "D:\Android Studio\jbr" 查看当前环境变量 JAVA_HOME 的值 echo $env:JAVA_HOME 构建ARR文件 ./gradlew :private-lib:assembleRelease 目录是这样的: MyApp/ ├── app/ …...

NXP S32K146 T-Box 携手 SD NAND(贴片式TF卡):驱动汽车智能革新的黄金组合
在汽车智能化的汹涌浪潮中,车辆不再仅仅是传统的交通工具,而是逐步演变为高度智能的移动终端。这一转变的核心支撑,来自于车内关键技术的深度融合与协同创新。车载远程信息处理盒(T-Box)方案:NXP S32K146 与…...

视觉slam十四讲实践部分记录——ch2、ch3
ch2 一、使用g++编译.cpp为可执行文件并运行(P30) g++ helloSLAM.cpp ./a.out运行 二、使用cmake编译 mkdir build cd build cmake .. makeCMakeCache.txt 文件仍然指向旧的目录。这表明在源代码目录中可能还存在旧的 CMakeCache.txt 文件,或者在构建过程中仍然引用了旧的路…...

Linux 内存管理实战精讲:核心原理与面试常考点全解析
Linux 内存管理实战精讲:核心原理与面试常考点全解析 Linux 内核内存管理是系统设计中最复杂但也最核心的模块之一。它不仅支撑着虚拟内存机制、物理内存分配、进程隔离与资源复用,还直接决定系统运行的性能与稳定性。无论你是嵌入式开发者、内核调试工…...