当前位置: 首页 > news >正文

毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏

AI训练数据服务第一股海天瑞声终于迎来了“曙光”。

日前,海天瑞声发布2024年半年报显示,上半年其实现营收9242.63万,同比增长24.13%;实现净利润41.64 万元,不过同比去年同期的亏损1724.14万元,扭亏为盈。

其在财报中解释,主要是因为报告期内整体营业收入增长的同时,标准化数据集产品收入占比也持续提升,同时训练数据定制服务的毛利率也同比显著增长,共同驱动公司整体毛利率增加至 70.34%,而在2023年,其业务整体毛利率显示为56.01%。

并且其还提到,2024年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。另外相关法规出台,使得其境外业务大幅增长,拉动公司整体营业收入快速增长。

数据显示,2024 年上半年,海天瑞声的境外业务的收入达到4369.53万元,同比增长50.00%。

资料显示,海天瑞声作为我国领先的AI算法训练数据与解决方案提供商。其训练数据业务覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个AI核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。

其业务主要分为智能语音、计算机视觉、自然语言、训练数据相关的应用服务四大类,其中智能语音业务收入占比超过7成,其次是计算机视觉业务,占比约18%,另外两大业务占比相对较小。

在2024年上半年,四大业务中智能语音业务和自然语言收入均同比有所增长,其中主力业务智能语音业务收入增幅超过37%。

过去的几年间,海天瑞声的业绩一直显得较为艰难,包括智能语音、智能驾驶以及大模型等下游AI 应用行业的大规模商业化发展也呈现震荡趋势。

海天瑞声在2021年,也就是上市当年就发生了营收和净利润双双下跌;随后的2022年,其营收重新恢复增长并创下了2.6亿元的新高,同比增长27.32%,但净利润继续下滑,当年其实现净利润2945.41万元,同比下降6.81%

2023年再次出现营收和净利润双跌,净利润还出现大幅亏损。

2023年公司实现营业收入1.7亿元,较上年同期下降35.33%;归属于母公司所有者的净利润亏损了3038.52万元,较上年同期减少203.16%;归属于母公司所有者的扣除非经常性损益的净利润亏损达到4,347.07万元,较上年同期减少528.32%;经营性现金流净额-3,104.62万元,较上年同期下降201.26%。

在2023年年报中,几大板块的营收均处于下滑态势,这也导致了整体业绩的下滑明显。

不过,刚刚跨过盈亏衡点的海天瑞声,业绩能否进一步飘红还有待观察。

2022 年底 ChatGPT 的爆火,AI大模型开始席卷各大行业,一时间各互联网大厂、科技公司、初创企业等都在下场投入大模型,这也带动全球 AI 产业进入新一轮发展期。

以上趋势对海天瑞声来说,将对旗下智能语音、自然语言几块业务形成利好。其也在财报中表示,2024 年上半年,受益于大模型技术的快速发展以及应用领域不断拓展,以智能终端厂商为代表的科技巨头纷纷加大多模态数据投入,全球数据服务市场持续增长。

根据资料显示,海天瑞声的客户包括阿里巴巴、Meta、腾讯、百度、字节跳动、微软、三星等大型科技公司,另外还包括科大讯飞、商汤科技、云知声、海康威视等人工智能企业,以上公司基本上均在AI大模型领域有所部署。

不过观察当前市场情况,各大大模型企业自身的大模型业务的商业化模式还处于探索阶段,很明显,只有大模型应用的渗透率达到一定程度,并在各大应用场景中真正落地实现了商业价值,跑通了商业路径,大模型客户外购训练数据的需求才会明显增长。

这也意味着,数据供应商期待大模型产业拉动相关业务线高速增长,还需要待以时日。

并且,当前AI大模型还需要持续的高投入,这包括研发、人力和算力等各项高额投入也带来不小的压力,这从几家AI客户的业绩也可见一斑。

例如云从科技2024 年上半年营收1.21亿,同比减少26.35%;亏损 3.56亿。科大讯飞今年上半年净利润亏损4.01亿元;而商汤科技今年上半年总收入为人民币17.4亿元,同比增长21.4%,上半年净亏损24.77亿元,相比去年同期亏损收窄21.2%。来自下游应用端的压力,恐怕也会向上游供应链传导。

在大模型应用趋势下,同时也对训练数据业务也将带来新的变化和挑战。

例如大模型范式下的训练数据与传统深度学习训练数据处理方式存在显著差异,数据标注技术呈现“智能化”,大模型数据服务将更加依赖算法的参与等等。

另外,人工智能技术加速向各产业内深度渗透,对数据处理更加注重专业性,这需要构建面向垂直行业的数据资源等等。

这也意味着,海天瑞声这类AI训练数据供应商还需要持续在算法、平台工具升级、大模型数据处理等方面进行大笔的研投入,以及针对各大行业垂直领域进行资源投入等等。

海天瑞声方面也透露,公司将继续在大模型数据领域进行研发投入,在大模型领域的部署主要分为两部分:首先在研发数据生产中使用的大模型工具;其次也在积极打造大模型数据集的矩阵,主要包括通用大模型数据集和行业大模型数据集。在行业数据上,已经研发出汽车、金融、教育、医疗等行业大模型所需的高质量数据集。

例如2023年在公司亏损的情况下,海天瑞声的研发费用共计5849.09 万元,占当期营业收入的 34.40%。2023年其还计划募集资金6.67亿元用于“AI 大模型训练数据集建设项目”和“数据生产垂直大模型研发项目”。

此外,以智能驾驶场景作为核心的计算机视觉业务也被视作海天瑞声的第二增长曲线。

2023年4月,海天瑞声推出专为自动驾驶场景设计的全栈式数据标注平台“DOTS-AD自动驾驶数据平台”。官方资料显示,目前公司至今已服务超过70家智能驾驶领域客户。

2024年上半年,公司加大了对高级别数据标注工具的研发力度,截至6月底,DOTS-D平台新增 3D动静分离标注工具,BEV多图层 4D车道线标注工具,并升级点云分割工具支持连续帧叠加标注和4D分段加载等核心能力,有效支撑了自动驾驶 BEV和 OCC主流算法演进对数据标注工具的需求。

此外,公司开发了 2D-3D 融合的动静分离检测追踪算法,在点云连续帧融合产线实现提效 30%以上,迭代优化点云分割算法和地面检测算法,在点云分割产线实现提效 20%以上。

而为进一步支撑自主品牌车企的国际化战略,公司在全球范围内扩展了道路采集业务,可提供包括采集方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。

2024年上半年,公司采集业务已覆盖包括德国、西班牙、捷克等多个国家,为公司构建智能驾驶全球化数据服务能力奠定了基础。

在2022年财报中,其首次披露了智能驾驶业务收入情况:2022年,公司智能驾驶业务收入4174.51 万元,同比增长115.12%; 但在后续的2023年年报和2024年半年报中均未明确披露。不过其在2023年半年报中提到其智能驾驶业务收入同比增长178.96%。

不过2024年半年报中显示,根据合同分类来自计算机视觉业务的营收数据同比上一年同期的来看,呈现下滑趋势。

相关文章:

毛利超70%、超70+智驾客户,这家AI数据训练服务商刚刚止亏

AI训练数据服务第一股海天瑞声终于迎来了“曙光”。 日前,海天瑞声发布2024年半年报显示,上半年其实现营收9242.63万,同比增长24.13%;实现净利润41.64 万元,不过同比去年同期的亏损1724.14万元,扭亏为盈。…...

本地部署高颜值某抑云音乐播放器Splayer并实现无公网IP远程听歌

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…...

图像压缩编码(4)--H.26x系列视频压缩编码_2

目录 H.261 视频编码标准 H.261的编码与解码 1) 帧内/帧间编码 2)运动补偿 3)量化 4)环路滤波器 5)缓存器 压缩数据的分层 数据复用结构 H.264的编码与解码 H.261 视频编码标准 实际应用时,要求有…...

JS渲染锻炼输入表单

前言 上篇文章为大家展现了好看的信息窗口,接下来我们跟着流程图看下一步 之前我们的带点击事件已经添加完毕,下一步就是当用户点击的时候,渲染锻炼形式,当然这是一个标签,可以提供给用户输入锻炼形式 实例 ● 我…...

proteus仿真学习(1)

一,创建工程 一般选择默认模式,不配置pcb文件 可以选用芯片型号也可以不选 不选则从零开始布局,没有初始最小系统。选用则有初始最小系统以及基础的main函数 本次学习使用从零开始,不配置固件 二,上手软件 1.在元件…...

决策树+随机森林模型实现足球大小球让球预测软件

文章目录 前言一、决策树是什么?二、数据收集与整理1.数据收集2.数据清洗3.特征选择 三、决策树构建3.1绘制训练数据图像3.2 训练决策树模型3.3 依据模型绘制决策树的决策边界3.4 树模型可视化 四、模型预测五、随机森林模型总结 前言 之前搞足球数据分析的时候&…...

31省市农业地图大数据

1.北京市 谷类作物种植结构(万亩) 农作物种植结构(万亩) 2.天津市 谷类作物种植结构(万亩) 农作物种植结构(万亩) 3.黑龙江省 谷类作物种植结构(万亩) 农作物…...

http请求包含什么

HTTP请求通常包含以下几个主要部分: 请求行(Request Line): 包含请求方法(如 GET、POST、PUT、DELETE 等)、请求的目标 URI 和 HTTP 版本。例如:GET /index.html HTTP/1.1 请求头部(…...

【基础算法总结】模拟篇

目录 一,算法介绍二,算法原理和代码实现1576.替换所有的问号495.提莫攻击6.Z字形变换38.外观数列1419.数青蛙 三,算法总结 一,算法介绍 模拟算法本质就是"依葫芦画瓢",就是在题目中已经告诉了我们该如何操作…...

《深度学习》PyTorch 手写数字识别 案例解析及实现 <下>

目录 一、回顾神经网络框架 1、单层神经网络 2、多层神经网络 二、手写数字识别 1、续接上节课代码,如下所示 2、建立神经网络模型 输出结果: 3、设置训练集 4、设置测试集 5、创建损失函数、优化器 参数解析: 1)para…...

【笔记】材料分析测试:晶体学

晶体与晶体结构Crystal and Crystal Structure 1.晶体主要特征 固态物质可以分为晶态和非晶态两大类,分别称为晶体和非晶体。 晶体和非晶体在微观结构上的区别在于是否具有长程有序。 晶体(长程有序)非晶(短程有序&#xff09…...

飞塔Fortigate7.4.4的DNS劫持功能

基础网络配置、上网策略、与Server的VIP配置(略)。 在FortiGate上配置DNS Translation,将DNS请求结果为202.103.12.2的DNS响应报文中的IP地址修改为Server的内网IP 10.10.2.100。 config firewall dnstranslationedit 1set src 2.13.12.2set…...

Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】

Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】 目录 Unity 设计模式 之 行为型模式 -【状态模式】【观察者模式】【备忘录模式】 一、简单介绍 二、状态模式(State Pattern) 1、什么时候使用状态模式 2、使用状态模式的…...

【RabbitMQ】RabbitMQ 的概念以及使用RabbitMQ编写生产者消费者代码

目录 1. RabbitMQ 核心概念 1.1生产者和消费者 1.2 Connection和Channel 1.3 Virtual host 1.4 Queue 1.5 Exchange 1.6 RabbitMO工作流程 2. AMQP 3.RabbitMO快速入门 3.1.引入依赖 3.2.编写生产者代码 ​3.3.编写消费者代码 4.源码 1. RabbitMQ 核心概念 在安装…...

openmv与stm32通信

控制小车视觉循迹使用 OpenMV 往往是不够的。一般使用 OpenMV 对图像进行处理,将处理过后的数据使用串口发送给STM32,使用STM32控制小车行驶。本文主要讲解 OpenMV 模块与 STM32 间的串口通信以及两种循迹方案,分别是划分检测区域和线性回归。…...

C++ STL全面解析:六大核心组件之一----序列式容器(vector和List)(STL进阶学习)

目录 序列式容器 Vector vector概述 vector的迭代器 vector的数据结构 vector的构造和内存管理 vector的元素操作 List List概述 List的设计结构 List的迭代器 List的数据结构 List的内存构造 List的元素操作 C标准模板库(STL)是一组高效的…...

【c数据结构】OJ练习篇 帮你更深层次理解链表!(相交链表、相交链表、环形链表、环形链表之寻找环形入口点、判断链表是否是回文结构、 随机链表的复制)

目录 一. 相交链表 二. 环形链表 三. 环形链表之寻找环形入口点 四. 判断链表是否是回文结构 五. 随机链表的复制 一. 相交链表 最简单粗暴的思路,遍历两个链表,分别寻找是否有相同的对应的结点。 我们对两个链表的每个对应的节点进行判断比较&…...

微软开源GraphRAG的使用教程(最全,非常详细)

GraphRAG的介绍 目前微软已经开源了GraphRAG的完整项目代码。对于某一些LLM的下游任务则可以使用GraphRAG去增强自己业务的RAG的表现。项目给出了两种使用方式: 在打包好的项目状态下运行,可进行尝试使用。在源码基础上运行,适合为了下游任…...

使用Refine构建项目(1)初始化项目

要初始化一个空的Refine项目,你可以使用Refine提供的CLI工具create-refine-app。以下是初始化步骤: 使用npx命令: 在命令行中运行以下命令来创建一个新的Refine项目: npx create-refine-applatest my-refine-project这将引导你通过…...

【Docker】安装及使用

1. 安装Docker Desktop Docker Desktop是官方提供的桌面版Docker客户端,在Mac上使用Docker需要安装这个工具。 访问 Docker官方页面 并下载Docker Desktop for Mac。打开下载的.dmg文件,并拖动Docker图标到应用程序文件夹。安装完成后,打开…...

idea大量爆红问题解决

问题描述 在学习和工作中,idea是程序员不可缺少的一个工具,但是突然在有些时候就会出现大量爆红的问题,发现无法跳转,无论是关机重启或者是替换root都无法解决 就是如上所展示的问题,但是程序依然可以启动。 问题解决…...

Day131 | 灵神 | 回溯算法 | 子集型 子集

Day131 | 灵神 | 回溯算法 | 子集型 子集 78.子集 78. 子集 - 力扣(LeetCode) 思路: 笔者写过很多次这道题了,不想写题解了,大家看灵神讲解吧 回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 完…...

大语言模型如何处理长文本?常用文本分割技术详解

为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...

学校招生小程序源码介绍

基于ThinkPHPFastAdminUniApp开发的学校招生小程序源码,专为学校招生场景量身打造,功能实用且操作便捷。 从技术架构来看,ThinkPHP提供稳定可靠的后台服务,FastAdmin加速开发流程,UniApp则保障小程序在多端有良好的兼…...

佰力博科技与您探讨热释电测量的几种方法

热释电的测量主要涉及热释电系数的测定,这是表征热释电材料性能的重要参数。热释电系数的测量方法主要包括静态法、动态法和积分电荷法。其中,积分电荷法最为常用,其原理是通过测量在电容器上积累的热释电电荷,从而确定热释电系数…...

SiFli 52把Imagie图片,Font字体资源放在指定位置,编译成指定img.bin和font.bin的问题

分区配置 (ptab.json) img 属性介绍: img 属性指定分区存放的 image 名称,指定的 image 名称必须是当前工程生成的 binary 。 如果 binary 有多个文件,则以 proj_name:binary_name 格式指定文件名, proj_name 为工程 名&…...

动态 Web 开发技术入门篇

一、HTTP 协议核心 1.1 HTTP 基础 协议全称 :HyperText Transfer Protocol(超文本传输协议) 默认端口 :HTTP 使用 80 端口,HTTPS 使用 443 端口。 请求方法 : GET :用于获取资源,…...

免费PDF转图片工具

免费PDF转图片工具 一款简单易用的PDF转图片工具,可以将PDF文件快速转换为高质量PNG图片。无需安装复杂的软件,也不需要在线上传文件,保护您的隐私。 工具截图 主要特点 🚀 快速转换:本地转换,无需等待上…...

push [特殊字符] present

push 🆚 present 前言present和dismiss特点代码演示 push和pop特点代码演示 前言 在 iOS 开发中,push 和 present 是两种不同的视图控制器切换方式,它们有着显著的区别。 present和dismiss 特点 在当前控制器上方新建视图层级需要手动调用…...

uniapp手机号一键登录保姆级教程(包含前端和后端)

目录 前置条件创建uniapp项目并关联uniClound云空间开启一键登录模块并开通一键登录服务编写云函数并上传部署获取手机号流程(第一种) 前端直接调用云函数获取手机号(第三种)后台调用云函数获取手机号 错误码常见问题 前置条件 手机安装有sim卡手机开启…...