百度云智能媒体内容分析一体机(MCA)建设
导读 :本文主要介绍了百度智能云MCA产品的概念和应用。
媒体信息海量且复杂,采用人工的方式对视频进行分析处理,面临着效率低、成本高的困难。于是,MCA应运而生。它基于百度自研的视觉AI、ASR、NLP技术,为用户提供音视频、图片、文本的内容分析能力,实现标签提取、智能封面提取、高光片段分析等功能。
01 背景与目标
对于涉及广电新闻、娱乐社交等UGC、AIGC的企业来说,有效地收集、整理、分析和呈现视频内容,不仅能帮助企业在竞争中拔得头筹,还有利于做出更优的业务决策。可是,这会面临一些挑战:
-
标签要覆盖大量业务场景,否则就需要建设多个数据集,不易于统计和分析;
-
分析维度应支持自由配置,否则无法满足个性化的业务需求;
-
支持分析不同格式的媒体内容,同时,处理视频的速度要快。
百度智能云媒体内容分析(Media Content Analysis),就是为了帮助企业提高内容分析的效率、缩减平台的人力成本,而建设的一体机产品:
MCA将AI技术落地于媒体行业内容分析场景,可以助力企业内容推荐与搜索业务发展,赋能媒体行业,助力产业升级。
02 技术方案
根据公开信息可知,MCA的定位是“实现智能媒体内容分析的一体机产品”,用户可以选择公有云或私有化的部署方式,自定义配置内容分析的维度,并呈现可视化的分析结果。
AI技术托底(大模型):MCA借助百度强大的 AI 技术、沉淀已久的海量级数据,针对视频场景进行专门的优化,可以达到最优的识别效果。
影视综知识图谱(业内领先):根据影视剧/综艺类视频的场景、人脸、标题等内容,推理返回剧集名称、别称、演员表、一句话简介、上映时间、地点等信息,帮助补充视频标签。
公众人脸库(专业):基于百度百科的海量人脸数据,收录了领导人、艺术家、影视明星、体育明星、社会活动家等国内外公众人物,总数量超70万。
召回率提升(高效):对比人工浏览视频内容标注出的视频标签的数量,使用视频内容分析MCA的结构化标签数量提升了10倍左右,能够准确描述视频中的细节内容、提升视频的搜全率。
2.1 整体架构
按照功能划分,MCA的层级架构如图所示:
业务系统的核心功能如图所示:
MCA产品的主要功能如下:
a. 智能视频标签:为视频文件或直播流的内容打标签,可输出视频的场景、公众人物、地点、实体和关键词等结构化标签信息;
b. 智能图片标签:对图片内容进行打标签,可输出图片中公众人物、logo、实体和关键词等结构化标签信息;
c. 智能封面:通过对视频、图像等内容理解,从图像清晰度、构图美学和精彩程度等方面分析,生成视频的静态封面、动态封面、视频封面;
d. 精彩视频分析:通过场景切分、音频特征分析等技术,提取影视综长视频中的高光时刻。
2.2 技术实现的细节阐释
登录百度智能云平台官网,进入“一念 > 内容分析”产品页面。
2.2.1 智能标签
登录成功、进入产品页面后,进入智能标签 > 视频内容分析,点击“创建视频内容分析”,创建分析任务。
MCA支持三种视频导入方式:本地文件导入、BOS 地址导入、在线地址导入。
输入限制:
文件格式:3gpp、asf/wmv、avi、flv/f4v、mkv、mov/mp4/m4a、mp3、mp2、mpeg/mpg、ts/ogg、mts、wmv/wma、rm/rmvb、webm等;
视频编码标准:H.264、H.263/H.263+、MPEG-1/2/4、VP8/9、Quicktime、RealVideo、WMV、MJPEG等;
音频编码标准:MP1、MP2、MP3、AAC、AC-3、WMA、PCM、ADPCM、AMR、RealAudio、Vorbis、DSD等;
分析时长6小时以内,分辨率大于30X30;
分析视频的audio、video编码信息须至少存在一个,不能为空;
可批量上传音视频文件,最多可同时上传20个文件。
分析过程中可以看到分析状态(排队中→分析中→分析完成/分析失败)。如果分析失败,可以将鼠标移到分析失败旁边的图标上查看失败原因。若分析完成,则可查看分析结果。
点击分析完成视频的“查看详情”按钮,即可查看视频分析的结果.
右侧的页签可以查看不同维度的中间分析结果,下侧为标签提取结果。
2.2.2 智能封面
开启后,系统将结合清晰度、人脸、构图、场景识别等特征信息,综合输出视频中适合做封面的图片。
点击智能封面分析,进入智能封面分析页面。
点击创建智能封面分析,创建分析任务。
分析过程中可以看到分析状态(排队中→分析中→分析完成/分析失败)。
点击分析完成视频的“查看详情”按钮,即可查看视频的封面结果。
2.2.3 精彩视频分析
登录成功、进入产品页面后,点击精彩视频分析,进入精彩视频分析页面。
点击创建精彩视频分析,创建分析任务。
分析过程中可以看到分析状态(排队中→分析中→分析完成)。
分析完成后,点击“查看详情”按钮,即查看视频的精彩片段。
2.2.4 自定义库
系统支持自定义LOGO库与自定义人脸库、自定义文本库功能。
自定义人脸库,区别于公共人物库,目的在于可以让客户管理自身业务所需的人脸集,是公共库的重要补充。
-
人脸照片的要求:正面的(证件照类型的正面)或微微侧面的(五官显示完整)、面部光线均匀(轮廓清晰,无口罩、帽子、深色墨镜遮挡,无浓妆)。对于戴眼镜的人脸,眼镜框不可遮挡眼睛区域,镜片应无色或不严重反光。
-
画质:画质清晰、面部区域不要有字幕、水印等遮挡物。
-
数量:一个人物需要5张左右照片。
自定义人脸库的关系如下:
支持用户配置自定义LOGO库,并绑定在模板上。
自定义文本库创建后,用户可选择将其关联为黑库或白库。
03 总结
在大模型的加持下,MCA能够更好地帮助企业降本增效:
-
业务提效:对比人工浏览视频内容标注出的视频标签,使用媒体内容分析 MCA 可提升 3~5 倍的分析效率。
-
部署灵活:可通过SaaS、API接口调用、私有化部署的方式接入MCA服务,轻松适配多种业务场景,满足企业各种业务需求,能快速实现集成和落地。
-
管理便捷:支持创建普通用户和超级管理员用户,普通用户仅能使用产品功能,不具备用户管理权限,超级管理员用户具备用户管理权限;不同用户之前的视频分析历史任务可以互相隔离。
————END————
推荐阅读
产品分享|百度智能云旗下,作为“行业首创”的媒体内容分析MCA是什么_智能媒体分析-CSDN博客
干货分享|视频的结构化标签问题_长视频内容结构化标签-CSDN博客
玩转百度云 AI 服务:成为海量视频的超级管理员!-CSDN博客
相关文章:

百度云智能媒体内容分析一体机(MCA)建设
导读 :本文主要介绍了百度智能云MCA产品的概念和应用。 媒体信息海量且复杂,采用人工的方式对视频进行分析处理,面临着效率低、成本高的困难。于是,MCA应运而生。它基于百度自研的视觉AI、ASR、NLP技术,为用户提供音视…...

笔记本电脑部署VMware ESXi 6.0系统
正文共:888 字 18 图,预估阅读时间:1 分钟 前面我们介绍了在笔记本上安装Windows 11操作系统(Windows 11升级不了?但Win10就要停服了啊!来,我教你!),也介绍了…...

k8s 中间件
1. zookeeper 是的,Zookeeper 和 Kafka 经常一起使用,Zookeeper 在 Kafka 中扮演了关键角色。以下是 Zookeeper 和 Kafka 在实际项目中的结合使用及其作用的详细说明。 项目背景 假设我们有一个分布式数据处理系统,该系统需要高吞吐量的实…...
如何 提升需求确定性
提升需求确定性是确保项目成功的关键之一。以下是一些方法和策略可以帮助你提升需求的确定性: 积极的利益相关者参与: 确保所有关键利益相关者(包括最终用户、业务所有者、开发团队等)参与需求收集和确认过程。他们的参与可以提供…...

探索Sui的面向对象模型和Move编程语言
Sui区块链作为一种新兴的一层协议(L1),采用先进技术来解决常见的一层协议权衡问题。Cointelegraph Research详细剖析了这一区块链新秀。 Sui使用Move编程语言,该语言专注于资产表示和访问控制。本文探讨了Sui的对象中心数据存储模…...

【vue动态组件】VUE使用component :is 实现在多个组件间来回切换
VUE使用component :is 实现在多个组件间来回切换 component :is 动态父子组件传值 相关代码实现: <component:is"vuecomponent"></component>import componentA from xxx; import componentB from xxx; import componentC from xxx;switch(…...

springboot dynamic配置多数据源
pom.xml引入jar包 <dependency><groupId>com.baomidou</groupId><artifactId>dynamic-datasource-spring-boot-starter</artifactId><version>3.5.2</version> </dependency> application配置文件配置如下 需要主要必须配置…...

线性代数知识点搜刮
求你别考太细... 目录 异乘变零定理 行列式转置 值不变 重要关系 中间相等,取两头 特征值公式 向量正交 点积为0 拉普拉斯定理 矩阵的秩 特征值和特征向量 |A|特征值的乘积 & tr(A)特征值的和 要记要背 增广矩阵 异乘变零定理 某行(…...

景区智能厕所系统,打造智能化,人性化公共空间
在智慧旅游的大潮中,景区智能厕所系统正逐渐成为提升公共空间智能化、人性化水平的关键载体。作为智慧城市建设的重要组成部分,智能厕所系统不仅解决了传统公厕存在的诸多问题,更通过科技的力量,为游客创造了更加舒适、便捷的如厕…...

Windows中Git的使用(2024最新版)
Windows中Git的使用 获取ssh keys本地绑定邮箱初始化本地仓库添加到本地缓存区提交到本地缓存区切换本地分支为main关联远程分支推送到GitHub查看推送日志 Git 2020年发布了新的默认分支名称"main",取代了"master"作为主分支的名称。操作有了些…...

【pytorch12】什么是梯度
说明 导数偏微分梯度 梯度:是一个向量,向量的每一个轴是每一个方向上的偏微分 梯度是有方向也有大小,梯度的方向代表函数在当前点的一个增长的方向,然后这个向量的长度代表了这个点增长的速率 蓝色代表比较小的值,红色…...

南京,协同开展“人工智能+”行动
南京,作为江苏省的省会城市,一直以来都是科技创新和产业发展的高地。近日,南京市政府正式印发了《南京市进一步促进人工智能创新发展行动计划(2024—2026 年)》和《南京市促进人工智能创新发展若干政策措施》的“11”文…...

Selenium IDE 的使用指南
Selenium IDE 的使用指南 在自动化测试的领域中,Selenium 是一个广为人知且强大的工具集。而 Selenium IDE 作为其中的一个组件,为测试人员提供了一种便捷且直观的方式来创建和执行自动化测试脚本。 一、Selenium IDE 简介 Selenium IDE 是一个用于录…...

vue配置sql规则
vue配置sql规则 实现效果组件完整代码父组件 前端页面实现动态配置sql条件,将JSON结构给到后端,后端进行sql组装。 这里涉及的分组后端在组装时用括号将这块规则括起来就行,分组的sql连接符(并且/或者)取组里的第一个。…...
面试官:Redis执行lua脚本能保证原子性吗?
核心问题 Redis执行lua脚本是否能确保原子性? 面试经历 面试者在面试中自信回答Redis执行lua脚本能保证原子性,但未能深入解释原因。 原子性概念 原子性:一个事务的所有命令要么全部执行成功,要么全部执行失败。 Redis官方说…...
基于Chrome扩展的浏览器可信事件与网页离线PDF导出
基于Chrome扩展的浏览器可信事件与网页离线PDF导出 Chrome扩展是一种可以在浏览器中添加新功能和修改浏览器行为的软件程序,我们可以基于Manifest规范的API实现对于浏览器和Web页面在一定程度上的修改,例如广告拦截、代理控制等。Chrome DevTools Proto…...

马拉松报名小程序的设计
管理员账户功能包括:系统首页,个人中心,用户管理,赛事信息管理,赛事报名管理,活动商城管理,留言板管理,系统管理 微信端账号功能包括:系统首页,赛事信息&…...

python使用pywebview集成vue3和element-plus开发桌面系统框架
随着web技术越来越成熟,就连QQ的windows客户端都用web技术来开发,所以在未来,web技术来开发windows桌面软件也会越来越多,所以在此发展驱动之下,将最近流程的python与web技术相结合,使用vue3和element-plus…...
C++线程的使用
C11之前,C语言没有对并发编程提供语言级别的支持,这使得我们在编写可移植的并发程序时,存在诸多的不便。现在C11中增加了线程以及线程相关的类,很方便地支持了并发编程,使得编写的多线程程序的可移植性得到了很大的提高…...

算法库应用--寻找最长麦穗
学习贺利坚老师算法库 数据结构例程——串的顺序存储应用_使用顺序串存储身份证号-CSDN博客 本人详细解析博客 串的顺序存储的应用实例二_串的顺序存储应用-CSDN博客 版本更新日志 V1.0: 在原有的基础上, 进行优化名字, 并且有了相应的算法库作为支撑, 我使用了for循环来代替老…...
C++:std::is_convertible
C++标志库中提供is_convertible,可以测试一种类型是否可以转换为另一只类型: template <class From, class To> struct is_convertible; 使用举例: #include <iostream> #include <string>using namespace std;struct A { }; struct B : A { };int main…...

Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件
今天呢,博主的学习进度也是步入了Java Mybatis 框架,目前正在逐步杨帆旗航。 那么接下来就给大家出一期有关 Mybatis 逆向工程的教学,希望能对大家有所帮助,也特别欢迎大家指点不足之处,小生很乐意接受正确的建议&…...

转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...
spring:实例工厂方法获取bean
spring处理使用静态工厂方法获取bean实例,也可以通过实例工厂方法获取bean实例。 实例工厂方法步骤如下: 定义实例工厂类(Java代码),定义实例工厂(xml),定义调用实例工厂ÿ…...
Spring Boot面试题精选汇总
🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息 文章目录 Spring Boot面试题精选汇总⚙️ **一、核心概…...

NFT模式:数字资产确权与链游经济系统构建
NFT模式:数字资产确权与链游经济系统构建 ——从技术架构到可持续生态的范式革命 一、确权技术革新:构建可信数字资产基石 1. 区块链底层架构的进化 跨链互操作协议:基于LayerZero协议实现以太坊、Solana等公链资产互通,通过零知…...

JUC笔记(上)-复习 涉及死锁 volatile synchronized CAS 原子操作
一、上下文切换 即使单核CPU也可以进行多线程执行代码,CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短,所以CPU会不断地切换线程执行,从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...

论文笔记——相干体技术在裂缝预测中的应用研究
目录 相关地震知识补充地震数据的认识地震几何属性 相干体算法定义基本原理第一代相干体技术:基于互相关的相干体技术(Correlation)第二代相干体技术:基于相似的相干体技术(Semblance)基于多道相似的相干体…...
LRU 缓存机制详解与实现(Java版) + 力扣解决
📌 LRU 缓存机制详解与实现(Java版) 一、📖 问题背景 在日常开发中,我们经常会使用 缓存(Cache) 来提升性能。但由于内存有限,缓存不可能无限增长,于是需要策略决定&am…...
Kubernetes 网络模型深度解析:Pod IP 与 Service 的负载均衡机制,Service到底是什么?
Pod IP 的本质与特性 Pod IP 的定位 纯端点地址:Pod IP 是分配给 Pod 网络命名空间的真实 IP 地址(如 10.244.1.2)无特殊名称:在 Kubernetes 中,它通常被称为 “Pod IP” 或 “容器 IP”生命周期:与 Pod …...