百度云智能媒体内容分析一体机(MCA)建设
导读 :本文主要介绍了百度智能云MCA产品的概念和应用。
媒体信息海量且复杂,采用人工的方式对视频进行分析处理,面临着效率低、成本高的困难。于是,MCA应运而生。它基于百度自研的视觉AI、ASR、NLP技术,为用户提供音视频、图片、文本的内容分析能力,实现标签提取、智能封面提取、高光片段分析等功能。
01 背景与目标
对于涉及广电新闻、娱乐社交等UGC、AIGC的企业来说,有效地收集、整理、分析和呈现视频内容,不仅能帮助企业在竞争中拔得头筹,还有利于做出更优的业务决策。可是,这会面临一些挑战:
-
标签要覆盖大量业务场景,否则就需要建设多个数据集,不易于统计和分析;
-
分析维度应支持自由配置,否则无法满足个性化的业务需求;
-
支持分析不同格式的媒体内容,同时,处理视频的速度要快。
百度智能云媒体内容分析(Media Content Analysis),就是为了帮助企业提高内容分析的效率、缩减平台的人力成本,而建设的一体机产品:

MCA将AI技术落地于媒体行业内容分析场景,可以助力企业内容推荐与搜索业务发展,赋能媒体行业,助力产业升级。
02 技术方案
根据公开信息可知,MCA的定位是“实现智能媒体内容分析的一体机产品”,用户可以选择公有云或私有化的部署方式,自定义配置内容分析的维度,并呈现可视化的分析结果。
AI技术托底(大模型):MCA借助百度强大的 AI 技术、沉淀已久的海量级数据,针对视频场景进行专门的优化,可以达到最优的识别效果。
影视综知识图谱(业内领先):根据影视剧/综艺类视频的场景、人脸、标题等内容,推理返回剧集名称、别称、演员表、一句话简介、上映时间、地点等信息,帮助补充视频标签。
公众人脸库(专业):基于百度百科的海量人脸数据,收录了领导人、艺术家、影视明星、体育明星、社会活动家等国内外公众人物,总数量超70万。
召回率提升(高效):对比人工浏览视频内容标注出的视频标签的数量,使用视频内容分析MCA的结构化标签数量提升了10倍左右,能够准确描述视频中的细节内容、提升视频的搜全率。
2.1 整体架构
按照功能划分,MCA的层级架构如图所示:

业务系统的核心功能如图所示:

MCA产品的主要功能如下:
a. 智能视频标签:为视频文件或直播流的内容打标签,可输出视频的场景、公众人物、地点、实体和关键词等结构化标签信息;
b. 智能图片标签:对图片内容进行打标签,可输出图片中公众人物、logo、实体和关键词等结构化标签信息;
c. 智能封面:通过对视频、图像等内容理解,从图像清晰度、构图美学和精彩程度等方面分析,生成视频的静态封面、动态封面、视频封面;
d. 精彩视频分析:通过场景切分、音频特征分析等技术,提取影视综长视频中的高光时刻。
2.2 技术实现的细节阐释
登录百度智能云平台官网,进入“一念 > 内容分析”产品页面。
2.2.1 智能标签
登录成功、进入产品页面后,进入智能标签 > 视频内容分析,点击“创建视频内容分析”,创建分析任务。

MCA支持三种视频导入方式:本地文件导入、BOS 地址导入、在线地址导入。

输入限制:
文件格式:3gpp、asf/wmv、avi、flv/f4v、mkv、mov/mp4/m4a、mp3、mp2、mpeg/mpg、ts/ogg、mts、wmv/wma、rm/rmvb、webm等;
视频编码标准:H.264、H.263/H.263+、MPEG-1/2/4、VP8/9、Quicktime、RealVideo、WMV、MJPEG等;
音频编码标准:MP1、MP2、MP3、AAC、AC-3、WMA、PCM、ADPCM、AMR、RealAudio、Vorbis、DSD等;
分析时长6小时以内,分辨率大于30X30;
分析视频的audio、video编码信息须至少存在一个,不能为空;
可批量上传音视频文件,最多可同时上传20个文件。
分析过程中可以看到分析状态(排队中→分析中→分析完成/分析失败)。如果分析失败,可以将鼠标移到分析失败旁边的图标上查看失败原因。若分析完成,则可查看分析结果。

点击分析完成视频的“查看详情”按钮,即可查看视频分析的结果.

右侧的页签可以查看不同维度的中间分析结果,下侧为标签提取结果。

2.2.2 智能封面
开启后,系统将结合清晰度、人脸、构图、场景识别等特征信息,综合输出视频中适合做封面的图片。

点击智能封面分析,进入智能封面分析页面。

点击创建智能封面分析,创建分析任务。

分析过程中可以看到分析状态(排队中→分析中→分析完成/分析失败)。

点击分析完成视频的“查看详情”按钮,即可查看视频的封面结果。


2.2.3 精彩视频分析
登录成功、进入产品页面后,点击精彩视频分析,进入精彩视频分析页面。

点击创建精彩视频分析,创建分析任务。

分析过程中可以看到分析状态(排队中→分析中→分析完成)。
分析完成后,点击“查看详情”按钮,即查看视频的精彩片段。


2.2.4 自定义库
系统支持自定义LOGO库与自定义人脸库、自定义文本库功能。

自定义人脸库,区别于公共人物库,目的在于可以让客户管理自身业务所需的人脸集,是公共库的重要补充。
-
人脸照片的要求:正面的(证件照类型的正面)或微微侧面的(五官显示完整)、面部光线均匀(轮廓清晰,无口罩、帽子、深色墨镜遮挡,无浓妆)。对于戴眼镜的人脸,眼镜框不可遮挡眼睛区域,镜片应无色或不严重反光。
-
画质:画质清晰、面部区域不要有字幕、水印等遮挡物。
-
数量:一个人物需要5张左右照片。
自定义人脸库的关系如下:

支持用户配置自定义LOGO库,并绑定在模板上。

自定义文本库创建后,用户可选择将其关联为黑库或白库。

03 总结
在大模型的加持下,MCA能够更好地帮助企业降本增效:
-
业务提效:对比人工浏览视频内容标注出的视频标签,使用媒体内容分析 MCA 可提升 3~5 倍的分析效率。
-
部署灵活:可通过SaaS、API接口调用、私有化部署的方式接入MCA服务,轻松适配多种业务场景,满足企业各种业务需求,能快速实现集成和落地。
-
管理便捷:支持创建普通用户和超级管理员用户,普通用户仅能使用产品功能,不具备用户管理权限,超级管理员用户具备用户管理权限;不同用户之前的视频分析历史任务可以互相隔离。
————END————
推荐阅读
产品分享|百度智能云旗下,作为“行业首创”的媒体内容分析MCA是什么_智能媒体分析-CSDN博客
干货分享|视频的结构化标签问题_长视频内容结构化标签-CSDN博客
玩转百度云 AI 服务:成为海量视频的超级管理员!-CSDN博客
相关文章:
百度云智能媒体内容分析一体机(MCA)建设
导读 :本文主要介绍了百度智能云MCA产品的概念和应用。 媒体信息海量且复杂,采用人工的方式对视频进行分析处理,面临着效率低、成本高的困难。于是,MCA应运而生。它基于百度自研的视觉AI、ASR、NLP技术,为用户提供音视…...
笔记本电脑部署VMware ESXi 6.0系统
正文共:888 字 18 图,预估阅读时间:1 分钟 前面我们介绍了在笔记本上安装Windows 11操作系统(Windows 11升级不了?但Win10就要停服了啊!来,我教你!),也介绍了…...
k8s 中间件
1. zookeeper 是的,Zookeeper 和 Kafka 经常一起使用,Zookeeper 在 Kafka 中扮演了关键角色。以下是 Zookeeper 和 Kafka 在实际项目中的结合使用及其作用的详细说明。 项目背景 假设我们有一个分布式数据处理系统,该系统需要高吞吐量的实…...
如何 提升需求确定性
提升需求确定性是确保项目成功的关键之一。以下是一些方法和策略可以帮助你提升需求的确定性: 积极的利益相关者参与: 确保所有关键利益相关者(包括最终用户、业务所有者、开发团队等)参与需求收集和确认过程。他们的参与可以提供…...
探索Sui的面向对象模型和Move编程语言
Sui区块链作为一种新兴的一层协议(L1),采用先进技术来解决常见的一层协议权衡问题。Cointelegraph Research详细剖析了这一区块链新秀。 Sui使用Move编程语言,该语言专注于资产表示和访问控制。本文探讨了Sui的对象中心数据存储模…...
【vue动态组件】VUE使用component :is 实现在多个组件间来回切换
VUE使用component :is 实现在多个组件间来回切换 component :is 动态父子组件传值 相关代码实现: <component:is"vuecomponent"></component>import componentA from xxx; import componentB from xxx; import componentC from xxx;switch(…...
springboot dynamic配置多数据源
pom.xml引入jar包 <dependency><groupId>com.baomidou</groupId><artifactId>dynamic-datasource-spring-boot-starter</artifactId><version>3.5.2</version> </dependency> application配置文件配置如下 需要主要必须配置…...
线性代数知识点搜刮
求你别考太细... 目录 异乘变零定理 行列式转置 值不变 重要关系 中间相等,取两头 特征值公式 向量正交 点积为0 拉普拉斯定理 矩阵的秩 特征值和特征向量 |A|特征值的乘积 & tr(A)特征值的和 要记要背 增广矩阵 异乘变零定理 某行(…...
景区智能厕所系统,打造智能化,人性化公共空间
在智慧旅游的大潮中,景区智能厕所系统正逐渐成为提升公共空间智能化、人性化水平的关键载体。作为智慧城市建设的重要组成部分,智能厕所系统不仅解决了传统公厕存在的诸多问题,更通过科技的力量,为游客创造了更加舒适、便捷的如厕…...
Windows中Git的使用(2024最新版)
Windows中Git的使用 获取ssh keys本地绑定邮箱初始化本地仓库添加到本地缓存区提交到本地缓存区切换本地分支为main关联远程分支推送到GitHub查看推送日志 Git 2020年发布了新的默认分支名称"main",取代了"master"作为主分支的名称。操作有了些…...
【pytorch12】什么是梯度
说明 导数偏微分梯度 梯度:是一个向量,向量的每一个轴是每一个方向上的偏微分 梯度是有方向也有大小,梯度的方向代表函数在当前点的一个增长的方向,然后这个向量的长度代表了这个点增长的速率 蓝色代表比较小的值,红色…...
南京,协同开展“人工智能+”行动
南京,作为江苏省的省会城市,一直以来都是科技创新和产业发展的高地。近日,南京市政府正式印发了《南京市进一步促进人工智能创新发展行动计划(2024—2026 年)》和《南京市促进人工智能创新发展若干政策措施》的“11”文…...
Selenium IDE 的使用指南
Selenium IDE 的使用指南 在自动化测试的领域中,Selenium 是一个广为人知且强大的工具集。而 Selenium IDE 作为其中的一个组件,为测试人员提供了一种便捷且直观的方式来创建和执行自动化测试脚本。 一、Selenium IDE 简介 Selenium IDE 是一个用于录…...
vue配置sql规则
vue配置sql规则 实现效果组件完整代码父组件 前端页面实现动态配置sql条件,将JSON结构给到后端,后端进行sql组装。 这里涉及的分组后端在组装时用括号将这块规则括起来就行,分组的sql连接符(并且/或者)取组里的第一个。…...
面试官:Redis执行lua脚本能保证原子性吗?
核心问题 Redis执行lua脚本是否能确保原子性? 面试经历 面试者在面试中自信回答Redis执行lua脚本能保证原子性,但未能深入解释原因。 原子性概念 原子性:一个事务的所有命令要么全部执行成功,要么全部执行失败。 Redis官方说…...
基于Chrome扩展的浏览器可信事件与网页离线PDF导出
基于Chrome扩展的浏览器可信事件与网页离线PDF导出 Chrome扩展是一种可以在浏览器中添加新功能和修改浏览器行为的软件程序,我们可以基于Manifest规范的API实现对于浏览器和Web页面在一定程度上的修改,例如广告拦截、代理控制等。Chrome DevTools Proto…...
马拉松报名小程序的设计
管理员账户功能包括:系统首页,个人中心,用户管理,赛事信息管理,赛事报名管理,活动商城管理,留言板管理,系统管理 微信端账号功能包括:系统首页,赛事信息&…...
python使用pywebview集成vue3和element-plus开发桌面系统框架
随着web技术越来越成熟,就连QQ的windows客户端都用web技术来开发,所以在未来,web技术来开发windows桌面软件也会越来越多,所以在此发展驱动之下,将最近流程的python与web技术相结合,使用vue3和element-plus…...
C++线程的使用
C11之前,C语言没有对并发编程提供语言级别的支持,这使得我们在编写可移植的并发程序时,存在诸多的不便。现在C11中增加了线程以及线程相关的类,很方便地支持了并发编程,使得编写的多线程程序的可移植性得到了很大的提高…...
算法库应用--寻找最长麦穗
学习贺利坚老师算法库 数据结构例程——串的顺序存储应用_使用顺序串存储身份证号-CSDN博客 本人详细解析博客 串的顺序存储的应用实例二_串的顺序存储应用-CSDN博客 版本更新日志 V1.0: 在原有的基础上, 进行优化名字, 并且有了相应的算法库作为支撑, 我使用了for循环来代替老…...
HTML 语义化
目录 HTML 语义化HTML5 新特性HTML 语义化的好处语义化标签的使用场景最佳实践 HTML 语义化 HTML5 新特性 标准答案: 语义化标签: <header>:页头<nav>:导航<main>:主要内容<article>&#x…...
【Linux】shell脚本忽略错误继续执行
在 shell 脚本中,可以使用 set -e 命令来设置脚本在遇到错误时退出执行。如果你希望脚本忽略错误并继续执行,可以在脚本开头添加 set e 命令来取消该设置。 举例1 #!/bin/bash# 取消 set -e 的设置 set e# 执行命令,并忽略错误 rm somefile…...
k8s从入门到放弃之Ingress七层负载
k8s从入门到放弃之Ingress七层负载 在Kubernetes(简称K8s)中,Ingress是一个API对象,它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress,你可…...
Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例
使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...
可靠性+灵活性:电力载波技术在楼宇自控中的核心价值
可靠性灵活性:电力载波技术在楼宇自控中的核心价值 在智能楼宇的自动化控制中,电力载波技术(PLC)凭借其独特的优势,正成为构建高效、稳定、灵活系统的核心解决方案。它利用现有电力线路传输数据,无需额外布…...
Java-41 深入浅出 Spring - 声明式事务的支持 事务配置 XML模式 XML+注解模式
点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) 目前2025年06月05日更新到: AI炼丹日志-28 - Aud…...
python爬虫:Newspaper3k 的详细使用(好用的新闻网站文章抓取和解析的Python库)
更多内容请见: 爬虫和逆向教程-专栏介绍和目录 文章目录 一、Newspaper3k 概述1.1 Newspaper3k 介绍1.2 主要功能1.3 典型应用场景1.4 安装二、基本用法2.2 提取单篇文章的内容2.2 处理多篇文档三、高级选项3.1 自定义配置3.2 分析文章情感四、实战案例4.1 构建新闻摘要聚合器…...
【python异步多线程】异步多线程爬虫代码示例
claude生成的python多线程、异步代码示例,模拟20个网页的爬取,每个网页假设要0.5-2秒完成。 代码 Python多线程爬虫教程 核心概念 多线程:允许程序同时执行多个任务,提高IO密集型任务(如网络请求)的效率…...
汇编常见指令
汇编常见指令 一、数据传送指令 指令功能示例说明MOV数据传送MOV EAX, 10将立即数 10 送入 EAXMOV [EBX], EAX将 EAX 值存入 EBX 指向的内存LEA加载有效地址LEA EAX, [EBX4]将 EBX4 的地址存入 EAX(不访问内存)XCHG交换数据XCHG EAX, EBX交换 EAX 和 EB…...
【Go语言基础【12】】指针:声明、取地址、解引用
文章目录 零、概述:指针 vs. 引用(类比其他语言)一、指针基础概念二、指针声明与初始化三、指针操作符1. &:取地址(拿到内存地址)2. *:解引用(拿到值) 四、空指针&am…...
