当前位置: 首页 > news >正文

基于海思soc的智能产品开发(图像处理的几种需求)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】

        对于一个嵌入式设备来说,如果上面有一个camera,那么就可以有很多的用途。简单的用途就是拍照,比拍照更多一点的就是视频。视频本身可以看成是多个图片之间的组合。采集好了图像,或者视频,是通过网络送出去和别人分享,还是进一步从图像中提取信息,这里面又会分成很多的专业。所以,我们简单归纳一下,图像本身可以分成这几个方向,

1、纯图像处理

        这种纯图像处理,本身应用也是很多的。除了简单的儿童相机拍照之外,还有工业相机拍照、医疗拍照等等。甚至于现在随着内窥镜的发展,很多宠物医疗的检测和诊断,都是需要进行拍照处理的。这部分图像处理,绝不仅仅是大家看到的消费级拍照而已。

        对于拍照的处理,硬件方面可以通过cpu或者是fpga来处理。如果是软件的话,可以qt写一个界面,通过opencv开源算法,或者是自定义的算法来处理也可以的。自身能力存在限制,也可以通过采购halcon等软件来补足。

2、视频处理

        一般来说,视频分成了视频编码和视频解码。当前,用的最多的视频编码方法就是h264、h265。两者对算力要求都非常高,特别是编码。所以,要想实现实时编码,大部分都要借助于soc自身的ip硬加速来实现的。开源库方面则是采用ffmpeg软件,很少自己从0到1去做。

        当然,ffmpeg不仅仅是视频编解码,它还可以做音频的编解码。有兴趣的同学,可以一起学一下音频开发。通常情况下,我们都是采用ffmpeg的框架,然后替换成硬件加速的api,根据客户的需求去编写对应的软件,这是一般的开发思路。

3、网络处理

        随着聊天、直播工具的流行,如何把实时生成的视频送出去,也是目前比较热的一个需求。这方面,有很多的协议,比如说安放上面用的比较多的rtsp协议。除了通讯协议,还有图像特效,比如说美颜、瘦脸、美白、虚拟装饰等等,这方面的需求层出不穷,有兴趣的同学可以好好关注一下。

4、AI应用

        上面的三种相对来说,都是偏传统一点。除了这几样,目前最为火爆的应该就是AI应用。当然大部分的应用更多是一种推广和营销,真正能够落地的还是那几个方面,比如汽车辅助驾驶、人脸识别、车牌识别、ocr识别等等。这些应用都是通过AI技术能够真正落地、发挥效果、改善效率的好工具。

        另外,还有一个比较可喜的现象就是,随着汽车辅助驾驶的普及,相关的算力硬件也是越来越强,与此相比较,对应的价格却是越来越低。这方面,倒是给我们一个很大的机会。大家学习图像和视频的时候,一定要把AI放在一个突出的位置,未来这方面才是方向和发展的重点。

相关文章:

基于海思soc的智能产品开发(图像处理的几种需求)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 对于一个嵌入式设备来说,如果上面有一个camera,那么就可以有很多的用途。简单的用途就是拍照,比拍照更多一点的…...

【R语言】聚类分析

聚类分析是一种常用的无监督学习方法,是将所观测的事物或者指标进行分类的一种统计分析方法,其目的是通过辨认在某些特征上相似的事物,并将它们分成各种类别。R语言提供了多种聚类分析的方法和包。 方法优点缺点适用场景K-means计算效率高需…...

Spring 项目接入 DeepSeek,分享两种超简单的方式!

⭐自荐一个非常不错的开源 Java 面试指南:JavaGuide (Github 收获148k Star)。这是我在大三开始准备秋招面试的时候创建的,目前已经持续维护 6 年多了,累计提交了 5600 commit ,共有 550 多位贡献者共同参与…...

docker 进阶命令(基于Ubuntu)

数据卷 Volume: 目录映射, 目录挂载 匿名绑定: 匿名绑定的 volume 在容器删除的时候, 数据卷也会被删除, 匿名绑定是不能做到持久化的, 地址一般是 /var/lib/docker/volumes/xxxxx/_data 绑定卷时修改宿主机的目录或文件, 容器内的数据也会同步修改, 反之亦然 # 查看所有 vo…...

机器学习数学基础:29.t检验

t检验学习笔记 一、t检验的定义和用途 t检验是统计学中常用的假设检验方法,主要用于判断样本均值与总体均值间,或两个样本均值间是否存在显著差异。 在实际中应用广泛,例如在医学领域可用于比较两种药物的疗效;在教育领域&…...

HarmonyNext上传用户相册图片到服务器

图片选择就不用说了,直接用 无须申请权限 。 上传图片,步骤和android对比稍微有点复杂,可能是为了安全性考虑,需要将图片先拷贝到缓存目录下面,然后再上传,当然你也可以转成Base64,然后和服务…...

WebAssembly 3.0发布:浏览器端高性能计算迎来新突破!

“WebAssembly 3.0来了,浏览器端的高性能计算将彻底改变!”2025年,WebAssembly(Wasm)迎来了重大更新——WebAssembly 3.0正式发布。这次更新不仅支持多线程和SIMD指令集,还优化了内存管理,让浏览…...

计算机组成原理—— 外围设备(十三)

记住,伟大的成就往往诞生于无数次尝试和失败之后。每一次跌倒,都是为了让你学会如何更加坚定地站立;每一次迷茫,都是为了让你找到内心真正的方向。即使前路漫漫,即使困难重重,心中的火焰也不应熄灭。它代表…...

面试题之Vuex,sessionStorage,localStorage的区别

Vuex、localStorage 和 sessionStorage 都是用于存储数据的技术,但它们在存储范围、存储方式、应用场景等方面存在显著区别。以下是它们的详细对比: 1. 存储范围 Vuex: 是 Vue.js 的状态管理库,用于存储全局状态。 数据存储在内…...

window中git bash使用conda命令

window系统的终端cmd和linux不一样,运行不了.sh文件,为了在window中模仿linux,可以使用gui bash模拟linux的终端。为了在gui bash中使用python环境,由于python环境是在anaconda中创建的,所以需要在gui bash使用conda命…...

象棋掉落动画(局部旋转动画技巧)

1.被撞击阶段:根据被撞击速度,合理设置被撞距离 2.倒地阶段:象棋倒地的同时稍微前移 3.滚地阶段:象棋滚地后停止,在最后5帧内稍微回转一下。这里启用“PRS参数”的旋转来制作局部旋转动画...

Pycharm 2024在解释器提供的python控制台中运行py文件

2024版的界面发生了变化, run with python console搬到了这里:...

课题推荐:高空长航无人机多源信息高精度融合导航技术研究

高空长航无人机多源信息高精度融合导航技术的研究,具有重要的理论意义与应用价值。通过深入研究多源信息融合技术,可以有效提升无人机在高空复杂环境下的导航能力,为无人机的广泛应用提供强有力的技术支持。希望该课题能够得到重视和支持&…...

《DeepSeek训练算法:开启高效学习的新大门》

在人工智能的浪潮中,大语言模型的发展日新月异。DeepSeek作为其中的佼佼者,凭借其独特的训练算法和高效的学习能力,吸引了众多目光。今天,就让我们深入探究DeepSeek训练算法的独特之处,以及它是如何保证模型实现高效学…...

promise用法总结以及手写promise

JavaScript中的 Promise 是用于处理异步操作的对象,它代表了一个异步操作的最终完成(或失败)及其结果值。Promise 是异步编程的一种更简洁和更可读的方式,避免了回调地狱的问题。 Promise 的基本概念 一个 Promise 是一个表示异步…...

春招项目=图床+ k8s 控制台(唬人专用)

1. 春招伊始 马上要春招了,一个大气的项目(冲击波项目)直观重要,虽然大家都说基础很重要,但是一个足够新颖的项目完全可以把你的简历添加一个足够闪亮的点。 这就不得不推荐下我的 k8s 图床了,去年折腾快…...

Android 11.0 系统settings添加ab分区ota升级功能实现二

1.概述 在11.0的系统rom定制化开发中,在进行系统ota升级的功能中,在10.0以前都是使用系统 RecoverySystem的接口实现升级的,现在可以实现AB分区模式来进行ota升级的,但是 必须需要系统支持ab分区升级的模式才可以的,接下来分析下看怎么样进行ota升级功能实现 2.系统sett…...

【Spring+MyBatis】_图书管理系统(上篇)

目录 1. MyBatis与MySQL配置 1.1 创建数据库及数据表 1.2 配置MyBatis与数据库 1.2.1 增加MyBatis与MySQL相关依赖 1.2.2 配置application.yml文件 1.3 增加数据表对应实体类 2. 功能1:用户登录 2.1 约定前后端交互接口 2.2 后端接口 2.3 前端页面 2.4 单…...

什么是3D视觉无序抓取?

3D视觉无序抓取是一种结合三维视觉技术、机器人控制与智能算法的工业自动化解决方案,旨在实现机器人对散乱、无序堆放的物体进行自主识别、定位和抓取的操作。其核心是通过3D视觉系统获取物体的三维空间信息,结合路径规划与避障算法,引导机械臂完成高精度抓取任务,无需依赖…...

【Java】理解字符串拼接与数值运算的优先级

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: Java 文章目录 💯前言💯代码分析1. 第一句输出2. 第二句输出3. 第三句输出 💯关键概念与深入分析1. 字符串拼接的优先级2. 运算符的优先级与结合性3. 字符串拼接与数值运算的结合 &…...

CogVideoX-2b技术拆解:Web界面如何调用本地模型服务

CogVideoX-2b技术拆解:Web界面如何调用本地模型服务 1. 引言:从文字到视频的本地化创作 想象一下,你有一个创意想法,想要把它变成一段短视频。传统方式需要学习复杂的视频编辑软件,或者花费高价聘请专业团队。但现在…...

RubiCap框架:规则驱动的密集图像描述生成技术解析

1. 项目概述:当计算机学会"看图说话"在计算机视觉与自然语言处理的交叉领域,密集图像描述生成(Dense Image Captioning)一直是个既迷人又充满挑战的任务。与常规图像标注不同,它要求模型不仅能识别图中的主要…...

信息安全工程师-入侵检测系统核心原理与体系架构

一、引言(一)核心概念定义入侵检测系统(Intrusion Detection System, IDS)是网络安全纵深防御体系的核心组件,通过收集操作系统、网络流量、应用程序日志等多源信息,识别系统中违背安全策略或危及系统安全的…...

基于RAG的智能FAQ系统:从传统检索到语义理解的实战指南

1. 项目概述:从FAQ到智能对话的跃迁如果你负责过任何一个面向用户的网站、应用或服务,那么“FAQ”(常见问题解答)页面一定是你再熟悉不过的模块。它像一个永不疲倦的客服,试图用预设的问答来拦截80%的重复性咨询。但我…...

一站式管理6款米哈游游戏模组:XXMI Launcher终极指南

一站式管理6款米哈游游戏模组:XXMI Launcher终极指南 【免费下载链接】XXMI-Launcher Modding platform for GI, HSR, WW and ZZZ 项目地址: https://gitcode.com/gh_mirrors/xx/XXMI-Launcher 你是否厌倦了为每款米哈游游戏安装不同的模组管理器&#xff1f…...

Open UI5 源代码解析之1222:VariantManager.js

源代码仓库: https://github.com/SAP/openui5 源代码位置:src\sap.ui.fl\src\sap\ui\fl\variants\VariantManager.js VariantManager.js 详细分析 文件定位与总体判断 VariantManager.js 位于 sap.ui.fl 库下的 variants 目录。单看文件名,它像是一个普通的管理器;放进…...

Python脚本断点续传实战:openclaw-auto-resume-lite原理与应用

1. 项目概述与核心价值最近在折腾一些自动化脚本时,遇到了一个挺实际的问题:如何让一个长时间运行的任务,在意外中断后能自动恢复,而不是从头再来。这让我想起了之前用过的一个开源项目,叫openclaw-auto-resume-lite。…...

AI集成终端mediar-ai/terminator:下一代命令行智能辅助工具

1. 项目概述:一个面向未来的终端模拟器如果你和我一样,每天有超过一半的工作时间是在终端(Terminal)里度过的,那么你对终端模拟器的挑剔程度,可能不亚于程序员对键盘的选择。从早年经典的xterm、gnome-term…...

智能代码生成工具ReflexiCoder:强化学习驱动的开发革命

1. 项目背景与核心价值在软件开发领域,代码生成工具正逐渐从简单的模板填充演变为具备一定智能的辅助系统。传统代码生成器通常依赖预定义规则和有限上下文,难以应对复杂多变的编程需求。ReflexiCoder的突破性在于将强化学习机制引入代码生成过程&#x…...

Windows组策略编辑器终极指南:Policy Plus解锁全版本系统配置能力

Windows组策略编辑器终极指南:Policy Plus解锁全版本系统配置能力 【免费下载链接】PolicyPlus Local Group Policy Editor plus more, for all Windows editions 项目地址: https://gitcode.com/gh_mirrors/po/PolicyPlus 还在为Windows家庭版无法使用组策略…...