当前位置: 首页 > article >正文

(B站TinyML教程学习笔记)C8 edge impulse 快速入门+C9 数据提取+C10 运动数据的特征提取

0:06 - 1:00 为什么使用 Edge Impulse常见机器学习开发方式传统机器学习通常会使用TensorFlowScikit-learn这些框架功能强大但学习成本高需要写大量代码对嵌入式开发者不太友好Edge Impulse 的作用Edge Impulse核心特点图形化界面不需要深入学习AI框架自动完成训练流程适合嵌入式AI/TinyML可以快速部署到单片机核心思想“让嵌入式工程师不用精通AI框架也能做机器学习项目”1:01 - 1:58 Edge Impulse 项目流程创建项目流程进入平台后创建项目给项目命名打开项目Edge Impulse 的完整机器学习流程左侧面板展示整个AI流程数据采集 ↓ Impulse机器学习流水线 ↓ 训练模型 ↓ 部署到嵌入式设备这里的 Impulse可以理解为“数据处理 特征提取 AI模型”的组合流程1:31 - 2:04 API Key 与数据上传API Key作用连接手机连接单片机上传数据实时测试HMAC Key用于自动上传数据脚本化数据采集自动训练流程适合自动化AI训练批量数据采集2:04 - 3:00 Edge Impulse 支持的数据上传方式方法1直接上传文件支持音频图像JSONCSV原始传感器数据方法2命令行工具上传适合自动化脚本上传方法3开发板实时上传例如Arduino Nano 33 BLE Sense可以实时上传加速度计陀螺仪麦克风IMU数据方法4手机上传手机可以作为传感器设备AI测试设备非常适合入门实验。3:06 - 3:23 手机连接 Edge Impulse流程设备页面 ↓ 连接新设备 ↓ 显示二维码 ↓ 手机扫码 ↓ 连接成功连接后手机会出现在设备列表中。3:29 - 6:33 Arduino Nano 连接流程进入 Bootloader 模式方法快速按两次 Reset 键。现象黄色LED闪烁。3:55 - 5:00 安装开发环境需要安装1. Node.jsNode.js作用运行 Edge Impulse CLI 工具。2. Arduino CLIArduino CLI作用命令行管理Arduino。5:01 - 5:14 安装 Edge Impulse CLI命令npm install -g edge-impulse-cli作用安装edge-impulse-daemon数据上传工具设备连接工具5:14 - 5:42 烧录 Edge Impulse 固件流程下载固件 ↓ 解压 ↓ 运行脚本 ↓ 自动烧录烧录完成后按一次 Reset 重启开发板。5:47 - 6:33 连接开发板到云端命令edge-impulse-daemon功能登录账户选择COM口选择项目上传数据6:54 - 8:59 手势识别项目项目目标制作“魔法棒”手势识别识别左右挥动上下挥动画圆7:15 - 8:24 为什么训练和部署必须用同类传感器核心原则训练用什么传感器部署最好也用什么传感器。原因不同IMU精度不同噪声不同灵敏度不同否则模型可能失效。7:49 - 8:06 FFT 为什么重要这里第一次提到傅里叶变换FFT作用把时域信号转换成频域信号用于提取振动频率周期特征动作节奏这是 TinyML 中非常重要的特征提取方法。8:59 - 11:16 数据采集流程四个类别需要采集类别动作left-right左右up-down上下circle画圆idle静止9:10 - 11:16 数据采集要求每类约200秒数据因为每次采样10秒。所以200秒 ÷ 10秒 ≈ 20个样本采集时的重要原则保持一致性包括握持方式动作速度动作频率否则模型会变难训练。数据质量非常重要如果图像不规律没有重复模式噪声太大就应该删除重新采集。12:43 - 14:33 数据集划分机器学习通常分数据集作用Training训练模型Validation调参Test最终考试推荐比例类型比例Train60~80%Validation10~20%Test10~20%13:08 - 13:42 验证集的作用验证集用于验证模型训练的结果好坏如果模型在验证集上表现不好就调整超参数学习率网络大小Epoch数量等等13:42 - 14:19 为什么测试集不能提前使用因为如果一直根据测试集调参模型会“偷偷记住测试集”导致测试结果失真。14:52 - 17:47 数据集代表性问题极其重要这是机器学习最核心的问题之一。贵宾犬例子如果训练集全是贵宾犬。模型可能学到卷毛垂耳而不是“狗”的本质特征。本质问题模型不会真正“理解”。它只是找统计规律。16:47 - 17:47 糟糕数据集案例问题1. 背景统一模型会误认为黑背景 狗。2. 全是狗头导致看见全身狗反而不会识别。3. 没有卡通图模型无法泛化到插画动画卡通17:35 经典原则垃圾进 垃圾出 (Garbage In, Garbage Out)数据差模型一定差。17:59 - 20:40 数据不平衡问题例子99% 空地1% 有狗模型最终会永远预测“空地”准确率还能有99%。这叫朴素分类器Naive Classifier特点什么都预测成最大类别准确率虚高实际没用19:19 - 19:49 解决方法方法1更多数据永远有效。方法2平衡数据集例如四分类每类约25%20:40 - 21:47 Edge Impulse 自动平衡数据集按钮Rebalance Dataset自动80% Train20% Test22:06 - 23:52 什么是特征Feature定义Feature可测量的属性。例如加速度计X Y Z就是3个特征。23:52 - 24:20 为什么单时刻数据是坏特征因为动作本质是随时间变化。单一时间点无法反映动作过程。25:15 - 25:41 时间窗口思想非常重要解决方案使用时间窗口Window例如2秒数据。25:24 - 25:41 本项目的数据规模采样率62.5Hz2秒62.5×2125每轴125个点。3轴125×3375总输入375维。25:48 - 27:53 深度学习的缺点虽然神经网络可以自动学习特征。但代价算力大内存大数据量需求大推理慢对于嵌入式压力非常大。27:53 - 28:56 手工特征提取RMS均方根对125个点提取一个统计值。优点降低维度保留整体特征减少计算量28:58 - 29:57 FFT 特征提取FFT 的本质把时间变化转换成频率成分为什么FFT适合动作识别因为动作具有频率。例如左右挥动大约1Hz。FFT后会在1Hz出现峰值。本节核心总结Edge Impulse 是什么一个面向嵌入式AI/TinyML的低代码机器学习平台。本节最重要的几个概念概念核心Feature特征Dataset数据集Train/Validation/Test数据划分FFT频域特征Overfitting过拟合Data Balance数据平衡Time Window时间窗口TinyML小型嵌入式AI你现在应该真正理解的重点AI项目真正最重要的东西不是模型。而是数据质量 特征提取很多时候数据集决定上限特征工程决定效果模型只是最后一步这其实是很多AI初学者最容易忽略的地方。

相关文章:

(B站TinyML教程学习笔记)C8 edge impulse 快速入门+C9 数据提取+C10 运动数据的特征提取

0:06 - 1:00 为什么使用 Edge Impulse 常见机器学习开发方式 传统机器学习通常会使用: TensorFlowScikit-learn 这些框架功能强大,但: 学习成本高需要写大量代码对嵌入式开发者不太友好 Edge Impulse 的作用 Edge Impulse 核心特点&am…...

2002-2024年 人工智能发展能壮大耐心资本吗

本文基于2002-2024年上市公司数据,借鉴《人工智能发展能壮大耐心资本吗? ——来自国家新一代人工智能创新发展试验区的经验证据》一文中的变量构建与基准回归部分,探讨人工智能发展能否培育壮大耐心资本,含原始数据、处理代码、实…...

1986-2025年上市公司高校专利知识溢出

高校专利知识溢出,是衡量企业所处省份外部知识环境与高校创新资源外溢程度的重要指标。对于企业尤其是技术密集型企业而言,其创新活动不仅依赖内部研发投入,也深受所在地区知识基础、科研资源和学术创新氛围的影响。高校作为基础研究和前沿技…...

一次讲清本地大模型语音识别三件套:Vulkan 为什么是加速主线,而说话人识别为何成为唯一短板

把 whisper.cpp、sherpa-onnx、llama.cpp 三套引擎整合到一起,再用 Electron 包成桌面应用,这个技术思路本身并不复杂。真正考验工程功力的,是面向完全不懂技术的最终端用户,怎样让这些引擎尽可能“一键加速”,同时还不…...

西门子“工业软件驱动的数字孪生”模式

西门子(Siemens)的“工业软件驱动的数字孪生”模式是全球离散制造业(如汽车、航空航天、电子)公认的技术制高点。其核心逻辑不是简单的 3D 建模,而是“数物融合”,即利用完整的软件工具链在物理实体投产前&…...

2026深度教程:如何用好 Gemini 3.1 Pro 联网搜索?实时信息获取与验证技巧全解析

目前,国内用户想稳定使用顶尖AI模型的联网搜索功能,像聚合了Gemini、ChatGPT、Grok等主流大模型的 KULAAI (m.877ai.cn) 这类镜像站提供了直接可用的方案。本文将深入剖析Gemini 3.1 Pro的联网能力,从原理机制到实操技巧&#xff…...

基于TEA加密的QQ号码逆向查询技术实现

基于TEA加密的QQ号码逆向查询技术实现 【免费下载链接】phone2qq 项目地址: https://gitcode.com/gh_mirrors/ph/phone2qq 在数字身份管理领域,用户经常面临忘记QQ号码但记得绑定手机号的情况。传统找回方式依赖官方验证流程,耗时较长且操作复杂…...

Taotoken模型广场在项目技术选型阶段提供的便利性体验

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken模型广场在项目技术选型阶段提供的便利性体验 启动一个新的AI项目时,技术决策者面临的首要挑战往往是模型选型…...

客户受电工程图纸审核|全网独家复现,多模态+知识图谱创新改进篇 引入MM-KG融合架构,多模态感知+知识关联助力图纸全检、隐患精准定位、审核效率翻倍

目录 一、行业痛点:人工抽检模式的致命瓶颈(附真实场景痛点) 1.1 审核效率极低,无法适配规模化需求 1.2 漏判误判率高,审核质量依赖个人经验 1.3 审核标准不统一,追溯难度大 1.4 人力成本高昂,专业人才缺口大 二、创新突破:多模态+知识图谱融合架构(核心改进解析…...

DownKyi哔哩下载姬:5步快速掌握B站视频下载完整教程

DownKyi哔哩下载姬:5步快速掌握B站视频下载完整教程 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印等&#xf…...

【Mem0】 源码剖析(一):Agent 的记忆危机与 Mem0 的三阶段管道——为什么 RAG 不够用?

【Mem0】 源码剖析(一):Agent 的记忆危机与 Mem0 的三阶段管道——为什么 RAG 不够用? 写在前面:54K Star,论文被 arXiv 收录,LOCOMO 基准 SOTA——Mem0 是当前 Agent 记忆层的事实标准。它的核…...

【Flutter for open harmony 】Flutter三方库Dio网络请求+熬夜记录列表的鸿蒙化适配与实战指南

【Flutter for open harmony 】Flutter三方库Dio网络请求熬夜记录列表的鸿蒙化适配与实战指南 欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.csdn.net 大家好,我是ShineQiu,上海某高校计算机科学与技术专业大二在读学生。这…...

5分钟快速上手:res-downloader 全网资源下载神器终极指南

5分钟快速上手:res-downloader 全网资源下载神器终极指南 【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 你是否经…...

分类记单词:哺乳动物

分类记单词:哺乳动物快来记单词,这里有好多哺乳动物哦一、宠物、家畜 pet 宠物cat 猫tom 公猫;汤姆dog 狗pup 小狗bitch 母狗;泼妇pig 猪sow 母猪;播种boar 未阉的公猪;野猪piglet 小猪livestock 牲口cattl…...

蓝牙6.0 Channel Sounding 基于接入地址的定时估计原理

基于接入地址的定时估计 先看下core spec的描述:蓝牙Core Spec Vol 6 Part H中 3.2节「基于接入地址的定时估计」,它定义了两种用于CS_SYNC包到达时间(ToA)估计的方法,是RTT测距的基础定时方案。下面我逐段拆解&#x…...

凡亿AD22--器件导线连接及导线属性设置

一、课前基础授课前已完成:将所需元器件(如DC头、二极管、电容等)按布局要求,放置在原理图页面中,无需提前连接,本节课重点完成「电气连接」及导线属性优化。二、核心重点:导线连接(…...

职慧AI陪练产品全景解析:六大训练模式如何覆盖销售培养全场景

摘要:市面上的AI陪练产品大多只能做"话术对练",真正能覆盖销售能力培养全链路的产品长什么样?本文深度拆解职行力职慧AI陪练的六大训练模式——话术陪练、情景对话、智能考试、微课学习、AI专家问答、训练官带教,以及背…...

凡亿AD22--原理图元件复制、剪切、旋转、镜像

核心作用:这4种操作是原理图布局的基础,熟练掌握可大幅提升绘制效率,让元器件布局更规范、信号流向更清晰,提升原理图可读性。一、核心操作详解所有操作均基于「选中元件」为前提(单个元件点击选中,多个元件…...

凡亿AD22-原理图页大小设置及注意事项(实操笔记)

核心前提:原理图页大小需在绘制元器件、导线前设置(前期准备工作),避免绘制完成后调整尺寸,导致元器件、导线布局混乱,节省后期调整时间。一、为什么要设置原理图页大小?软件默认的原理图页尺寸…...

Gemini3.1Pro透明化指南:模型卡与数据卡入口解析

在 2026 年,越来越多的团队开始把“模型怎么用”升级为“模型用得是否可控、可追溯”。尤其是涉及合规审计、数据治理与风险评估时,工程侧最需要的往往是:能快速找到模型信息与数据来源的透明化页面入口,确保链路清晰、记录完整、…...

算法23,寻找峰值

这是一道经典的二分查找应用题:寻找峰值(Find Peak Element)。笔记中已经总结了核心逻辑,我将为你梳理其背后的数学原理(二段性),并提供标准的代码实现。1. 核心原理:什么是“二段性…...

Proxmox VE – 修复 LVM Thin Pool “pve/data” 激活失败

逐步诊断与恢复操作指南适用范围:PVE 宿主机,LVM thin pool pve/data 状态异常,错误信息: TASK ERROR: activating LV pve/data failed: Check of pool pve/data failed (status:1). Manual repair required! 风险提示&#xff1a…...

全球扩张加剧法律复杂性,但仅有7%的企业实现全面合规

• 47%的总法律顾问表示,实际控制人规则对法律运营构成了最大的风险 • 44%的企业对能否满足跨境数据安全要求缺乏信心 随着企业在2026年加速全球扩张,合规工作却未能跟上步伐。事实上,根据全球领先的商业管理与合规解决方案提供商CSC的一项最…...

模板进阶(C++初阶结束)

1.非类型模板参数模板参数分为类型形参和非类型形参类型形参:出现在模板参数列表中,跟class或者typename之类的参数类型名称非类型形参:就是用一种常量作为类(函数)模板的一个参数,在类(函数&am…...

七、数据与存储

一、 数据库操作 1、QSqlDatabase 连接管理深度剖析 连接生命周期与内部机制 QSqlDatabase 的连接管理不走寻常路——它内部是一个全局静态哈希表,存储着所有命名连接。这带来了几个重要的设计约束: // QSqlDatabase 内部实现的核心数据结构(简化还原)// Qt 源码中通过 QH…...

iVentoy(增强版PXE服务器

链接:https://pan.quark.cn/s/d2ca56327274iVentoy是一个增强版的PXE服务器。你可以通过网络同时为多台机器启动和安装操作系统。软件的使用非常简单,无需复杂的配置。只需要直接将ISO文件放在指定的位置,然后在启动时,客户机可以…...

数据结构(哈希函数)

#pragma once //之前已经学完的,顺序表,链表等 他们总是有一个共有的特征,数据和其存储之间是没有任何关系的 //现在的需求 让查找函数的时间复杂度达到O(1); //让数据和其存储位置之间产生某种函数(映射)关系 这就是哈…...

网页布局基石----盒子模型

目录 一:盒模型的构成 二:盒模型的核心属性 三:标准盒子模型代码实例 CSS控制网页样式是通过盒子模型去实现的,日常中我们所看到的网页上所以标签都可以视为一个盒子。所以网页都是放在盒子里面的。因此,我们首先要…...

RAG 系统优化全流程:从数据入库到召回排序

RAG(Retrieval-Augmented Generation)系统的检索质量直接决定生成内容的上限。本文从工程落地角度,系统梳理 RAG 检索链路的三个核心阶段——入库、查询与召回。针对每个阶段的关键技术(语义分割、问答模拟、查询改写、语义校验、混合检索、语义重排)给出定义、问题背景、…...

MCC-425 协议转换网关:打通制冷机组与 CAN 控制器数据链路

背景在工业精密温控领域,制冷机组的运行参数(如温度、压力、流量)直接决定了工艺流程的稳定性。为了实现生产现场的数字化管理,必须将分布在各工位的制冷机组数据实时汇聚至中控室,以便上位机进行统一监控与逻辑调度 。…...