当前位置: 首页 > news >正文

TensorFlow Lite中文本分类在Android上的实践

#1 Tensorflow Lite

        TensorFlow Lite(后续简称TFL) 是 Google 开发的一个用于移动设备和嵌入式设备的开源库,旨在为移动终端设备提供机器学习推断。它是 TensorFlow 框架的轻量级版本,专门优化了模型的大小和性能,以适应资源受限的移动设备嵌入式系统

        TFL 提供了一种在移动设备上运行 TensorFlow 模型的轻量级解决方案。它提供了一个执行模型推断的运行时引擎,允许开发者将 TensorFlow 模型转换为适用于移动设备的紧凑格式。这种转换过程包括模型量化、剪枝和优化等技术,以减小模型的空间占用并提高推断速度

#2 机器学习和文本分类

        机器学习在文本分类中可以应用于识别骚扰短信和垃圾影评等多种场景。下面是针对每个问题的简要解释:

  1. 骚扰短信识别:通过机器学习可以训练模型来识别和分类骚扰短信。这需要准备一个标记好的数据集,其中包含已知的骚扰短信和非骚扰短信样本。基于这个数据集,可以使用监督学习算法,如朴素贝叶斯分类器、支持向量机(SVM)或深度学习模型,训练一个分类器来自动判断新的短信是否属于骚扰类别。
  2. 垃圾评价识别:如在电影和产品评价的场景中,利用机器学习技术可以帮助识别和分类垃圾影评。这需要准备一个标记好的数据集,其中包含了垃圾影评和非垃圾影评的样本。使用监督学习算法,如逻辑回归、决策树或卷积神经网络(CNN),构建一个模型来分析文本特征并识别垃圾影评。

        关键是准备一个有代表性的、经过标注的数据集,并选择适合任务的机器学习算法进行训练和测试。另外,特征工程也是很重要的,可以提取文本的关键词、情感特征、句法结构等,帮助算法更好地理解文本数据。

        需要注意的是,由于骚扰短信和垃圾影评的形式多样且不断演化,仅依靠机器学习的方法可能难以完全避免误判和漏判。因此,建议将机器学习与其他技术,如自然语言处理、深度学习和人工智能的方法相结合,以提高分类器的准确性和鲁棒性。此外,定期更新和维护模型也是确保分类效果持续有效的重要步骤。

#3 TFL的优点

  1. 高性能推断:TFL通过利用移动设备的硬件加速器(如 GPU、DSP)以及优化的执行引擎,提供高效的模型推断服务。这使得在资源受限的设备上运行复杂的模型成为可能。
  2. 轻量级模型:TFL 专注于减小模型的体积,以适应移动设备的存储和网络传输限制。这通过模型压缩技术,如量化和剪枝,实现了较小的模型文件大小。
  3. 灵活的部署:TFL支持多种平台和设备,包括 Android、iOS、嵌入式设备和边缘设备等。开发者可以通过 TFL 提供的 API 将模型集成到应用程序中,并轻松地部署到目标设备上。
  4. 开发者友好:TFL 提供了丰富的工具和文档,使开发者可以方便地进行模型的转换、优化和部署。

TFL的官方网站:https://www.tensorflow.org/lite

#4 TFL使用步骤

        TFL使用的核心步骤是:训练模型->保存模型->转化模型->执行预测。

        而TFL提供了模型本身、保存、预测的框架。对于开发者而言,均可以开盖即用,而影响最终效果的因素在于:提供足够的数据集和满足需求的模型架构

#5 详细步骤

        首先,在TFL中选项预期使用的基础模型,包含类型(图形识别、文字分类、音频等)、格式、TF版本等可以直接搜索。

        举个例子,如图像分类,可以使用mobilenet_v2模型。

        剩下的步骤就很简单,直接使用模型导入数据,并用tf.saved_model.save保存模型即可,推荐SaveModel格式。

#6 文本分类器的模型架构

        每个model_spec对象代表了一个文本分类器的具体模型,TFL Model Maker目前支持MobileBERT,平均单词嵌入向量和BERT-Base模型。

        综上,MobileBERT更适合在Android设备上运行,但由于它是一个复杂模型,所以训练时会花费更多的时间(该成本不会影响到用户)

#7 TFL本地模型训练

        TFL模型由TFL Model Maker库进行了简化,方便再设备端ML应用中部署并调整参数输入。这里以电影评论为例子,该本文分类模型会将文本分为预定义类别。输入应为经过预处理的文本,而输出为类别的概率。简单来说,根据影评内容,判断是否为正常影评或垃圾影评。

7.1 TFL环境搭建

首先,除了基本的python外,搭建TLF Model Marker环境还需要额外下载的库:

sudo apt -y install libporta

相关文章:

TensorFlow Lite中文本分类在Android上的实践

#1 Tensorflow Lite TensorFlow Lite(后续简称TFL) 是 Google 开发的一个用于移动设备和嵌入式设备的开源库,旨在为移动终端设备提供机器学习推断。它是 TensorFlow 框架的轻量级版本,专门优化了模型的大小和性能,以适应资源受限的移动设备和嵌入式系统。 TFL 提供了一种在移…...

使用vscode查bug

具体操作 修改CMakeList.txt # set(CMAKE_BUILD_TYPE "Release")//注释Release模式 set(CMAKE_BUILD_TYPE "Debug")//设置为Debug模式 # set(CMAKE_CXX_FLAGS_RELEASE "-O3 -Wall -g")//注释*这行代码是用来设置 CMake 构建系统中 Release 模式…...

LC 2846. 边权重均等查询

2846. 边权重均等查询 难度: 困难 题目大意: 现有一棵由 n 个节点组成的无向树,节点按从 0 到 n - 1 编号。给你一个整数 n 和一个长度为 n - 1 的二维整数数组 edges ,其中 edges[i] [ui, vi, wi] 表示树中存在一条位于节点 …...

RabbitMQ简单模式和工作模式

RabbitMQ 是一个消息队列中间件,用于在分布式系统中进行消息传递。在 RabbitMQ 中,有几种工作模式,其中简单模式和工作模式是其中两种基本的模式之一。 简单模式(Simple Mode): 在简单模式中,有…...

c语言实战之贪吃蛇

文章目录 前言效果展示游戏用到的图片游戏思路一览游戏前准备一、贪吃蛇、食物、障碍物节点坐标的结构体二、枚举游戏状态、和贪吃蛇的方向三、维护运行的结构体 游戏开始前的初始化一、学习图形库相关知识二、设置背景三、欢迎界面四、初始化贪吃蛇五、生成障碍物六、生成食物…...

Midjourney图片生成描述词记录(今天一天)

抄别人的描述词 /imagine prompt:https://(你的图片地址).jpg Super handsome boy IP by pop mart , green suit, no hair, bald head, Scenes in spring , pastel color , mockup , fine luster , clean background ,3D render , Soft focus , oc , bl…...

类和对象 第五部分第四小节:赋值运算符重载

C编译器至少给一个类添加4个函数 1.默认构造函数无参,函数体为空 2.默认析构函数无参,函数体为空 3.默认拷贝沟早函数,对属性进行值拷贝 4.赋值运算符“operator”,对属性进行值拷贝 如果类中有属性指向堆区,做赋值操作…...

Django从入门到精通(一)

目录 一、Django环境搭建与命令 1.1、安装 1.2、命令行 创建项目 编写代码 运行 app概念 1.3、Pycharm创建项目 1.4、虚拟环境 创建虚拟环境 - 命令行 介绍 操作 基本问题 Pycharm 项目虚拟环境 django虚拟环境【安装django最新版本】 django虚拟环境【安装指…...

数据库分表分库的原则

什么是数据库分库分表 数据库分表(Table Sharding) 数据库分表是将一个大表按照某种规则拆分成多个小表存储在不同的物理表中的技术。通常,拆分规则是基于某个列的值进行拆分,例如根据用户ID或日期范围等进行拆分。每个小表只包…...

Java技术栈 —— Docker容器

Java技术栈 —— Docker容器 一、什么是Docker?二、如何安装Docker?三、如何使用Docker? 一、什么是Docker? docker的本意是码头工人。 Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个…...

Mysql大数据量分页优化

前言 之前有看过到mysql大数据量分页情况下性能会很差,但是没有探究过它的原因,今天讲一讲mysql大数据量下偏移量很大,性能很差的问题,并附上解决方式。 原因 将原因前我们先做一个试验,我做试验使用的是mysql5.7.2…...

QT tcp与udp网络通信以及定时器的使用 (7)

QT tcp与udp网络通信以及定时器的使用 文章目录 QT tcp与udp网络通信以及定时器的使用1、QT网络与通信简单介绍2、QT TCP通信1、 服务器的流程2、 客户端的流程3、服务器的编写4、客户端的编写 3、QT UDP通信1、客户端流程2、客户端编写3、UDP广播4、UDP组播 4、定时器的用法1、…...

web架构师编辑器内容-添加自动保存的功能

对于频繁改动的应用,自动保存的功能是一个非常有用的功能,可以避免用户在没有保存的情况下丢失自己保存过的数据。 对于自动保存,一般有两种实现,参考语雀和石墨: 语雀采用的是定时保存的方式,大约在3分半…...

【Redis】关于它为什么快?使用场景?以及使用方式?为何引入多线程?

目录 1.既然redis那么快,为什么不用它做主数据库,只用它做缓存? 2.Redis 一般在什么场合下使用? 3.redis为什么这么快? 4.Redis为什么要引入了多线程? 1.既然redis那么快,为什么不用它做主数据…...

SpringBoot之JWT登录

JWT JSON Web Token(JSON Web令牌) 是一个开放标准(rfc7519),它定义了一种紧凑的、自包含的方式,用于在各方之间以JSON对象安全地传输信息。此信息可以验证和信任,因为它是数字签名的。jwt可以使用秘密〈使用HNAC算法…...

【备战蓝桥杯】——循环结构

🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ​💫个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-bFHV3Dz5xMe6d3NB {font-family:"trebuchet ms",verdana,arial,sans-serif;font-siz…...

【数据分享】1929-2023年全球站点的逐年平均气温数据(Shp\Excel\免费获取)

气象数据是在各项研究中都经常使用的数据,气象指标包括气温、风速、降水、湿度等指标,其中又以气温指标最为常用!说到气温数据,最详细的气温数据是具体到气象监测站点的气温数据!本次我们为大家带来的就是具体到气象监…...

探索Pyecharts关系图绘制技巧:炫酷效果与创意呈现【第42篇—python:Pyecharts水球图】

文章目录 Pyecharts绘制多种炫酷关系网图引言准备工作代码实战1. 基本关系网图2. 自定义节点样式和边样式3. 关系网图的层级结构4. 添加标签和工具提示5. 动态关系网图6. 高级关系网图 - Les Miserables 示例7. 自定义关系网图布局8. 添加背景图9. 3D 关系网图10. 热力关系网图…...

蓝桥杯-循环节长度

两个整数做除法,有时会产生循环小数,其循环部分称为: 循环节。比如,11/136>0.8461553846153..... 其循环节为[846153] 共有 6 位。下面的方法,可以求出循环节的长度。请仔细阅读代码,并填写划线部分缺少的代码。 注…...

Jython调用openwire库连接activemq转发topic订阅消息到另一个activemq 服务器上 完整代码

以下是一个示例代码,演示如何在Jython中使用OpenWire库连接ActiveMQ,将一个主题(topic)上的订阅消息转发到另一个ActiveMQ服务器上: from org.apache.activemq import * from org.apache.activemq.transport import *…...

3步解锁抖音无水印下载神器:让内容备份效率提升10倍的完整指南

3步解锁抖音无水印下载神器:让内容备份效率提升10倍的完整指南 【免费下载链接】douyin-downloader 项目地址: https://gitcode.com/GitHub_Trending/do/douyin-downloader 在数字内容爆炸的时代,抖音已成为知识传播、文化交流和创意展示的重要平…...

HARMONYOS应用实例247:七巧板拼图

14.七巧板拼图 功能:拖拽旋转七巧板组件拼成指定图形,训练几何直觉和面积守恒观念。 核心功能 七巧板组件:包含2个大三角形、1个中三角形、2个小三角形、1个正方形、1个平行四边形 拖拽操作:支持拖拽七巧板组件到目标位置 旋转功能:支持旋转七巧板组件(每次旋转45度) 目…...

【AI】-----向量数据库核心应用场景

向量数据库核心应用场景 1. 大模型 / RAG 知识库(最主流) 企业内部文档、合同、产品手册语义检索解决大模型幻觉、知识过时问题客服机器人、智能问答、私域知识库 2. 推荐系统 电商:相似商品、猜你喜欢短视频/内容:基于用户兴趣的…...

本地部署开源推送通知系统 ntfy 并实现外部访问

ntfy 是一款简单、轻量级且功能强大的开源推送通知系统,它的核心目标是让用户或开发者能够轻松地从任何设备、任何地方向自己的手机或桌面发送通知。本文将详细介绍如何在 Linux 系统局域网内部署 ntfy 并结合路由侠实现外网访问局域网内部署的 ntfy 。 第一步&…...

AWS Shell异步操作:非阻塞命令执行的终极指南

AWS Shell异步操作:非阻塞命令执行的终极指南 【免费下载链接】aws-shell An integrated shell for working with the AWS CLI. 项目地址: https://gitcode.com/gh_mirrors/aw/aws-shell AWS Shell是一款专为AWS CLI设计的强大交互式生产力工具,它…...

我的LVDS信号有振铃?可能是端接电阻没选对!从仿真到实测的端接方案选择指南

LVDS信号振铃问题全解析:从端接电阻选择到实测验证 振铃现象是LVDS信号传输中最令人头疼的问题之一。当你在示波器上看到信号边沿出现振荡波形时,第一反应可能是怀疑PCB布局或信号源质量。但经验丰富的工程师都知道,80%的振铃问题根源在于端接…...

不用编译!快速修改Scratch-blocks积木字体的偷懒方法

零编译实战:Scratch-blocks字体调整极简方案 在Scratch 3.0的二次开发过程中,积木字体过小是开发者普遍遇到的痛点。官方移除了字体调节功能后,低分辨率设备上的中文显示尤为模糊。传统解决方案需要配置Python环境并重新编译scratch-blocks库…...

Phi-4-reasoning-vision-15B高算力适配:双GPU显存占用监控与低并发稳定性验证

Phi-4-reasoning-vision-15B高算力适配:双GPU显存占用监控与低并发稳定性验证 1. 模型概述与技术背景 Phi-4-reasoning-vision-15B是微软推出的视觉多模态推理模型,专为复杂视觉理解任务设计。作为2026年发布的重要模型,它在图像理解、文档…...

智科毕业设计易上手选题100例

0 选题推荐 - 汇总篇 毕业设计是大家学习生涯的最重要的里程碑,它不仅是对四年所学知识的综合运用,更是展示个人技术能力和创新思维的重要过程。选择一个合适的毕业设计题目至关重要,它应该既能体现你的专业能力,又能满足实际应用…...

雪女-斗罗大陆-造相Z-Turbo助力AI编程:自动生成代码片段与函数注释

雪女-斗罗大陆-造相Z-Turbo助力AI编程:自动生成代码片段与函数注释 作为一名写了十几年代码的老兵,我经历过从记事本写代码到现代IDE的整个进化史。这些年,各种提升效率的工具层出不穷,但“写代码”这件事的核心——将想法转化为…...