当前位置: 首页 > article >正文

UserAgent包名识别工具

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 背景
  • 具体实现


背景

为了更准确地分析用户下单行为的来源渠道,并实现精细化运营与风险控制,我们希望在用户下单时,能够通过请求中的 User-Agent(UA)信息 提取其使用的客户端 App 的包名(Package Name)

具体实现

import com.ejoined.commons.plugin.utils.StringUtils;
import java.net.URLDecoder;
import java.util.*;
import java.util.regex.Matcher;
import java.util.regex.Pattern;/*** UserAgent包名识别工具*/
public class ComprehensiveUserAgentParserUtil {// 应用分类枚举private enum AppCategory {SOCIAL, ECOMMERCE, FOOD_DELIVERY, VIDEO, UTILITY}// 预定义应用库(关键词 -> 应用信息)private static final Map<String, AppInfo> PREDEFINED_APP_LIBRARY = new HashMap<>();// 浏览器包名集合(用于误匹配过滤)private static final Set<String> BROWSER_PACKAGE_SET = new HashSet<>(Arrays.asList("com.android.chrome", "com.UCMobile", "com.tencent.mtt", "com.apple.mobilesafari"));static {// 社交类应用注册(支持中英文关键词)registerApp("微信", "MicroMessenger", "com.tencent.mm", AppCategory.SOCIAL);registerApp("微信", "微信", "com.tencent.mm", AppCategory.SOCIAL);registerApp("微信", "WeChat", "com.tencent.mm", AppCategory.SOCIAL);registerApp("QQ", "QQ", "com.tencent.mobileqq", AppCategory.SOCIAL);registerApp("微博", "Weibo", "com.sina.weibo", AppCategory.SOCIAL);registerApp("快手", "Kwai", "com.kuaishou.nebula", AppCategory.SOCIAL);registerApp("快手极速版", "KwaiLite", "com.kuaishou.nebula.lite", AppCategory.SOCIAL);registerApp("小红书", "xingin", "com.xingin.xhs", AppCategory.SOCIAL);registerApp("知乎", "Zhihu", "com.zhihu.android", AppCategory.SOCIAL);// 电商类应用注册registerApp("淘宝", "AliApp(TB", "com.taobao.taobao", AppCategory.ECOMMERCE);registerApp("天猫", "AliApp(TM", "com.tmall.wireless", AppCategory.ECOMMERCE);registerApp("京东", "JD4iPhone", "com.jingdong.app.mall", AppCategory.ECOMMERCE);registerApp("拼多多", "pinduoduo", "com.xunmeng.pinduoduo", AppCategory.ECOMMERCE);registerApp("亚马逊", "Amazon", "com.amazon.mShop.android", AppCategory.ECOMMERCE);registerApp("唯品会", "vipshop", "com.achievo.vipshop", AppCategory.ECOMMERCE);// 外卖类应用注册registerApp("美团", "waimai", "com.sankuai.meituan", AppCategory.FOOD_DELIVERY);registerApp("饿了么", "Eleme", "me.ele", AppCategory.FOOD_DELIVERY);registerApp("百度外卖", "baidu.waimai", "com.baidu.waimai", AppCategory.FOOD_DELIVERY);// 视频类应用注册registerApp("抖音", "Aweme", "com.ss.android.ugc.aweme", AppCategory.VIDEO);registerApp("TikTok", "com.zhiliaoapp.musically", "com.zhiliaoapp.musically", AppCategory.VIDEO);registerApp("爱奇艺", "IQIYI", "com.qiyi.video", AppCategory.VIDEO);registerApp("B站", "BiliBili", "tv.danmaku.bili", AppCategory.VIDEO);registerApp("优酷", "Youku", "com.youku.phone", AppCategory.VIDEO);registerApp("腾讯视频", "TencentVideo", "com.tencent.qqlive", AppCategory.VIDEO);// 工具类应用注册registerApp("支付宝", "AlipayClient", "com.eg.android.AlipayGphone", AppCategory.UTILITY);
//        registerApp("Chrome浏览器", "Chrome", "com.android.chrome", AppCategory.UTILITY);registerApp("华为应用商店", "com.huawei.appmarket", "com.huawei.appmarket", AppCategory.UTILITY);}// 应用信息结构体private static class AppInfo {final String appName;final String packageName;final Pattern matchPattern;public AppInfo(String appName, String keyword, String packageName) {this.appName = appName;this.packageName = packageName;this.matchPattern = Pattern.compile(Pattern.quote(keyword) + "/?([^\\s\\(\\)]+)",Pattern.CASE_INSENSITIVE);}}// 注册应用方法private static void registerApp(String appName, String keyword, String packageName, AppCategory category) {PREDEFINED_APP_LIBRARY.put(keyword, new AppInfo(appName, keyword, packageName));}// 严格包名匹配模式(至少包含两个点)private static final Pattern STRICT_PACKAGE_PATTERN = Pattern.compile("^[a-zA-Z_][a-zA-Z0-9_]*(\\.[a-zA-Z_][a-zA-Z0-9_]*){2,}$");// 系统词汇黑名单(过滤干扰词)private static final Set<String> SYSTEM_WORD_BLACKLIST = new HashSet<>(Arrays.asList("Linux", "Android", "iPhone", "iPad", "Windows", "Mac", "iOS", "CPU", "Build","NetType", "Language", "Version", "Mobile", "Safari", "WebKit", "wv", "KHTML"));/*** 主解析方法:提取应用包名* @param userAgent 用户代理字符串* @return 解析出的应用包名,未匹配则返回空字符串*/public static String extractPackageName(String userAgent) {if (StringUtils.isBlank(userAgent)) {return "";}// 1. 后缀路径解析(处理类似 /版本号/包名 的结构)String packageName = parseSuffixPackage(userAgent);if (StringUtils.isNotBlank(packageName) && !isBrowserPackage(packageName)) {return packageName;}// 2. 预定义应用匹配packageName = matchPredefinedApps(userAgent);if (StringUtils.isNotBlank(packageName) && !isBrowserPackage(packageName)) {return packageName;}// 3. 应用商店格式解析(如 (com.huawei.appmarket; 版本号))packageName = parseAppStoreFormatPackage(userAgent);if (StringUtils.isNotBlank(packageName) && !isBrowserPackage(packageName)) {return packageName;}// 4. 启发式匹配(版本号关联、括号内容)packageName = parseHeuristicPackage(userAgent);if (StringUtils.isNotBlank(packageName) && !isBrowserPackage(packageName)) {return packageName;}// 5. 严格模式兜底(全局匹配合法包名)packageName = parseStrictModePackage(userAgent);if (StringUtils.isNotBlank(packageName) && !isBrowserPackage(packageName)) {return packageName;} else {return "";}}/*** 解析后缀路径中的包名(如 open_news_u_s/6817/cn.copper.fokapi.mysterious)*/private static String parseSuffixPackage(String userAgent) {try {String decodedUa = URLDecoder.decode(userAgent);Pattern pattern = Pattern.compile("/\\d+/([\\w\\.]+)(?:\\s|$)");Matcher matcher = pattern.matcher(decodedUa);if (matcher.find()) {String candidate = matcher.group(1);return isValidPackage(candidate) ? candidate : "";}} catch (Exception e) {// 忽略解码异常}return "";}/*** 匹配预定义应用库*/private static String matchPredefinedApps(String userAgent) {for (AppInfo appInfo : PREDEFINED_APP_LIBRARY.values()) {Matcher matcher = appInfo.matchPattern.matcher(userAgent);if (matcher.find()) {return appInfo.packageName;}}return "";}/*** 解析应用商店格式包名(如 (com.huawei.appmarket; 11.0.0))*/private static String parseAppStoreFormatPackage(String userAgent) {Pattern pattern = Pattern.compile("\\(([^;]+);", Pattern.CASE_INSENSITIVE);Matcher matcher = pattern.matcher(userAgent);if (matcher.find()) {String candidate = matcher.group(1).trim();return isValidPackage(candidate) ? candidate : "";}return "";}/*** 启发式匹配(版本号关联、括号内容解析)*/private static String parseHeuristicPackage(String userAgent) {// 模式1:包名/版本号 格式匹配Pattern versionPattern = Pattern.compile("([a-zA-Z_][a-zA-Z0-9_\\.]*)/[0-9\\.]+",Pattern.CASE_INSENSITIVE);Matcher versionMatcher = versionPattern.matcher(userAgent);if (versionMatcher.find()) {String candidate = versionMatcher.group(1);if (isValidPackage(candidate)) {return candidate;}}// 模式2:括号内内容解析Pattern bracketPattern = Pattern.compile("\\(([^)]+)\\)", Pattern.CASE_INSENSITIVE);Matcher bracketMatcher = bracketPattern.matcher(userAgent);while (bracketMatcher.find()) {String content = bracketMatcher.group(1);for (String part : content.split(";|,| ")) {if (isValidPackage(part)) {return part;}}}return "";}/*** 严格模式匹配合法包名(全局搜索)*/private static String parseStrictModePackage(String userAgent) {Matcher matcher = STRICT_PACKAGE_PATTERN.matcher(userAgent);List<String> validCandidates = new ArrayList<>();while (matcher.find()) {String candidate = matcher.group();if (isValidPackage(candidate)) {validCandidates.add(candidate);}}// 按长度降序排序,取最长合法包名return validCandidates.stream().max(Comparator.comparingInt(String::length)).orElse("");}/*** 包名有效性验证*/private static boolean isValidPackage(String packageName) {if (packageName == null || packageName.length() < 6) {return false;}if (!STRICT_PACKAGE_PATTERN.matcher(packageName).matches()) {return false;}String firstSegment = packageName.split("\\.")[0];return !SYSTEM_WORD_BLACKLIST.contains(firstSegment.toUpperCase());}/*** 浏览器包名判断*/private static boolean isBrowserPackage(String packageName) {return BROWSER_PACKAGE_SET.contains(packageName);}
}

相关文章:

UserAgent包名识别工具

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 背景具体实现 背景 为了更准确地分析用户下单行为的来源渠道&#xff0c;并实现精细化运营与风险控制&#xff0c;我们希望在用户下单时&#xff0c;能够通过请求中…...

96.如何使用C#实现串口发送? C#例子

Nuget包名称 System.IO.Ports 参考代码 using System; using System.IO.Ports; using System.Threading;namespace test {class Program{static void Main(){SerialPort port new SerialPort("COM1", 9600); // 配置串口port.Open();Timer timer new Timer((_) &…...

【工具使用】STM32CubeMX-FreeRTOS操作系统-信号标志、互斥锁、信号量篇

一、概述 无论是新手还是大佬&#xff0c;基于STM32单片机的开发&#xff0c;使用STM32CubeMX都是可以极大提升开发效率的&#xff0c;并且其界面化的开发&#xff0c;也大大降低了新手对STM32单片机的开发门槛。     本文主要讲述STM32芯片FreeRTOS信号标志、互斥锁和信号…...

[P2P]并发模式

设备可以同时作为 P2P Client 监听其他P2P请求&#xff0c;需要硬件和驱动支持。 //某些高级Wi-Fi芯片&#xff08;如高通、博通&#xff09;支持 Concurrent Mode&#xff08;并发模式 GO 如果GO已经有一个client&#xff0c;大多数支持接受新的P2P Discovery。默认情况下会…...

Cloudflare 免费域名邮箱 支持 Catch-all 无限别名收件

本文首发于只抄博客,欢迎点击原文链接了解更多内容。 前言 与自建 Poste.io 还有 Serv00 邮局不同,Cloudflare 的域名邮箱并不需要 VPS,也没有复杂的配置。只要有一个托管在 Cloudflare 的域名就可以部署,像是常见的免费域名 eu.org 或者 dpdns.org 都是可以使用的。 需要…...

大数据Spark(六十一):Spark基于Standalone提交任务流程

文章目录 Spark基于Standalone提交任务流程 一、Standalone-Client模式 1、提交命令 2、任务执行流程 二、Standalone-Cluster模式 1、提交命令 2、任务执行流程 Spark基于Standalone提交任务流程 在Standalone模式下&#xff0c;Spark的任务提交根据Driver程序运行的位…...

学习记录:DAY32

Electron 开发之旅&#xff1a;从入门到实践 前言 接续上一篇 blog&#xff0c;这篇的内容主要和 Electron 有关。 课设不是特别想做下去了&#xff0c;实际核心代码大概只有 3&#xff0c;4 百行左右&#xff0c;比较水…… 或许会把 Docker 的部署也做一做&#xff08;权当是…...

next,react封装axios,http请求

import axios from axios;//声明一个基础接口变量1 let base_url; //配置开发环境 if (process.env.NODE_ENV development) {base_url "http://127.0.0.1/"; } // 配置生产环境 if (process.env.NODE_ENV production) {base_url "http://127.0.0.1/"; …...

元图CAD:一键解锁PDF转CAD,OCR技术赋能高效转换

在建筑、工程与制造领域&#xff0c;图纸的精准性与高效协作是项目成功的关键。然而&#xff0c;传统PDF文件中的文字和图形往往难以直接编辑&#xff0c;手动输入不仅耗时易错&#xff0c;还可能因格式问题导致信息丢失。元图CAD凭借创新的OCR文字识别技术&#xff0c;重新定义…...

Android 平台RTSP/RTMP播放器SDK接入说明

一、技术背景 自2015年起&#xff0c;大牛直播SDK持续深耕音视频直播领域&#xff0c;自主研发并迭代推出跨平台 RTSP/RTMP 播放模块&#xff0c;具备如下核心优势&#xff1a; 全平台兼容&#xff1a;支持 Android/iOS/Windows/Linux 等主流系统&#xff1b; 超低延迟&#…...

Nodejs工程化实践:构建高性能前后端交互系统

一、工程架构设计 1.1 现代化项目初始化 采用多包管理架构&#xff1a; mkdir content-platform && cd content-platform npm init -y npx lerna init mkdir -p {packages/client,packages/server,packages/shared} 关键模块划分&#xff1a; client/: 基于Next.js…...

STM32什么是寄存器

提示&#xff1a;文章 文章目录 前言一、背景二、2.12.2 三、3.1 总结 前言 前期疑问&#xff1a; 1、什么是寄存器&#xff1f; 答&#xff1a;在4GB的地址空间中&#xff0c;512MB的block2上&#xff0c;每4个字节组成32位&#xff0c;这个32位为一个单元&#xff0c;控制&a…...

Linux 的 find 命令使用指南

精通 Linux 的 find 命令:终极使用指南 在 Linux 系统中,find 命令是文件搜索的瑞士军刀,它能基于多种条件在目录树中精准定位文件。无论你是系统管理员还是开发者,掌握 find 都能极大提升工作效率。本文将深入解析 find 的核心用法,并附赠实用示例! 一、基础语法结构 …...

第六个微信小程序:教师工具集

源于工作需要&#xff0c;下面开始。 安装及使用 | Taro 文档 vscode 代码管理 git 辅助 开发技术如上&#xff1a; 1.开始创建模板 taro4.1.1 $ taro init teachers-tools 2.用vsocde开始吧。 选择 第二个文件夹找一。 (base) PS D:\react\teachers-tools> pnpm…...

记录一个用了很久的git提交到github和gitee比较方便的方法

在当前git init后&#xff0c;在隐藏的git文件夹中找到config文件 [user]name thels [remote "github"]url your github repository urlfetch refs/heads/*:refs/remotes/origin/* [remote "gitee"]url your gitee repository urlfetch refs/heads/*:…...

Qt Qml模块功能及功能解析

QtQml 是 Qt 6.0 中用于声明式 UI 开发和应用程序逻辑的核心模块&#xff0c;它提供了 QML 语言的支持和运行时环境。 一、主要功能 1. QML 语言支持 QML 语法解析&#xff1a;支持 QML (Qt Meta-Object Language 或 Qt Modeling Language) 的完整语法 JavaScript 集成&…...

前端八股之JS的原型链

1.原型的定义 每一个对象从被创建开始就和另一个对象关联&#xff0c;从另一个对象上继承其属性&#xff0c;这个另一个对象就是 原型。 当访问一个对象的属性时&#xff0c;先在对象的本身找&#xff0c;找不到就去对象的原型上找&#xff0c;如果还是找不到&#xff0c;就去…...

NLP学习路线图(二十九):BERT及其变体

在自然语言处理(NLP)领域,一场静默的革命始于2017年。当谷歌研究者发表《Attention is All You Need》时,很少有人预料到其中提出的Transformer架构会彻底颠覆NLP的发展轨迹,更催生了以GPT系列为代表的语言模型风暴,重新定义了人类与机器的交互方式。 一、传统NLP的瓶颈:…...

机器翻译模型笔记

机器翻译学习笔记&#xff08;简体中文&#xff09; 1. 任务概述 目标&#xff1a;将英文句子翻译成简体中文。 示例&#xff1a; 输入&#xff1a;Tom is a student. 输出&#xff1a;汤姆是一个学生。 框架&#xff1a;Seq2Seq&#xff08;序列到序列&#xff09;模型。…...

Ref vs. Reactive:Vue 3 响应式变量的最佳选择指南

Ref vs. Reactive&#xff1a;Vue 3 响应式变量的最佳选择指南 在 Vue 3 的 Composition API 中&#xff0c;ref 和 reactive 是创建响应式数据的两种主要方式。许多开发者经常困惑于何时使用哪种方式。本文将深入对比两者的差异&#xff0c;帮助您做出最佳选择。 核心概念解…...

让视觉基础模型(VFMs)像大语言模型(LLMs)一样“会思考”​

视觉检测器的演进&#xff1a;从 DETR 到 Grounding-DINO DINO-R1 的基础是 Grounding-DINO&#xff0c;而 Grounding-DINO 本身是一系列视觉检测器演进的结果。理解这个发展过程对掌握 DINO-R1 的核心技术至关重要。 DETR&#xff1a;用 Transformer 革新目标检测 在 DETR&…...

现代前端框架的发展与演进

现代前端框架的发展与演进是一个非常值得关注的话题&#xff0c;反映了整个前端生态系统的不断演化与技术深度的提升。以下是这一趋势的详细解析&#xff1a; &#x1f4c8; 现代前端框架的发展与演进 &#x1f539; 第一阶段&#xff1a;jQuery 时代&#xff08;2006-2013&am…...

【LLM-Agent】智能体的记忆缓存设计

note 实践&#xff1a;https://modelscope-agent.readthedocs.io/zh-cn/latest/modules/memory.html 文章目录 note一、Agent的记忆实现二、相关综述三、记忆体的构建四、cursor的记忆设计1. 记忆生成提示词2. 记忆评估提示词 五、记忆相关的MCPReference 一、Agent的记忆实现…...

一起学Spring AI:核心概念

人工智能概念 本节描述了 Spring AI 使用的核心概念。我们建议您仔细阅读&#xff0c;以理解 Spring AI 实现背后的思想。 模型&#xff08;Models&#xff09; 人工智能模型是设计用来处理和生成信息的算法&#xff0c;通常模仿人类的认知功能。通过从大型数据集中学习模式…...

Oracle业务用户的存储过程个数及行数统计

Oracle业务用户的存储过程个数及行数统计 统计所有业务用户存储过程的个数独立定义的存储过程定义在包里的存储过程统计所有业务用户存储过程的总行数独立定义的存储过程定义在包里的存储过程📖 对存储过程进行统计主要用到以下三个系统视图: dba_objects:记录了所有独立创…...

PicSharp(图片压缩工具) v1.1.6

PicSharp 一个简单、高效、灵活的跨平台桌面图像压缩应用程序。软件基于Rust实现&#xff0c;高性能低资源&#xff0c;能快速扫描文件或目录&#xff0c;批处理图像。软件还具备组合压缩策略&#xff0c;TinyPNG提供最佳压缩比&#xff0c;但需要互联网连接&#xff0c;对大量…...

前端文件下载常用方式详解

在前端开发中&#xff0c;实现文件下载是常见的需求。根据不同的场景&#xff0c;我们可以选择不同的方法来实现文件流的下载。本文介绍三种常用的文件下载方式&#xff1a; 使用 axios 发送 JSON 请求下载文件流使用 axios 发送 FormData 请求下载文件流使用原生 form 表单提…...

【DAY42】Grad-CAM与Hook函数

内容来自浙大疏锦行python打卡训练营 浙大疏锦行 知识点: 回调函数lambda函数hook函数的模块钩子和张量钩子Grad-CAM的示例 作业&#xff1a;理解下今天的代码即可 在深度学习中&#xff0c;我们经常需要查看或修改模型中间层的输出或梯度。然而&#xff0c;标准的前向传播和反…...

如何生成和制作PDF文件

在数字化办公的今天&#xff0c;PDF文件已经成为我们工作和学习中不可或缺的一部分。无论是合同、报告、简历&#xff0c;还是电子书、表单&#xff0c;PDF格式都以其跨平台兼容性、不可编辑性和清晰的排版而被广泛使用。但你是否知道&#xff0c;生成和制作PDF文件其实并不复杂…...

【K8S系列】Kubernetes 中 Pod(Java服务)启动缓慢的深度分析与解决方案

本文针对 Kubernetes 中 Java 服务启动时间慢的深度分析与解决方案文章,结合了底层原理、常见原因及具体优化策略: Kubernetes 中 Java 服务启动缓慢的深度分析与高效解决方案 在 Kubernetes 上部署 Java 应用时,启动时间过长是常见痛点,尤其在需要快速扩缩容或滚动更新的…...