当前位置: 首页 > article >正文

2026年,IP地理位置精准查询的几个硬核技术变化

关于IP定位相关最近和几个同行交流发现大家对IP定位的理解还停留在之前想把自己这段时间的一些实践整理出来希望能给同样在搞网络或风控的同行一些参考。IPv6流量超过IPv4、住宅代理攻击泛滥、CGNAT覆盖越来越广……这些变化正在悄悄改变IP定位的游戏规则。一、IPv6定位其实比IPv4更容易做准先说一个反直觉的结论IPv6定位比IPv4更容易做准。为什么因为IPv4地址池已经枯竭运营商和云厂商大量使用NAT一个公网IP背后可能挂着成百上千用户你根本没法准确知道这个IP的物理位置。而IPv6地址空间巨大运营商在分配时普遍遵循地域化策略——比如某运营商的240e:1::/32段固定分配给北京240e:2::/32段分配给上海。我们的做法很简单放弃对单个IPv6地址的精确定位转而基于前缀/32、/48做聚合映射。具体步骤从BGP路由表中提取全球IPv6前缀及其宣告路径。结合RIR的分配记录确定每个前缀的归属运营商和注册国家。对于移动网络如手机IPv6利用公开的基站扇区数据做二次校准。实测下来中国三大运营商的IPv6城市级定位准确率都能做到95%以上区县级也能到80%左右。相比IPv4那套猜来猜去的算法IPv6反而更干净。给同行的一个建议如果你的业务IPv6流量占比已经超过30%别再拿IPv4那套映射表去套IPv6了。去搞一套基于前缀的定位方案效果立竿见影。二、住宅代理识别不要只盯着数据中心IP以前做风控看到数据中心IP就可以直接拉高权重。现在不行了——攻击者大量使用住宅代理IP属性显示就是普通家庭宽带传统手段根本防不住。我遇到的一个真实案例某电商平台大促期间大量“新用户”来自真实住宅IP行为模式却高度一致凌晨注册、批量领券、不下单。我们尝试了多种方式最后用了行为指纹 关联分析住宅IP通常在晚间和周末活跃代理IP则全天均匀分布。用24小时访问热力图做聚类可以快速分离。住宅IP极少开放高危端口如22、3389代理节点则恰好相反。我们配合Zmap做了一些被动探测积累了一个特征库。同一C段/24内如果超过5个IP同时表现出异常请求模式整体标记。这套规则上线后识别率从不到30%提升到85%以上。之前漏掉的虚假注册中超过六成是住宅代理。代码片段简单了解一下检测逻辑def check_residential_proxy(ip, history): # 凌晨活跃度检查 night_active sum(1 for t in history if 2 t.hour 5) if night_active len(history) * 0.3: return True # C段聚合检查 c_segment ..join(ip.split(.)[:3]) if c_segment in high_risk_segments: return True return False三、离线库的性能还能怎么优化如果你还在用在线API做高并发IP查询很可能遇到两个问题延迟不可控、限流频繁。我们的方案是本地离线库 内存索引。传统的MMDB格式其实已经很快了二分查找O(logN)但对于千万级的IP段每次查询需要大约24次内存随机访问平均0.1-0.2ms。我们在64核机器上压测单机QPS大约200万。为了进一步压榨性能我们做了两个优化前缀树转扁平数组将IP段转换为直接偏移量计算查询复杂度降到O(1)。代价是内存占用翻倍约800MB-1.6GB但现在的服务器内存完全扛得住。CPU缓存预取将热点IP段的记录手动align到64字节缓存行减少cache miss。最终单次查询平均耗时降到0.04ms单机QPS突破500万。代价是代码复杂度飙升但效果值得。如果你也想尝试可以先从mmap内存映射开始避免文件IO开销。然后考虑将IP段排序后使用二分查找这已经能覆盖90%的场景。四、一个容易被忽略的问题最后一个点也是现在很多IP定位服务做得最差的地方不告诉你这个定位有多准。比如一个IP被定位到“杭州市”但实际误差可能是2公里也可能是50公里。业务系统拿到这个结果后该如何决策好的做法是返回radius半径字段。我们的经验是radius 2km时做周边推荐radius 10km时放弃使用IP定位回退其他方式。这个字段的算法不复杂根据数据源质量、IP类型住宅/数据中心、历史校准次数等因素加权计算。但目前主流的免费或低价服务几乎都不提供。建议如果你在选型IP定位供应商一定要问清楚是否支持返回该字段。不是所有IP地理位置精准查询都同等可靠。五、总结以上是我在IP定位方向的几个实践总结不一定全对但都是踩过坑之后的真实经验IPv6定位值得专门投入回报率很高。住宅代理识别比数据中心识别更重要需要引入行为分析。离线库性能优化O(1)查询是完全可行的。标注距离范围是区分专业和业余的关键指标。如果你也在做类似的工作欢迎交流。

相关文章:

2026年,IP地理位置精准查询的几个硬核技术变化

关于IP定位相关最近和几个同行交流,发现大家对IP定位的理解还停留在之前,想把自己这段时间的一些实践整理出来,希望能给同样在搞网络或风控的同行一些参考。 IPv6流量超过IPv4、住宅代理攻击泛滥、CGNAT覆盖越来越广……这些变化正在悄悄改变…...

python 内存管理 内存泄漏及排查方案 内存友好的python代码

Python 内存管理 一、一句话总结 Python 的内存管理就是三件事: 自动分配内存(你不用管变量存在哪)自动回收垃圾(不用的对象自动删掉)靠引用计数 分代垃圾回收实现二、核心机制 1:引用计数(最基…...

解锁.NET 11 新境:ASP.NET Core 10 在微服务安全通信的深化与实践

解锁.NET 11 新境:ASP.NET Core 10 在微服务安全通信的深化与实践 前言 在当今分布式系统盛行的时代,微服务架构已成为构建大型应用的主流选择。ASP.NET Core 10 作为.NET 11 生态中重要的后端框架,为微服务间的安全通信提供了全面且强大的支…...

为什么你的ElevenLabs马来文输出总像“机器人朗读”?资深语音架构师拆解4层韵律建模断层与3个修复级prompt模板

更多请点击: https://intelliparadigm.com 第一章:为什么你的ElevenLabs马来文输出总像“机器人朗读”?资深语音架构师拆解4层韵律建模断层与3个修复级prompt模板 马来语(Bahasa Melayu)虽属声调中性语言,…...

【AI入门知识点】Skills 是什么?终于有人把 Skills、Function Calling、MCP 讲明白了

为什么现在 AI 会查天气?为什么 AI 能读 Excel、操作浏览器、发邮件?为什么很多人说:未来 AI 拼的不是谁更聪明,而是谁 Skills 更多?很多刚学 AI 的人。都会被几个词搞晕:SkillsFunction CallingMCP看起来都…...

C++内存对齐与布局优化

C内存对齐与布局优化内存对齐是编译器为了提高内存访问效率而采用的策略。理解内存对齐规则对于优化结构体大小和提高程序性能至关重要。结构体的内存布局受对齐规则影响,可能包含填充字节。#include #includestruct Unaligned { char a; int b; char c; };struct A…...

C++内联函数性能分析

C内联函数性能分析内联函数通过在调用点展开函数体来消除函数调用开销。理解内联机制和使用场景对于编写高性能代码至关重要。inline关键字建议编译器内联函数。#include #includeinline int add(int a, int b) { return a b; }inline int multiply(int a, int b) { return a …...

设计模式之建造者

问题:构造函数参数太多(「伸缩构造」),或步骤必须按顺序、且步骤组合多变。做法:Director(可选)规定步骤顺序;Builder 提供 setA()、setB()… 最后 build() 返回产品。C 要点&#x…...

向日葵远程控制16.5发布,“免密远控”功能登场便捷又安全

人在公司,急需处理家里电脑上的重要文件,却完全想不起访问密码或者系统的帐号密码;出差在外,想远程操作办公室电脑,却不得不打电话让同事帮忙看一眼密码设置甚至干脆让同事点个接受......密码虽然是一种非常主流的安全…...

WTEW的操作记录

WTEW的操作记录WTEW事务代码的操作记录WTEW事务代码的操作记录 1、查询贸易合同信息 如果是自己创建可以使用WB21、WB22、WB23事务码,如果是税码更新用WBRP更新价格 2、创建后续单据,采购TC创建采购订单,销售TC创建销售订单,注…...

Google三星AI眼镜来了,开发者该关注什么

AI 眼镜又回来了,但这次不只是换个硬件外壳AI 眼镜这个话题,最近又被推到了台前。Google 在 I/O 2026 展示了基于 Android XR 的智能眼镜方向,并把三星、Gentle Monster、Warby Parker 等合作方一起摆上台面。按照目前公布的信息,…...

数据结构——带懒标记的线段树

一、什么是线段树?线段树是一种二叉树数据结构,用于高效地处理区间查询和区间更新操作。核心思想:将数组分成若干个区间(线段),每个节点代表一个区间,通过合并子节点的信息来得到父节点的信息。…...

2026年企业AI落地新趋势!RAG知识库实战指南:环境搭建到生产部署全解析

本文介绍了RAG(检索增强生成)技术在企业知识库中的应用,通过从环境搭建到生产部署的完整实战指南,阐述如何利用RAG提升大语言模型回答的准确性、可追溯性和时效性。文章涵盖了基础环境配置、技术选型、数据准备、知识库构建、RAG系…...

终极Mac微信插件:消息防撤回与多开登录完整指南

终极Mac微信插件:消息防撤回与多开登录完整指南 【免费下载链接】WeChatExtension-ForMac A plugin for Mac WeChat 项目地址: https://gitcode.com/gh_mirrors/we/WeChatExtension-ForMac 还在为Mac微信无法防撤回消息而烦恼吗?想要在同一台电脑…...

一文讲清WMS软件是什么?企业为什么要用WMS软件?

在数字化供应链时代,WMS软件(仓储管理系统)已成为企业物流管理的核心。面对仓库混乱、库存不准,很多企业都在问:WMS软件到底是什么?它和Excel或进销存有什么区别?企业为什么要用WMS软件&#xf…...

Java基础小知识

一、 计算机基础知识1.计算机硬件的分类:运算器 控制器 存储器 输入设备 输出设备二、cmd命令窗口的基本用法操着: 说明:盘符名称 : 盘符切换。E:回车,表示切换到E盘dir 查看当前路径下的内容cd 目录 进入单级目录。cd…...

十三张扑克APP

能开发十三张扑克APP的请联系我,有客户渠道需要这类APP,要开发很多款十三张...

P2-CIFAR彩色图片识别

● 🍨 本文为🔗365天深度学习训练营中的学习记录博客 ● 🍖 原作者:K同学啊学习目标:1.编写一个完整的深度学习程序 2. 手动推导卷积层与池化层的计算过程一、前期准备1.设置GPUimport torch import torch.nn as nn im…...

CANN 算子融合技术:Conv-BN-ReLU 与 MatMul-LayerNorm 等融合模式深度解析

CANN 算子融合技术:Conv-BN-ReLU 与 MatMul-LayerNorm 等融合模式深度解析算子融合是提升性能的关键手段。本文深入讲解昇腾支持的算子融合技术、实现原理和应用实践。一、融合技术概述 1.1 为什么要融合 原始: Conv → BN → ReLU → Conv → BN → ReLU融合前内存…...

Gitea库完整从Ubuntu迁移到CentOS中

文章目录 一、概述 二、数据迁移 2.1 获取数据存储路径 2.2 搞事之前先备份(目标服务器CentOS) 2.2.1 停止gitea服务 2.2.2 备份gitea文件夹 2.3 从Ubuntu的数据目录中将数据拷贝到CentOS中 2.4 备份mysql数据库并拷贝到目标服务器(CentOS) 2.4.1 通过mysqldump备份数据库 …...

复杂干扰下考虑异质性的非机动车微观行为建模与仿真【附仿真】

✨ 长期致力于非机动车微观交通行为、异质性、感知—决策—行动三阶段、社会力模型、模糊逻辑研究工作,擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,点击《获取方式》 (1)非机动车…...

(二) 1. Q-learning的遗憾界分析-高效的Q-learning算法

高效的Q-learning算法 1.1. 无模型算法 1.2. UCB算法 1.3. 文献回顾 无模型(Model-free)强化学习算法(如 Q-learning)无需显式地对环境进行建模,而是直接对价值函数或策略进行参数化和更新。与基于模型(Model-based)的方法相比,这类算法通常更简单、更灵活,因此在现代…...

企业微信外部群如何通过 API 自动化投递结构化小程序卡片

能力介绍 相比于传统的文字链接,结构化的小程序卡片拥有更高的点击率和更规范的视觉展现。该能力允许开发者通过主动调用 API,直接向指定的企业微信外部群投递原生小程序卡片。接口支持自定义动态配置小程序的 appid、首屏页面路径 pagepath&#xff08…...

obsidian博客联动方案

平台文章具有滞后性,最新文章请访问https://blog.nuoyis.net 原先博客需要使用typorapicgotypecho,其中typora编写完毕后需要复制到typecho后台去,极其不方便,然后经过高人指点,我对该软件交互使用开发了新高度 obsidi…...

【考研】2026/5/21

政治2026/5/21唯物辩证法本质上是批判的和革命的:在唯物辩证法看来,一切事物都处在发生、发展和灭亡的过程中,“不存在任何最终的东西、绝对的东西、神圣的东西”。唯物辩证法是客观辩证法与主观辩证法的统一:①客观辩证法&#x…...

1987年4月26日下午15-17点出生性格、运势和命运

1987年4月24日晚上出生的人,如今已步入38岁的门槛。在职业生涯中,这是一个承上启下的关键阶段——既脱离了职场新人的青涩,又尚未到达管理者或专家的巅峰位置。从非命理的角度分析,他们的事业运势与时代变迁、个人选择和社会结构密…...

企业AI合规:数据安全生死线

企业大模型应用中的数据安全合规体系建设 前言:数据安全合规——企业AI落地的必答题 一、合规风险识别与关键挑战 二、技术架构设计与安全合规方案 针对上述四大风险挑战,企业需要从技术架构层面构建纵深防御体系。以下从数据脱敏、访问控制、日志审计、…...

RAG三大冲突与三大死穴及解决方案

RAG :向量召回 稀疏匹配 重排序融合 动态裁剪 —— 冲突根源与工程解法 面向开发者的深度技术解析:揭开 RAG 检索 pipeline 中三个环节的底层冲突,以及幻觉漂移、上下文溢出、检索冗余三大企业级死穴的根治方案。 GitHub 项目地址&#xf…...

《数据挖掘(主编:吕欣 王梦宁)》读书笔记:异常检测方法梳理与实践理解

《数据挖掘(主编:吕欣 王梦宁)》读书笔记:异常检测方法梳理与实践理解本文是学习《数据挖掘(主编:吕欣 王梦宁)》中“异常检测”相关内容后的整理笔记。文章不追求逐条复述教材,而是…...

CANN-ATB多卡推理-昇腾NPU上Llama70B怎么切到8张卡

CANN-ATB多卡推理-昇腾NPU上Llama70B怎么切到8张卡 Llama2-70B 的权重 140GB,单张 Atlas 800I A2 的 64GB 显存放不下。ATB 的多卡推理用 Tensor Parallel 把模型切到多张 NPU 上,每张卡只存 1/N 的权重和 KV Cache。 Tensor Parallel 的切法 Llama2-70B…...