当前位置: 首页 > article >正文

宝可梦GO用一场全民游戏,完成了全球最大规模的众包实景测绘

2026 年 3 月Niantic 旗下空间智能企业 Niantic Spatial 宣布与末端配送机器人厂商 Coco Robotics 达成战略合作将《宝可梦 GO》全球玩家 10 年间众包积累的 300 亿张带精准定位的实景影像用于训练视觉定位系统VPS为城市配送机器人提供厘米级定位能力解决城市场景 GPS 失效的核心痛点实现 VPS 技术从消费级 AR 游戏到企业级空间智能基础设施的规模化商业化落地。视觉定位系统VPSVisual Positioning System简单来说就是用眼睛/摄像头看周围环境来判断自己在哪里的技术。想象一下当你在高楼大厦之间、室内商场、地下停车场普通GPS经常实效误差几米到几十米甚至完全没信号这时候VPS就像给手机/设备装了个“超级认路大脑”它看一眼周围的建筑、招牌、路灯、墙上的纹理就能知道你精确到厘米级的位置和朝向。GPS ≈ 用天上的卫星喊话“我在哪”容易被大楼、树、隧道挡住VPS ≈ 你自己睁眼看四周“哦这是那个有大钟的教堂拐角我知道自己在哪了”意味着它直接理解真实世界路况而不是靠无线电信号。VPS最经典的工作原理三步走像人认路提前建“视觉地图”云端数据库像谷歌/ Niantic 等公司开车或用无人机拍无数街景照片把每张照片里的关键点特征点比如窗户角、广告牌边缘提取出来 记录精确3D坐标建成一个超级详细的“视觉指纹库”。你拍照/摄像头看一眼你的手机摄像头拍下当前画面 → 系统快速提取画面里的特征点也叫“视觉指纹”。云端比对 → 瞬间定位把你拍的“指纹”上传云端和提前建好的海量视觉地图比对 → 找到最匹配的位置 → 直接告诉你你现在就在这个路口朝北偏西12度误差±10厘米。经典例子手机对准街道出现卡通狐狸引导你转弯这就是Google VPS AR导航的典型表现如下图所示特征点匹配示意把建筑物关键点连线像蜘蛛网一样匹配你当前视角和地图视角VPS 技术的理论优势在 Niantic 的十年布局中完成了从技术验证到规模化商业落地的闭环而核心载体正是现象级 AR 手游《宝可梦 GO》。2016 年由谷歌分拆企业 Niantic 联合宝可梦公司推出的《宝可梦 GO》成为全球首个现象级 AR 产品。这款游戏将宝可梦 IP 与 LBS 技术结合让全球数亿玩家走上街头通过手机摄像头捕捉叠加在现实场景中的虚拟宝可梦也在无意间完成了一场全球规模最大的众包实景测绘。2020 年游戏新增实地研究功能以游戏内稀有奖励为激励引导玩家专门扫描现实中的雕像、地标、建筑进一步加速了全球实景 3D 模型的构建Niantic Labs 推出的宝可梦游乐场Pokémon Playgrounds正是 VPS 技术首次在消费级应用中实现规模化落地。该项目通过视觉锚定技术实现了与物理环境精准匹配的持续性数字体验让虚拟元素与现实世界实现了无缝交互也验证了 VPS 技术在消费级场景的成熟度。截至 2026 年游戏上线 10 年间全球玩家累计贡献了超 300 亿张带高精度定位元数据的实景影像覆盖全球超 100 万个地标热点形成了全球规模最大、维度最丰富的城市实景 3D 模型库这正是 Niantic VPS 技术的核心壁垒。2025 年Niantic 完成战略转型将全部游戏业务以 35 亿美元出售给手游厂商 Scopely同步分拆成立 Niantic Spatial全面转型为地理空间 AI 与空间智能服务商核心产品正是基于十年众包数据打磨的 VPS 系统。2026 年 3 月Niantic Spatial 正式宣布与美国末端配送机器人厂商 Coco Robotics 达成战略合作将其 VPS 系统规模化应用于城市末端配送场景这也是 VPS 技术在企业级场景的首次大规模商业化落地。Coco Robotics 目前已在美国洛杉矶、芝加哥、泽西城、迈阿密以及芬兰赫尔辛基部署了约 1000 台配送机器人设备最大可容纳 8 个超大号披萨或 4 袋生鲜杂货以约 5 英里 / 小时的速度在人行道行驶截至 2026 年已完成超 50 万单配送。而制约其规模化扩张的核心痛点正是传统 GPS 在城市峡谷场景的失效 高楼、地下通道、高架桥下的 GPS 信号反射与干扰会导致定位误差最高达 50 米直接造成机器人迷路、配送延误。而 Niantic 的 VPS 系统完美解决了这一痛点Coco 的配送机器人搭载 4 颗全景摄像头通过 VPS 系统实时匹配周边实景与后台 3D 模型精准判断自身位置与前进方向定位精度可达厘米级即便在 GPS 完全失效的场景机器人也可精准停在餐厅外的取餐点避免遮挡行人同时精准停靠在客户家门口解决了末端配送「最后一米」的定位难题机器人摄像头的腰部高度视角与《宝可梦 GO》玩家的手持视角虽有差异但基于海量多维度数据的 VPS 模型仅需简单适配即可稳定运行。与 Coco Robotics 的合作只是 Niantic VPS 技术商业化的第一步。公司的终极目标是构建面向机器的、实时更新的全球活地图Living Map一套超精细的现实世界虚拟仿真系统会随着现实世界的变化同步更新。一旦搭载 VPS 的配送机器人、智能设备上路它们采集的全新实景数据将反哺 VPS 模型进一步提升定位精度与场景覆盖度形成数据采集 - 模型优化 - 场景拓展的持续闭环。而 Niantic 的差异化优势在于通过消费级游戏提前 10 年完成了全球规模的基础数据积累无需像自动驾驶企业那样从零开始通过路测采集数据。更长远来看Niantic 正在重构地图的核心价值传统地图的服务对象是人类核心逻辑是地图点位对应现实空间坐标而面向机器的地图需要成为一套可被机器理解的世界指南为每一个物体标注属性与语义信息让机器真正理解它所看到的世界。黑鸟基于上述内容进行扩展可以发现VPS的技术落地是计算机视觉与空间计算的协同运作核心分为五大关键步骤特征检测与提取设备摄像头采集环境影像后VPS 会识别画面中的关键视觉特征 —— 包括角点、边缘、纹理等在不同视角、光照条件下仍可稳定识别的特征点并将这些特征转化为数学描述符形成场景的「视觉指纹」。特征匹配将提取的特征点与预存的参考数据库中的已测绘视觉数据进行比对。该匹配过程采用鲁棒性算法可应对视角、光照、季节变化等对视觉外观的影响。位姿估算当完成足够数量的特征匹配后系统通过几何算法计算出设备相对于匹配参考点的精准位置与朝向二者合称「位姿」最终形成六自由度定位结果 —— 覆盖空间位置x、y、z 三轴坐标与朝向俯仰、偏航、横滚三轴角度。3D 建图与空间锚定VPS 平台会维护环境的精细化 3D 地图通常通过摄影测量或激光雷达扫描构建。这些地图中包含空间锚点 —— 带有精准坐标的持续性参考点可让数字内容精准锚定在物理空间中。机器学习优化通过神经网络持续提升 VPS 能力包括在复杂环境下更稳定的特征识别、可识别物体与空间关系的语义理解能力以及可预判移动轨迹、提升系统响应速度的预测模型。除末端配送机器人外VPS 技术正在多个行业实现落地推动运营效率提升与全新能力的构建一零售行业面向消费者店内精准导航可引导顾客直达目标商品同时推送基于精准位置的个性化促销信息面向运营实现精准的货架巡检、陈列合规校验以及实时库存位置追踪大幅缩减商品查找耗时。二仓储物流行业在配送中心部署 VPS可为拣货人员提供精准的导航指引与实时操作指令大幅提升拣货效率同时让机器人与人类员工在共享空间内协同作业凭借精准的空间感知能力保障安全还可通过资产精准定位提升库存管理精度。三汽车行业整车厂商正在通过 VPS提升停车场、城市走廊等 GPS 失效场景的导航能力同时优化复杂环境下的自动驾驶表现为高级驾驶辅助系统提供精准的车道级定位。例如全球领先的汽车系统供应商采埃孚ZF Friedrichshafen AG就通过 Niantic Spatial 的扫描技术与 Sphere 空间工具替代了传统的 3D 打印与实物模型通过虚拟设备布局与实时调整以 XR 驱动的精准布局优化了工厂规划流程验证了 VPS 在汽车制造领域的效率提升价值。四建筑与工地管理在建筑场景中VPS 可实现建材与设备相对于数字图纸的精准定位实时对比施工进度与 BIM建筑信息模型数据在偏差造成高额成本前及时提供项目进度与施工偏差的可落地洞察。尽管 VPS 拥有巨大的应用潜力但企业在落地过程中仍需应对多项技术与运营挑战环境与光照条件限制极端弱光环境、高反光表面等场景会降低 VPS 的定位精度算力与功耗的平衡实时运行的 VPS 对设备算力要求较高在移动设备上需要在定位精度与电池续航之间做出平衡数据库的持续更新在物理环境频繁变动的动态场景中维护最新的视觉参考数据库存在一定的运营难度企业系统集成难度将 VPS 系统与企业现有业务系统集成需要完善的规划尤其对于拥有大量传统基础设施的企业集成门槛更高。VPS 技术的核心壁垒来自海量的实景影像数据而数据的采集、二次利用与商业化也带来了严峻的隐私合规与伦理挑战这也是本次《宝可梦 GO》数据赋能配送机器人事件引发行业热议的核心原因。《宝可梦 GO》的所有影像数据均来自玩家的游戏行为但绝大多数玩家在拍摄实景、参与游戏时并不知晓自己的行为会在数年后被用于训练配送机器人的 VPS 系统。这种为单一目的收集的用户数据被跨场景商业化二次利用的行为超出了用户最初的授权预期也成为 AI 时代数据合规的典型争议案例。这并非个例此前谷歌的 CAPTCHA 人机验证就长期被质疑以验证身份为名收集用户标注的图片训练 AI 视觉模型位智Waze的用户生成内容也曾被执法部门获取用于案件调查。而 Niantic 的 VPS 系统可通过单张照片的地标实现厘米级定位对执法部门有着极强的吸引力存在数据被违规调用的潜在风险。玩家拍摄的实景影像中不可避免地会包含行人、私人场所、车牌、人脸等敏感隐私信息。尽管 Niantic 声称会对数据进行脱敏处理但大规模的实景影像收集、存储与商业化利用始终存在隐私信息泄露、被滥用的隐患。尤其当 VPS 技术规模化落地后海量智能设备将持续采集街景影像形成对公共空间的常态化视觉监控进一步加剧了公众的隐私焦虑。

相关文章:

宝可梦GO用一场全民游戏,完成了全球最大规模的众包实景测绘

2026 年 3 月,Niantic 旗下空间智能企业 Niantic Spatial 宣布与末端配送机器人厂商 Coco Robotics 达成战略合作,将《宝可梦 GO》全球玩家 10 年间众包积累的 300 亿张带精准定位的实景影像,用于训练视觉定位系统(VPS&#xff09…...

Z-Image Atelier 安全合规使用指南:避免生成侵权与违规内容

Z-Image Atelier 安全合规使用指南:避免生成侵权与违规内容 最近和几个做内容的朋友聊天,发现大家用AI图像生成工具时,最头疼的不是技术问题,而是“安全”问题。有位朋友用工具生成了一张产品宣传图,结果因为背景里无…...

3D打印螺纹优化:FDM螺纹设计的技术突破与实践指南

3D打印螺纹优化:FDM螺纹设计的技术突破与实践指南 【免费下载链接】Fusion-360-FDM-threads 项目地址: https://gitcode.com/gh_mirrors/fu/Fusion-360-FDM-threads 🔍 3D打印螺纹的核心挑战:传统设计的三大缺陷分析 在FDM&#xff…...

Python timm库实战:5分钟搞定图像分类模型加载与预测(附完整代码)

Python timm库实战:5分钟搞定图像分类模型加载与预测(附完整代码) 在计算机视觉领域,预训练模型已经成为快速解决实际问题的利器。PyTorch生态中的timm库(PyTorch Image Models)以其丰富的模型集合和简洁的…...

GitLab Runner保姆级配置指南:从零搭建前端项目的CI/CD流水线(含避坑技巧)

GitLab Runner保姆级配置指南:从零搭建前端项目的CI/CD流水线(含避坑技巧) 如果你是一名前端开发者,正为每次手动部署项目而烦恼,那么GitLab Runner可能是你的救星。它能将代码提交、构建、测试和部署的过程自动化&…...

Matplotlib中文显示报错?手把手教你从下载SimHei到配置的完整流程

Matplotlib中文显示终极解决方案:从字体配置到深度优化 你是否曾经遇到过这样的场景:精心编写的Matplotlib图表代码,在展示中文标题或标签时却变成了一堆乱码或方框?这种问题在数据可视化项目中尤为常见,特别是当你的报…...

快速部署MT5文本改写工具:零配置开启你的NLP增强工作站

快速部署MT5文本改写工具:零配置开启你的NLP增强工作站 1. 从想法到结果,只需三步 你是不是也遇到过这样的烦恼?写文案时,一个意思翻来覆去就是那几种说法;做NLP项目时,训练数据总是不够用,模…...

AudioSeal开源模型应用:播客创作者AI语音分身内容授权管理与收益分账系统

AudioSeal开源模型应用:播客创作者AI语音分身内容授权管理与收益分账系统 1. 项目背景与价值 在播客内容创作领域,AI语音克隆技术正在快速普及。许多创作者开始使用自己的声音训练AI模型,生成大量语音内容。但随之而来的问题是:…...

MT5文本裂变效果惊艳:真实案例展示AI如何改写电商文案

MT5文本裂变效果惊艳:真实案例展示AI如何改写电商文案 你是不是也遇到过这样的困境? 精心打磨了一版电商文案,想换个说法测试点击率,却发现自己陷入了“词穷”的尴尬——翻来覆去就那么几个词,改来改去还是原来的味道…...

巨噬细胞极化及其在肿瘤微环境中的作用研究

一、巨噬细胞的起源与组织分布巨噬细胞是具有高度异质性的免疫细胞,其起源具有显著的个体发育差异。在胚胎发育过程中,部分组织驻留巨噬细胞来源于卵黄囊和胎肝前体细胞,如皮肤朗格汉斯细胞、中枢神经系统小胶质细胞、肝脏枯否细胞和肺泡巨噬…...

衡山派平台LVGL GUI开发常见问题排查与性能优化指南

衡山派平台LVGL GUI开发常见问题排查与性能优化指南 最近在衡山派(ArtInChip)平台上做LVGL图形界面开发,特别是用D13x/D12x这类内存比较紧张的平台时,总会遇到一些“坑”。比如图片死活显示不出来,或者看线程状态总觉得…...

YYW-500A型动平衡机

YYW-500A型动平衡机一、用途特点:YYW系列动平衡机是硬支承卧式动平衡机,采用滚轮支承,万向联轴节驱动,普通型为双速电机驱动,“A"型为变频电机加变频器调速,由工业控制计算机进行数据处理,…...

Fish Speech-1.5语音合成提效方案:自动化脚本批量生成教学音频

Fish Speech-1.5语音合成提效方案:自动化脚本批量生成教学音频 1. 引言:教学音频制作的效率痛点 作为教育工作者或内容创作者,你是否遇到过这样的困扰:需要为大量课程内容录制音频,但人工录制耗时耗力,音…...

FanControl风扇控制解决方案:提升散热效率的5大核心技巧+3类场景方案

FanControl风扇控制解决方案:提升散热效率的5大核心技巧3类场景方案 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHu…...

SiameseUniNLU实战案例:高校科研管理系统——论文标题关键词抽取+研究方向归类

SiameseUniNLU实战案例:高校科研管理系统——论文标题关键词抽取研究方向归类 1. 引言:高校科研管理的“信息焦虑” 想象一下,你是一位高校科研管理处的老师。每年,你需要处理来自几十个学院、上百个研究团队提交的数千篇论文信…...

Nacos安全认证密码修改失败?可能是这个隐藏Bug在作怪

Nacos安全认证密码修改失败的深度排查与解决方案 最近在Nacos配置中心的管理过程中,不少运维团队反馈遇到一个棘手问题:当尝试修改安全认证密码时,系统会抛出"Aut... Failed"错误提示,导致密码无法正常更新。这个问题看…...

PyTorch实战:如何用MSE损失函数优化你的回归模型(附完整代码)

PyTorch实战:如何用MSE损失函数优化你的回归模型(附完整代码) 在机器学习的世界里,回归问题就像一位精准的预言家,试图从纷繁复杂的数据中找出变量之间的真实关系。而要让这个预言更加准确,选择合适的损失函…...

高效视频采集实践:基于V4L2的mmap模式内存映射技术解析

1. 为什么需要内存映射技术 在视频采集领域,数据搬运效率一直是开发者最头疼的问题之一。想象一下,你正在用摄像头录制1080p的视频,每秒30帧的画面需要从硬件设备传输到你的应用程序。如果采用传统的数据拷贝方式,每一帧画面都要经…...

小智 AI + MCP协议 + 设备端自动化,从闹钟到智能场景的无限可能

1. 小智AI与MCP协议的完美结合 记得第一次接触小智AI时,它还只是个简单的语音助手,能做的事情非常有限。但随着MCP协议的引入,整个生态发生了翻天覆地的变化。MCP(Multi-Connect Protocol)就像是为小智AI插上了一对翅膀…...

深入解析dedeCMS V5.7 SP2后台代码执行漏洞(CNVD-2018-01221)的防御与修复策略

1. 漏洞背景与危害分析 dedeCMS作为国内广泛使用的开源内容管理系统,其V5.7 SP2版本中存在的后台代码执行漏洞(CNVD-2018-01221)曾给大量网站带来严重安全威胁。这个漏洞本质上源于tpl.php文件对用户输入缺乏有效过滤,攻击者通过构…...

颠覆式数据采集:从零开始掌握GetDataFromSteam-SteamDB

颠覆式数据采集:从零开始掌握GetDataFromSteam-SteamDB 【免费下载链接】GetDataFromSteam-SteamDB 项目地址: https://gitcode.com/gh_mirrors/ge/GetDataFromSteam-SteamDB GetDataFromSteam-SteamDB是一款专业的用户脚本工具,通过浏览器扩展实…...

AI 应用软件的外包开发

在国内进行 AI 应用软件(如您关注的 AI 英语口语或朗读类 APP)的外包开发,2026 年的市场环境已经非常成熟,但也存在显著的价格梯度和技术陷阱。以下是国内 AI 外包开发的深度解析:1. 核心费用构成与价格区间国内开发费…...

Realistic Vision V5.1插件生态展望:Skill Creator智能体开发入门

Realistic Vision V5.1插件生态展望:Skill Creator智能体开发入门 你有没有过这样的经历?面对Realistic Vision V5.1这样强大的图像生成模型,心里明明有个绝妙的画面,却不知道该怎么用那一长串复杂的参数把它描述出来。比如&…...

Hunyuan新闻翻译实战:实时资讯多语种发布

Hunyuan新闻翻译实战:实时资讯多语种发布 在媒体机构、跨境企业与国际传播团队的实际工作中,一条突发新闻从中文源发到面向全球读者的多语种同步发布,往往只有几十分钟窗口期。传统人工翻译加审校流程难以满足时效性要求,而通用翻…...

PP-DocLayoutV3实战案例:科研论文PDF截图中公式编号与inline_formula区分

PP-DocLayoutV3实战案例:科研论文PDF截图中公式编号与inline_formula区分 1. 引言:科研文档处理的痛点与解决方案 科研工作者在日常工作中经常遇到这样的场景:从PDF论文中截取包含数学公式的图片,需要准确识别其中的公式内容、公…...

AI大模型转行避坑指南:从方向选择到学习路径,老程序员手把手教你入行

这两年,大模型早已跳出实验室的围墙,悄悄走进了程序员的代码库、学生的学习计划,甚至转行者的职业蓝图里。 几乎每天都能收到这样的提问: “我是做后端开发的,想转到大模型领域可行吗?” “市面上的课程太…...

Sublime Text 3 正则替换实战:5分钟搞定符号转换行(附Mac/Win快捷键对照表)

Sublime Text 3 跨平台正则替换指南:从符号转换到批量排版优化 当你面对上千行的日志文件需要清洗格式,或是需要将杂乱的JSON数据快速规范化时,手动调整无疑是场噩梦。作为跨平台开发者,我在Windows和Mac之间切换工作时&#xff…...

HY-Motion 1.0企业应用:直播平台虚拟主播实时动作驱动,降低真人出镜运营成本

HY-Motion 1.0企业应用:直播平台虚拟主播实时动作驱动,降低真人出镜运营成本 1. 引言:虚拟主播,直播行业降本增效的新解法 直播行业这几年发展得有多快,大家有目共睹。但繁荣的背后,是越来越高的运营成本…...

立创开源:基于AC6965A与TPA3116的TWS无损三模蓝牙音箱DIY全攻略

立创开源:基于AC6965A与TPA3116的TWS无损三模蓝牙音箱DIY全攻略 最近有不少朋友问我,想自己动手做一个音质不错、功能又全的蓝牙音箱,有没有好的开源方案?正好,我在立创开源平台找到了一个非常棒的项目——一个支持TWS…...

音频像素工坊快速上手:5分钟搞定语音合成与人声分离

音频像素工坊快速上手:5分钟搞定语音合成与人声分离 1. 认识音频像素工坊 音频像素工坊是一款融合复古风格与现代AI技术的音频处理工具。它将语音合成(TTS)和人声分离(UVR)两大核心功能,包装在90年代复古像素风格的界面中,让枯燥的音频处理…...