当前位置: 首页 > news >正文

ArcGIS Pro 3.4新功能3:空间统计新特性,基于森林和增强分类与回归,过滤空间自相关

目录

应用 1:它是相关性还是托布勒第一定律?

应用 2:将空间带入非空间模型

结论


在 ArcGIS Pro 3.4 中,我们在新的空间组件实用程序(Moran 特征向量)工具集中发布了一个新工具 -  从字段过滤空间自相关。此工具允许我们获取数值变量并从中提取空间模式。它给了我们所谓的过滤变量和一个或多个空间组件。过滤后的变量表示从原始变量中提取可识别的空间模式后得到的变量。想象图 1 中描绘的场景,绿色的数值变量在南部和东南部地区显示更高的值。通过应用从字段过滤空间自相关工具,变量被分为非空间部分和空间部分。以蓝色显示的非空间部分表示空间过滤变量。从原始变量中删除的空间模式被捕获在相应的空间组件中。一个组件显示东南部和非东南部地区的模式,而另一个组件突出显示非中西部和中西部模式。这些成分各自代表特定尺度的空间自相关,彼此之间不相关。

图片

此工具在两种情况下非常有用。首先,它帮助我们探索两个变量之间的关系,同时减少邻近影响的干扰。其次,它通过消除空间错误指定来增强回归和机器学习模型,并可以使非空间模型成为空间模型。

应用 1:它是相关性还是托布勒第一定律?

“研究人员如何知道变量 y 和变量 x 是否以有意义的方式相互关联,或者它们是否仅仅因为“一切都与其他一切相关”而显得相关?”(Thayn,2017)

作为地理学家或 GIS 分析师,我们认识到大多数现象并非独立于空间而存在。我们相信托布勒地理学第一定律——“万事万物都相互关联,但近处的事物比远处的事物关联性更强。”空间数据的这一独特方面往往违背了观测值相互独立的统计假设。因此,在评估两个变量之间的关系时,很难判断它们的关系是真实的还是仅仅是显著的空间自相关的结果。

例如,下图是波士顿老房子比例与一氧化氮浓度关系的散点图。该图表明,两者呈正相关。随着老房子比例的增加,一氧化氮浓度也上升。

图片

然而,当观测值受到相邻数据点的影响时,确定图 2 中所示的强正关系就变得具有挑战性,因为这可能是由于空间自相关的混杂影响造成的。如果你看看老房子和新奥尔良的地图(下面的2幅图),你会注意到这两个变量都表现出很强的空间聚类性。

图片

图片

这就是“从文件过滤空间自相关”工具发挥作用的地方。它帮助我们从变量中分离出空间成分,使我们能够独立于相邻变量的影响来研究两个变量之间的关系。在该工具中,我首先选择波士顿数据作为输入特征。然后,下面两幅图显示了用于过滤房屋年龄和一氧化氮字段的工具对话框。

图片

图片

通过两次运行此工具生成了两个输出。一个输出地图基于过滤后的 AGE 进行符号化,表示波士顿老房子的比例,不受空间影响(见下面第一张图)。第二张地图展示了过滤后的一氧化氮,显示了过滤空间自相关后的 NO 浓度。

图片

图片

过滤步骤可以在地理处理消息中找到。例如,图 9 演示了如何在四次迭代后消除 AGE 中存在的空间自相关。最初,Moran's I 指数为 0.3206,P 值为 0.001,表明存在显著的空间自相关。从 AGE 中过滤四个空间成分后,Moran's I 指数下降,P 值增加到 0.99。这一变化告诉我们空间自相关不再显著。

图片

现在,下图展示了滤除空间影响后两个变量之间的关系。将应用1的第一幅图与下图进行比较,我们会发现,应用1的第一幅图中显示的强正相关关系很大程度上是由于共享的空间关系,但滤除空间关系后仍然存在一些相关性。

图片

应用 2:将空间带入非空间模型

如前所述,空间数据经常违反传统统计方法的假设,导致估计有偏差和结果可疑。然而,通过整合从字段过滤空间自相关工具返回的空间组件,我们可以将空间信息纳入非空间模型,将其转变为空间感知模型。

举个例子,我们有俄亥俄州的人口统计数据,使用基于森林和增强分类与回归工具构建了一个基于森林的模型。我们的目标是更深入地了解贫困因素,并估计实施潜在干预计划后的贫困百分比。

选择过去 12 个月收入低于贫困水平的人口百分比作为要预测的输入变量。所选的解释训练变量包括:

  1. 受赡养年龄组人口百分比(18 岁以下和 65 岁以上)

  2. 外国出生人口百分比

  3. 房屋自有率:自住住房占已入住住房的百分比

  4. 25 岁及以上人口中最高教育程度为学士学位或更高学位的百分比。

最后,将输出训练特征保存为Poverty_Pred,然后点击运行。

图片

运行该工具后,得到了一个输出训练层,其中显示了其标准化残差(下面第一幅图)。让我们看一下地图,可以注意到两个聚类:绿色阴影的县位于东南部,而紫色阴影的县聚集在西北部。该残差图表明,该模型倾向于低估东南部地区的贫困率(%),而高估西北部地区的贫困率。换句话说,模型的残差中存在明显的空间自相关性。这突显了不同地区预测能力的不平等,表明这种基于森林的模型无法解释数据中存在的某种空间模式。模型性能也需要改进,因为目前的验证 R 平方为 0.578(下面第二幅图)。

图片

图片

为了解决基于森林的模型中的空间偏差,我使用了“从字段过滤空间自相关”工具。

打开该工具,并选择Poverty_Pred(基于森林的模型生成的输出)作为输入特征。

选择标准化残差作为输入字段,指定Poverty_Pred_FilterSpatialAutocorrelationFromField作为输出特征,并且运行该工具。

图片

此工具生成的输出要素不仅包含过滤后的输入字段,还包含与输入字段隔离的空间组件。在这种情况下,空间组件表示我们在上方地图中看到的基于森林的模型无法解释的空间模式。因此,基于森林的模型中包含此空间组件后,该模型可能能够解决预测能力的空间分布不均的问题。

  1. 重新打开基于森林和增强分类与回归,而不是原来的poverty_Ohio。

  2. Poverty_Pred_FilterSpatialAutocorrelationFromField作为输入训练特征。

  3. 保留了大部分预测变量和解释训练变量,同时添加了空间成分作为额外的解释训练变量。

  4. 然后,点击运行。

图片

下图显示了改进的效果。训练 R2 从 0.903 增加到 0.938。更重要的是,验证 R2 从 0.578 显著增加到 0.819,同时所有误差(包括 MAE、MAPE 和 RMSE)均有所减少。这种改进的基于森林的模型表明该模型更加可靠,我们对解释变量重要性和估计贫困率更有信心。

图片

让我们看看变量重要性,注意到我添加到模型中的空间组件位于顶部。空间组件正在捕获我们在原始训练数据集中没有的空间过程,这可能是俄亥俄州贫困的一个关键指标。

图片

我们甚至可以绘制空间成分图,以查看对贫困率影响巨大的空间模式。该成分的模式在俄亥俄州阿巴拉契亚地区显示较高值,而在俄亥俄州非阿巴拉契亚地区显示较低值,这表明我们在试图减轻俄亥俄州的贫困时应该关注这种明显的空间差异。空间成分还为我们提供了应该将哪些现实世界变量纳入模型的见解。当我们不知道可能缺少哪些变量时,应该使用空间成分作为替代。只要有可能,总是建议采用可测量的替代方案。

图片

结论

在这篇文章中,我们展示了“从字段过滤空间自相关”工具如何在两种情况下发挥作用。首先,它通过过滤空间的影响来帮助我们评估两个变量之间的关系。其次,空间成分可以作为模型中缺失的重要解释变量的代理变量。通过将成分添加到非空间机器学习模型中,模型将转变为空间模型,而无需修改模型的结构。此外,从残差中分离出来的空间成分为我们的模型中可能被忽视的现实世界变量提供了宝贵的见解。

转载请注明出处:ArcGIS Pro 3.4新功能3:空间统计新特性,基于森林和增强分类与回归,过滤空间自相关

作者:ArcGIS中国培训中心 www.higisedu.cn

相关文章:

ArcGIS Pro 3.4新功能3:空间统计新特性,基于森林和增强分类与回归,过滤空间自相关

目录 应用 1:它是相关性还是托布勒第一定律? 应用 2:将空间带入非空间模型 结论 在 ArcGIS Pro 3.4 中,我们在新的空间组件实用程序(Moran 特征向量)工具集中发布了一个新工具 - 从字段过滤空间自相关。…...

H3C MPLS跨域optionB

实验拓扑 实验需求 如图,VPN1 和 VPN2 分别通过运营商 MPLS VPN 连接各自分支机构按照图示配置 IP 地址,VPN1 和 VPN2 连接同一个 PE 设备的私网 IP 网段存在地址复用,使用多 VRF 技术来防止 IP 冲突AS 100 和 AS 200 内部的公共网络中各自运行 OSPF 使 AS 内各设备的 Loo…...

源码分析之Openlayers中Geometry基类介绍

概述 在上一篇文章源码分析之Openlayers中Geom篇中提到Geometry类是继承于 Openlayers 中的BaseObject类(参考源码分析之Openlayers中核心BaseObject类).而Geometry类通常情况下也是作为一个抽象基类,作为Geom几何图形的基类或父类,不会在应用中去实例化它.Geometry类回去注册…...

《Vue3 三》Vue 中的 options 选项

data 选项: data 选项:属性值必须是一个函数;返回值是一个对象,返回的对象会被 Vue 的响应式系统劫持,之后对该对象的任何访问或者修改都会在劫持中被处理。 在 Vue2.x 中,data 的属性值可以是一个函数&am…...

Elasticsearch 国产化替代方案之一 Easysearch 的介绍与部署指南

一、前言 在国内数字化转型浪潮和 信创 大背景下,“替代进口”成为许多企业级应用所需要面对的重要课题,搜索领域也不例外。 Elasticsearch(简称 ES)作为一款业界领先的全文搜索和分析引擎,虽然功能强大,但…...

Pytorch | 从零构建EfficientNet对CIFAR10进行分类

Pytorch | 从零构建EfficientNet对CIFAR10进行分类 CIFAR10数据集EfficientNet设计理念网络结构性能特点应用领域发展和改进 EfficientNet结构代码详解结构代码代码详解MBConv 类初始化方法前向传播 forward 方法 EfficientNet 类初始化方法前向传播 forward 方法 训练过程和测…...

Python超能力:高级技巧让你的代码飞起来

文章一览 前言一、with1.1 基本用法1.2 示例自定义上下文管理器 二、条件表达式三、列表式推导式与 zip 结合 四、map() 函数(内置函数)map用于数据清洗1. 数据清洗:字母大小写规范2. filter() 函数 五、匿名函数 lambda5.1 lambda的参数&…...

熊军出席ACDU·中国行南京站,详解SQL管理之道

12月21日,2024 ACDU中国行在南京圆满收官,本次活动分为三个篇章——回顾历史、立足当下、展望未来,为线上线下与会观众呈现了一场跨越时空的技术盛宴,吸引了众多业内人士的关注。云和恩墨副总经理熊军出席此次活动并发表了主题演讲…...

FPGA实现MIPI转FPD-Link车载同轴视频传输方案,基于IMX327+FPD953架构,提供工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐本博主所有FPGA工程项目-->汇总目录我这里已有的 MIPI 编解码方案 3、本 MIPI CSI-RX IP 介绍4、详细设计方案设计原理框图IMX327 及其配置FPD-Link视频串化-解串方案MIPI CSI RX图像 ISP 处理图像缓存HDMI输出工程源码架构 5、…...

vue3动态绑定图片和使用阿里巴巴矢量图

矢量图 1。加购物车 2. 下载在本地 解压 (把以下文件放进项目文件夹里面) ├── font ├── iconfont.css ├── iconfont.json (font-class用法) ├── iconfont.js (symbol用法) ├─…...

‘vite‘ 不是内部或外部命令,也不是可运行的程序

报错:执行 npm run dev时,提示’vite’ 不是内部或外部命令,也不是可运行的程序 解决:执行 npm install -g vite 报错:导入vite后再次执行npm run dev,报错failed to load config from E:\eclipseWP\test1…...

2024年12月一区SCI-加权平均优化算法Weighted average algorithm-附Matlab免费代码

引言 本期介绍了一种基于加权平均位置概念的元启发式优化算法,称为加权平均优化算法Weighted average algorithm,WAA。该成果于2024年12月最新发表在中JCR1区、 中科院1区 SCI期刊 Knowledge-Based Systems。 在WAA算法中,加权平均位置代表当…...

如何获取 ABAP 内表中的重复项

要识别 ABAP 内表中的重复项,可以结合使用排序和循环。下面的示例展示了如何查找内部表中的重复条目: DATA: BEGIN OF itab OCCURS 0,field1 TYPE i,field2 TYPE c LENGTH 10,END OF itab,wa LIKE LINE OF itab.* Add sample data to internal table it…...

编译笔记:vs 中 正在从以下位置***加载符号 C# 中捕获C/C++抛出的异常

加载符号 解决方法: 进入VS—工具—选项----调试----符号,看右边有个“Microsoft符号服务器”,将前面的勾去掉,(可能还有删除下面的那个缓存)。 参考 C# 中捕获C/C抛出的异常 在需要捕捉破坏性异常的函数…...

ChatGPT与Postman协作完成接口测试(二)

ChatGPT生成的Postman接口测试用例脚本如下所示。 ChatGPT生成的Postman接口测试用例脚本 以下是符合Collection v2.1格式要求的 Postman 测试用例脚本,覆盖了正常注册和密码不匹配两种情况的测试: { "info": { "_postman_id": &qu…...

flask-admin modelview 中重写get_query函数

背景: flask-admin框架中提供的模型视图默认是显示表实体中的所有列表数据,如果想通过某种条件限制初始列表数据,那么久需要重写一些方法才能实现。 材料: 略 制作: 视图源码: def get_query(self):re…...

【python 逆向分析某有道翻译】分析有道翻译公开的密文内容,webpack类型,全程扣代码,最后实现接口调用翻译,仅供学习参考

文章日期:2024.12.24 使用工具:Python,Node.js 逆向类型:webpack类型 本章知识:sign模拟生成,密文的解密(webpack),全程扣代码,仅供学习参考 文章难度:低等(没…...

tensorflow_probability与tensorflow版本依赖关系

参考:Tensorflow Probability 与 TensorFlow 的版本依赖关系_tensorflow与tensorflow-probability对应版本的网址-CSDN博客 tensorflow2.10对应tensorflow_probability0.18.0,安装命令:pip install tensorflow_probability0.18.0 版本对应关…...

构建安全的用户认证系统:PHP实现

构建安全的用户认证系统:PHP实现 用户认证是任何Web应用的重要组成部分,确保只有授权用户才能访问特定资源。构建一个安全的用户认证系统需要考虑多种因素,包括密码存储、会话管理和防止常见gongji。本文将介绍如何使用PHP实现一个安全的用户…...

VMD-SSA-BiLSTM、VMD-BiLSTM、BiLSTM时间序列预测对比

VMD-SSA-BiLSTM、VMD-BiLSTM、BiLSTM时间序列预测对比 目录 VMD-SSA-BiLSTM、VMD-BiLSTM、BiLSTM时间序列预测对比预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.MATLAB实现VMD-SSA-BiLSTM、VMD-BiLSTM、BiLSTM时间序列预测对比; 2.单变量时间序列预测 就是先vmd把变…...

2026年4月OpenClaw如何集成?云端4分钟保姆级方法+大模型APIKey、Skill集成

OpenClaw是什么?OpenClaw能干什么?OpenClaw怎么部署使用?本文面向零基础用户,完整说明在轻量服务器与本地Windows11、macOS、Linux系统中部署OpenClaw(Clawdbot)的流程,包含环境配置、服务启动、…...

如何用SunnyUI快速构建现代化WinForm应用:终极C界面开发指南

如何用SunnyUI快速构建现代化WinForm应用:终极C#界面开发指南 【免费下载链接】SunnyUI SunnyUI.NET 是基于.NET Framework 4.0、.NET6、.NET8、.NET9 框架的 C# WinForm UI、开源控件库、工具类库、扩展类库、多页面开发框架。 项目地址: https://gitcode.com/gh…...

揭秘!中国八大软件外包公司

👉 这是一个或许对你有用的社群🐱 一对一交流/面试小册/简历优化/求职解惑,欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料: 《项目实战(视频)》:从书中学,往事上…...

忍者像素绘卷Ubuntu系统部署全指南:从环境配置到服务上线

忍者像素绘卷Ubuntu系统部署全指南:从环境配置到服务上线 1. 前言:为什么选择这套方案 最近在帮朋友部署一个AI绘画项目时,发现很多教程要么太简单要么太复杂。今天给大家分享一个经过实战检验的Ubuntu部署方案,特别适合"忍…...

Java静态镜像内存优化实战手册(Heap Size从286MB直降至42MB的完整链路)

第一章:Java静态镜像内存优化实战手册(Heap Size从286MB直降至42MB的完整链路)在GraalVM Native Image构建的Java服务中,初始堆内存(-Xms)常被默认设为256MB以上,导致容器资源浪费严重。本章基于…...

告别网盘限速烦恼:八大平台直链下载工具完整指南

告别网盘限速烦恼:八大平台直链下载工具完整指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘 …...

[具身智能-322]:词向量的含义与发展历史、趋势

词向量(Word Embedding)是自然语言处理(NLP)领域的基石技术,它的核心思想是将人类语言中的词汇转换为计算机能够理解和计算的数学形式——即稠密的低维实数向量。简单来说,词向量技术让机器不再把词语看作孤…...

Java与C++:7大核心差异全解析

好的,Java 和 C 都是广泛使用的面向对象编程语言,但它们在设计哲学、特性和应用场景上存在显著区别。以下是它们的主要差异:1. 内存管理C:支持手动内存管理(通过 new/delete 操作符)。程序员需自行分配和释…...

Phi-4-mini-reasoning人工智能伦理评估框架初探

Phi-4-mini-reasoning人工智能伦理评估框架初探 1. 引言:当AI开始监督AI 最近测试Phi-4-mini-reasoning模型时,发现一个有趣现象:这个擅长逻辑推理的小型模型,在分析其他AI生成内容时展现出惊人的"挑错"能力。它能准确…...

Llama-3.2V-11B-cotGPU优化教程:量化+FlashAttention提升吞吐300%实操

Llama-3.2V-11B-cot GPU优化教程:量化FlashAttention提升吞吐300%实操 1. 项目概述与优化目标 Llama-3.2V-11B-cot 是一个支持系统性推理的视觉语言模型,基于LLaVA-CoT论文实现。这个模型结合了图像理解和逐步推理能力,采用独特的四步推理格…...