空间数据分析入门POI与莫兰指数基础知识笔记
1. 空间分析与POI
1.1. 什么是POI
POI是“Polnt of Information”的缩写,中文可以翻译为“信息点”。POI是地图上任何非地理意义的有意义的点,如商店、酒吧、加油站、医院、车站等。这些点通常包括名称、类别、经纬度和地址等基本信息。此外,POI数据还可以进一步扩展,包括营业时间、联系电话、人均消费等信息,以满足不同应用场景的需求。
POI数据的应用场景非常广泛,包括但不限于:
- 城市规划和管理:POI数据可以帮助城市规划者了解城市的功能区分布、中心识别和业态集聚等情况,以便更好地制定城市规划和管理的策略。
- 商业选址和营销:商家可以通过POI数据了解目标区域的商业分布和竞争情况,选择合适的店铺位置并进行精准营销,提高市场占有率和营业额。
- 智能交通和导航:POI数据可以帮助导航系统实现更精准的定位和路线规划,为驾驶员提供更加便捷的出行路线和实时交通信息。
- 社交媒体和广告:POI数据可以帮助社交媒体平台了解用户的行为和兴趣,推送更加精准的广告和个性化推荐内容。
- 旅游和文化:POI数据可以帮助旅游和文化部门了解旅游景点的分布和特点,提供更加便捷的旅游信息和宣传推广。
- 公共服务和民生:POI数据可以帮助政府和公共服务机构了解市民的需求和分布情况,提供更加贴心和便捷的民生服务。
总之,POI数据在城市规划和管理、商业选址和营销、智能交通和导航、社交媒体和广告、旅游和文化以及公共服务和民生等领域都具有广泛的应用前景。
1.2. POI的来源
序号 | 分类 | 来源 | 说明 |
---|---|---|---|
1 | 科研机构 | 北大地理数据;科学院地理科学与资源研究所 | geodata.pku.edu.cn,www.resdc.cn |
2 | 地图服务提供商 | 百度,高德,腾讯,谷歌等 | |
3 | 地图软件 | 水经注、BIGEMAP地图、小O地图、ArcGIS | |
4 | 在线地图坐标拾取工具 | 规划云 | www.guihuayun.com |
5 | 社交媒体 | 大众点评、小红书 | 社交媒体平台上有用户自发贡献的POI信息 |
6 | 商业数据提供商 | ||
7 | 政府机构或公共部门 | 城市内的公交站点,交通信号灯 | /www.openstreetmap.org |
需要注意的是,不同来源的POI数据的质量和可靠性可能存在差异,同时不同的应用场景也需要不同类型的POI数据。因此,在选择和使用POI数据时,需要根据具体需求进行评估和筛选。
1.3. POI坐标及标准
当前互联网地图的坐标系主要分为地球坐标 (WGS84)是国际标准,从 GPS 设备中取出的数据的坐标系,国际地图提供商使用的都是这个坐标系。
火星坐标 (GCJ-02)也叫国测局坐标系,中国标准,从国行移动设备中定位获取的坐标数据使用这个坐标系,国家规定:国内出版的各种地图系统(包括电子形式),必须至少采用GCJ-02对地理位,置进行首次加密。Google国内地图(.cn域名下)腾讯搜搜、阿里系高德地图都是这个坐标系。
百度坐标 (BD-09),百度标准,百度 SDK,百度地图,Geocoding 使用(本来就乱了,百度又在火星坐标上来个二次加密)。
综上所述,以上方法获取的POI需要根据来源进行坐标转换至通用的WGS84坐标系下进行处理。
1.4. 空间分析与POI
空间分析与POI(Point of Interest,兴趣点)数据的结合可以帮助我们深入了解地理空间中的特征、趋势和关联性。下面是一些关于空间分析与POI数据的观点:
-
地理空间特征分析: 使用空间分析技术,可以帮助我们理解地理空间中不同区域的特征和分布。通过对POI数据进行空间分析,可以发现不同区域的POI分布模式、密度分布、集聚特征等,从而了解城市的功能分布、交通流量、人口分布等信息。
-
地理空间趋势探测: 通过对历史POI数据的空间分析,可以发现地理空间中的发展趋势和变化。可以观察不同时间段内POI的新增、消失、迁移等情况,分析城市发展的动态变化、商业热点的演变等。
-
空间关联性分析: 空间分析可以帮助我们理解不同POI之间的空间关联性。通过空间自相关分析、热点检测、空间插值等技术,可以发现不同类型POI之间的空间关联关系,例如商业中心和餐饮区域的空间聚集关系、交通枢纽和商业中心的空间联系等。
-
基于空间分析的POI应用: 空间分析为POI数据的应用提供了重要支持。基于空间分析的POI应用包括城市规划、商业选址、交通规划、旅游推荐等。通过空间分析,可以优化POI数据的利用,提高应用的效果和准确性。
-
空间数据可视化与交互: 空间分析与POI数据的结合还可以支持空间数据的可视化与交互。通过地图可视化、空间数据查询、交互式分析等技术,可以直观展示POI数据的空间分布特征,帮助用户理解地理空间中的信息和关联性。
综上所述,空间分析与POI数据的结合可以为我们提供丰富的地理空间信息,帮助我们理解城市的发展特征、商业格局、人口流动等,为城市管理、规划和决策提供重要参考。
1.5. 分析方法案例
核心思想
核心思想是特定类型的POI组合空间聚集在一起可以支持特定的城市功能区。比如在典型的中央商务区,聚集着办公类型的场所,商业服务设施,餐馆,酒店公寓等;而在飞机场附近则更多是酒店和物流集散中心等的共现;大型购物区域是各类衣包鞋和餐饮类POI的聚集共现。
分析方法
例如分析方法是在机器学习和自然语言处理中常用的主题模型(Topic Model),用来在一系列自然语言描述的文档中发现抽象主题的一种统计模型。但是考虑到POI分布和场所特征的独特性,比如一个橄榄球场馆附近有很多餐馆和酒吧,但是球馆只有一个,如果计算词频只是1,但是它却对于这个功能区域的特征贡献很大。本研究并没有直接通过传统的自然语言处理TF-IDF分析,而是同时结合了位置社交媒体(Foursquare)上的签到数据来刻画一个POI的受欢迎程度,在模型训练过程中实现重采样,得到更符合地理场所空间分布特征和使用强度的主题。下图为几个常见功能区所具有的不同类别POI的共现概率分布。
2. 莫兰指数
2.1. 什么是莫兰指数
一般说来,莫兰指数分为全局莫兰指数(GlobalMoran’s I)和安瑟伦局部莫兰指数(AnselinLocal Moran’s I)。其中,莫兰指数是澳大利亚统计学家莫兰(Patrick Alfred PierceMoran)在1950年提出的,安瑟伦局部莫兰指数是美国亚利桑那州立大学地理与规划学院院长Luc Anselin教授在1995年提出的。
莫兰指数(Moran’s I)是一种用于衡量空间自相关性的统计指标,它可以帮助我们理解地理空间数据中是否存在空间集聚或空间分散的现象。莫兰指数的大小和方向可以告诉我们数据的空间分布特征。
莫兰指数(Moran’s I)的计算公式如下:
I = n ∑ i = 1 n ∑ j = 1 n w i j × ∑ i = 1 n ∑ j = 1 n w i j ( x i − x ˉ ) ( x j − x ˉ ) ∑ i = 1 n ( x i − x ˉ ) 2 I = \frac{n}{\sum_{i=1}^{n}\sum_{j=1}^{n}w_{ij}} \times \frac{\sum_{i=1}^{n}\sum_{j=1}^{n}w_{ij}(x_i - \bar{x})(x_j - \bar{x})}{\sum_{i=1}^{n}(x_i - \bar{x})^2} I=∑i=1n∑j=1nwijn×∑i=1n(xi−xˉ)2∑i=1n∑j=1nwij(xi−xˉ)(xj−xˉ)
其中:
- n n n 是观测值的数量。
- x i x_i xi 和 x j x_j xj 是第 i i i 和第 j j j 个观测值。
- x ˉ \bar{x} xˉ 是观测值的均值。
- w i j w_{ij} wij 是第 i i i 个观测值和第 j j j 个观测值之间的空间权重。
莫兰指数用于衡量空间自相关性,它的值范围在 -1 到 1 之间:
- 当莫兰指数接近 1 时,表明数据呈现正相关性,即相似的值聚集在一起。
- 当莫兰指数接近 -1 时,表明数据呈现负相关性,即相反的值聚集在一起。
- 当莫兰指数接近 0 时,表明数据之间不存在空间自相关性。
莫兰指数的计算需要依赖空间权重矩阵 w i j w_{ij} wij,它反映了不同地理位置之间的空间关联程度。常用的空间权重矩阵包括邻近权重矩阵和边界权重矩阵。
莫兰指数中的空间权重通常用于衡量空间数据中不同地理位置之间的关联程度。常见的空间权重矩阵包括邻近权重矩阵和边界权重矩阵。下面分别介绍它们的计算公式:
-
邻近权重矩阵(Contiguity Weight Matrix):
邻近权重矩阵用于衡量空间上相邻地理单元之间的关联程度。常见的邻近权重矩阵包括二元邻近权重矩阵和连续邻近权重矩阵。-
二元邻近权重矩阵(Binary Contiguity Weight Matrix): 如果两个地理单元相邻,则它们之间的权重为1,否则为0。其计算公式为:
w i j = { 1 , if i and j are adjacent 0 , otherwise w_{ij} = \begin{cases} 1, & \text{if } i \text{ and } j \text{ are adjacent} \\ 0, & \text{otherwise} \end{cases} wij={1,0,if i and j are adjacentotherwise -
连续邻近权重矩阵(Row-standardized Contiguity Weight Matrix): 权重的大小取决于两个地理单元之间的距离,通常使用距离的倒数或指数函数来衰减权重。常见的计算方式是将每一行的权重进行标准化,使得每一行的权重之和为1。
-
-
边界权重矩阵(Boundary Weight Matrix):
边界权重矩阵用于衡量地理单元之间的边界关系。如果两个地理单元共享边界,则它们之间的权重为1,否则为0。其计算方式与二元邻近权重矩阵类似。
在计算莫兰指数时,通常会根据具体的分析需求选择合适的空间权重矩阵。这些权重矩阵的构建方法可以根据空间关系的定义和数据的特征进行调整,以反映不同地理单元之间的空间关联程度。
2.2. 在空间大数据的情况下,莫兰指数意义
-
空间相关性识别: 莫兰指数可以帮助我们识别地理空间数据中的集聚模式。通过分析莫兰指数,我们可以确定数据是否在空间上呈现出聚集或分散的趋势。这对于了解地理现象的空间分布模式至关重要。
-
空间规划和决策支持: 对于城市规划、资源配置和决策制定等领域,了解空间数据的分布模式至关重要。莫兰指数可以为决策者提供空间分析的依据,以更好地制定政策和规划。
-
空间数据挖掘: 在空间大数据时代,了解数据的空间相关性有助于发现潜在的空间模式和关联。莫兰指数可以作为空间数据挖掘的一种工具,帮助我们从海量数据中找到有意义的空间模式和关联规律。
-
空间预测和模型建立: 莫兰指数可以为空间预测模型提供重要的输入变量。通过了解空间数据的相关性,我们可以更准确地建立空间预测模型,从而提高预测的准确性和可靠性。
2.3. 莫兰指数的示例代码
下面是一个使用 Python 中的 pysal
库计算莫兰指数的示例代码:
from libpysal.weights.contiguity import Queen
import geopandas as gpd
from esda.moran import Morangdf = gpd.read_file('Guerry/Guerry.shp')
w = Queen.from_dataframe(gdf)
moran = Moran(y, w)
moran.Iprint("Moran's I 值为:",moran.I)
在这个示例中,我们首先读取Guerry 数据集,然后创建了一个 Queen 邻接权重矩阵 w
,该权重矩阵表示数据集中每个数据点的邻居。接下来,我们使用 pysal
中的 Moran
类来计算莫兰指数,其中传入了数据集 data
和权重矩阵 w
。最后,我们打印了计算得到的莫兰指数和其统计显著性水平。
在实际应用中,你可以根据自己的数据和需求来替换示例中的数据集和权重矩阵,并根据莫兰指数的结果来进行进一步的空间数据分析。
参考:
[1]. 小理头脑风暴中. 什么是POI|POI获取方式(数据可分享). 知乎. 2022.08
[2]. 未名时空. 学术成果|利用POI共现规律和签到数据提取城市功能区. 知乎. 2019.01
[3]. java060515. 深度学习在高德POI鲜活度提升中的演进. 博客园. 2020.05
[4]. 录城PinSurvey. 大数据可视化 POI数据有什么用. 知乎. 2023.03
[5]. 虾神说D. 白话空间统计番外:再谈莫兰指数(Moran’s I). CSDN博客. 2016.03
[6]. 虾神说D. 白话空间统计之:Moran’s I(莫兰指数). CSDN博客. 2015.07
[7]. 吴忠才,唐红涛.基于POI大数据的城市商圈业态组合及优化研究[J].湖南理工学院学报:自然科学版,2018,31(4):36-45
相关文章:
空间数据分析入门POI与莫兰指数基础知识笔记
1. 空间分析与POI 1.1. 什么是POI POI是“Polnt of Information”的缩写,中文可以翻译为“信息点”。POI是地图上任何非地理意义的有意义的点,如商店、酒吧、加油站、医院、车站等。这些点通常包括名称、类别、经纬度和地址等基本信息。此外࿰…...

TortoiseSVN各版本汉化包下载
首先进入下载版本列表 1.下载地址:https://sourceforge.net/projects/tortoisesvn/files 2.选择自己版本进入 3.选择Language Packs进入,选择对应语言包下载。 4.在TortoiseSVN根目录下点击安装即可。 ...

STM32连接阿里云物联网平台
文章目录 引言一、STM32连接阿里云物联网平台思路二、ESP8266烧录固件三、使用AT指令连接阿里云物联网平台四、STM32环形串口缓冲区驱动程序五、STM32连接阿里云驱动程序 引言 连续写了两篇关于阿里云连接的文章,都是使用Arduino ESP8266 & Arduino ESP32的方式…...

力扣hot100 组合总和 回溯 剪枝 组合
Problem: 39. 组合总和 文章目录 思路复杂度💖 Code 思路 复杂度 时间复杂度: O ( n ) O(n) O(n) 空间复杂度: O ( n ) O(n) O(n) 💖 Code class Solution{List<List<Integer>> res new ArrayList<>();int x;// 全局targetin…...

代码随想录 Leetcode669. 修剪二叉搜索树
题目: 代码(首刷看解析 2024年1月31日): class Solution { public:TreeNode* trimBST(TreeNode* root, int low, int high) {if (!root) return root;if (root->val < low) {TreeNode* node trimBST(root->right,low,high);return…...

Redis系列-数据结构篇
数据结构 string(字符串) redis的字符串是动态字符串,类似于ArrayList,采用预分配冗余空间的方式减少内存的频繁分配。 struct SDS<T>{ T capacity; T len; byte flags; byte[] content; } 当字符串比较短时,…...

正则表达式(RE)
什么是正则表达式 正则表达式,又称规则表达式(Regular Expression)。正则表达式通常被用来检索、替换那些符合某个规则的文本 正则表达式的作用 验证数据的有效性替换文本内容从字符串中提取子字符串 匹配单个字符 字符功能.匹配任意1个…...

发布技术路线图!美国量子计算公司QuEra公开三年OKR
编辑丨慕一 编译/排版丨琳梦 卉可 深度好文:1100字丨8分钟阅读 近期,美国量子计算公司QuEra Computing宣布了一系列关于容错量子计算机的战略路线图,该路线图从2024年开始,最终目标是打造具有100纠错逻辑量子比特的系统。 在…...
Vue2:请求接口的两种方式axios和vue-resource
一、场景描述 前端和后端的交互,肯定是要发生接口调用的 这个时候,就要涉及前端如何向后端接口发送请求,获取数据 二、请求方式 1、axios方式(推荐) 这个方式本质就是ajax,底层就是对xhr(XMLHttpRequest)的封装 1、安装axios…...

扩展学习|商业智能和大数据分析的研究前景(比对分析)
文献来源: Liang T P , Liu Y H .Research Landscape of Business Intelligence and Big Data analytics: A bibliometrics study[J].Expert Systems with Applications, 2018, 111(NOV.):2-10.DOI:10.1016/j.eswa.2018.05.018. 信息和通信技术的快速发展导致了数字…...

『Docker入门指南』- 详细安装与配置教程,助你起航容器化世界!
引言 在探索云计算和自动化部署的时代,Docker以其独特的容器化技术站在了风口浪尖。如果你期待着无缝地将你的应用从一个环境迁移到另一个环境,那么Docker无疑是你的得力助手。但首先,我们得学会如何正确地安装和配置Docker。这篇文章将详细…...
如何提高http连接成功率?
问题 丢包、错包、乱包 高延迟 响应数据回来时间长,甚至大于客户端等待时间 带宽小 每次能够通信的内容较少,数据包越大受影响可能越大 网络断续 网络经常断开又连接 优化处理 采用TCP协议、实现长连接,采用长连接池,节省…...
Elasticsearch 中使用MustNot等同于不等于遇到的坑
1、在写关键词推荐时,需要把当前文章过滤掉,不能再推荐自己的文章,所以再es中需要用到 MustNot属性查询 /// <summary> /// 服务中心es检索 /// </summary> /// <param name="input"></param> /// <returns></…...

嵌入式工程师day15(链表)
内存管理 一.内存管理: 1.malloc void *malloc(size_t size); 功能: 申请堆区空间 参数: size:申请堆区空间的大小 返回值: 返回获得的空间的首地址 失败返回NULL 2.free void free(void *ptr); 功能: 释放…...

Coppeliasim倒立摆demo
首先需要将使用Python远程控制的文件导入到文件夹,核心是深蓝色的三个文件。 本版本为4.70,其文件所在位置如下图所示,需要注意的是,目前不支持Ubuntu22的远程api: 双击Sphere这一行的灰色文件,可以看到远程…...

汽车燃油泵数据分析:全球市场的年复合增长率将达到10%左右
燃油泵是汽车配件行业的专业术语。是电喷汽车燃油喷射系统的基本组成之一,位于车辆油箱内部,燃油泵在启动和发动机运转时工作,如果发动机停止而点火开关仍处于ON时,HFM-SFI控制模块关闭燃油泵的电源,以避免意外点火。 …...
DC-磁盘管理(23国赛真题)
2023全国职业院校技能大赛网络系统管理赛项–模块B:服务部署(WindowServer2022) 文章目录 题目配置步骤组成RAID 5,磁盘分区命名为卷标H盘:Raid5。手动测试破坏一块磁盘,做RAID磁盘修复,确认RAID 5配置完毕。验证查看Raid5(打开磁盘管理器,查看raid信息)Raid5磁盘修复…...

216961-98-7,BODIPY 493/503 NHS 活化酯,可以应用于分子生物学等领域中
您好,欢迎来到新研之家 文章关键词:216961-98-7,BODIPY 493/503 NHS 活化酯,BODIPY 493/503 NHS ester,BODIPY 493/503 SE 一、基本信息 产品简介:BODIPY 493/503 NHS ester是一种特殊的染料,…...

Python采集学习笔记-读取excel数据
表格格式 方法一:使用xlrd import xlrd 1.读取Excel文件 workbook xlrd.open_workbook(plc.xlsx) 2.读取第一个表 sheet workbook.sheet_by_index(0) 3.获取表格总行数 total_rows sheet.nrows 4.创建列表,存储表格一行中每一列信息 plc_info [] for row in range(1…...

幻兽帕鲁服务器游戏怎么升级版本?
幻兽帕鲁服务器游戏怎么升级版本?自建幻兽帕鲁服务器进入Palworld游戏提示“您正尝试加入的比赛正在运行不兼容的游戏版本,请尝试升级游戏版本”什么原因?这是由于你的客户端和幻兽帕鲁服务器版本不匹配,如何解决?更新…...
React 第五十五节 Router 中 useAsyncError的使用详解
前言 useAsyncError 是 React Router v6.4 引入的一个钩子,用于处理异步操作(如数据加载)中的错误。下面我将详细解释其用途并提供代码示例。 一、useAsyncError 用途 处理异步错误:捕获在 loader 或 action 中发生的异步错误替…...

C++实现分布式网络通信框架RPC(3)--rpc调用端
目录 一、前言 二、UserServiceRpc_Stub 三、 CallMethod方法的重写 头文件 实现 四、rpc调用端的调用 实现 五、 google::protobuf::RpcController *controller 头文件 实现 六、总结 一、前言 在前边的文章中,我们已经大致实现了rpc服务端的各项功能代…...

深入剖析AI大模型:大模型时代的 Prompt 工程全解析
今天聊的内容,我认为是AI开发里面非常重要的内容。它在AI开发里无处不在,当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗",或者让翻译模型 "将这段合同翻译成商务日语" 时,输入的这句话就是 Prompt。…...
基于Uniapp开发HarmonyOS 5.0旅游应用技术实践
一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架,支持"一次开发,多端部署",可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务,为旅游应用带来…...

EtherNet/IP转DeviceNet协议网关详解
一,设备主要功能 疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络,本网关连接到EtherNet/IP总线中做为从站使用,连接到DeviceNet总线中做为从站使用。 在自动…...

智能仓储的未来:自动化、AI与数据分析如何重塑物流中心
当仓库学会“思考”,物流的终极形态正在诞生 想象这样的场景: 凌晨3点,某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径;AI视觉系统在0.1秒内扫描包裹信息;数字孪生平台正模拟次日峰值流量压力…...
Device Mapper 机制
Device Mapper 机制详解 Device Mapper(简称 DM)是 Linux 内核中的一套通用块设备映射框架,为 LVM、加密磁盘、RAID 等提供底层支持。本文将详细介绍 Device Mapper 的原理、实现、内核配置、常用工具、操作测试流程,并配以详细的…...
音视频——I2S 协议详解
I2S 协议详解 I2S (Inter-IC Sound) 协议是一种串行总线协议,专门用于在数字音频设备之间传输数字音频数据。它由飞利浦(Philips)公司开发,以其简单、高效和广泛的兼容性而闻名。 1. 信号线 I2S 协议通常使用三根或四根信号线&a…...

GraphQL 实战篇:Apollo Client 配置与缓存
GraphQL 实战篇:Apollo Client 配置与缓存 上一篇:GraphQL 入门篇:基础查询语法 依旧和上一篇的笔记一样,主实操,没啥过多的细节讲解,代码具体在: https://github.com/GoldenaArcher/graphql…...

若依登录用户名和密码加密
/*** 获取公钥:前端用来密码加密* return*/GetMapping("/getPublicKey")public RSAUtil.RSAKeyPair getPublicKey() {return RSAUtil.rsaKeyPair();}新建RSAUti.Java package com.ruoyi.common.utils;import org.apache.commons.codec.binary.Base64; im…...