基于Geotools的Worldpop世界人口tif解析-以中国2020年数据为例
目录
前言
一、Worldpop数据简介
1、数据来源
2、QGIS数据展示
3、元数据展示
二、GeoTools人口解析
1、Maven依赖引入
2、Tif人口计算
三、总结
前言
在当今数字化与信息化飞速发展的时代,地理空间数据的分析与应用已然成为诸多领域研究与决策的关键支撑。人口数据作为地理空间信息中的核心要素之一,对于城市规划、资源分配、公共卫生政策制定以及社会经济发展等众多方面都有着不可替代的重要价值。Worldpop 作为全球高分辨率人口分布数据的权威发布平台,其提供的 tif 格式人口数据具有极高的精度和权威性,为研究人员和相关从业者深入探究人口分布规律及其与环境、社会等要素的相互关系提供了宝贵的数据资源。以中国 2020 年的人口数据为例,这一年的数据不仅反映了我国在特定历史时期的人口分布状况,还蕴含着丰富的人口迁移、城镇化进程以及区域发展差异等重要信息。Geotools 作为一个功能强大的开源地理工具库,在地理空间数据处理与分析方面展现出了卓越的能力。通过运用 Geotools 对 Worldpop 的中国 2020 年 tif 格式人口数据进行解析,我们能够深入挖掘数据背后的深层次信息,实现数据的高效读取、可视化展示以及与其他地理空间数据的融合分析。
本研究旨在通过详细介绍基于 Geotools 的 Worldpop 中国 2020 年人口 tif 数据解析方法,为相关领域的研究人员和从业人员提供一套可行的技术方案和实践指导,助力他们更好地利用地理空间数据,揭示人口分布的复杂规律,从而为解决实际问题提供有力的数据支持和决策依据。这不仅有助于推动地理空间数据在多领域的广泛应用,也将进一步提升我国在人口地理研究以及相关应用领域的水平和影响力,为国家的可持续发展贡献一份力量。通过本实例,大家可以掌握如何使用Java语言通过Geotools来进行区域内的人口总量。
一、Worldpop数据简介
本节将对Worldpop数据进行简单介绍,分别从数据来源、在Qgis上进行数据展示和tif数据的元数据展示。
1、数据来源
“Worldpop”是数据的提供方,Worldpop项目由英国萨塞克斯大学、美国约翰斯·霍普金斯大学以及多个国际合作伙伴共同运行,致力于提供全球人口分布的精细化数据。其数据广泛应用于公共卫生、灾害响应、发展规划等多个领域。 Worldpop数据集包含了2000年至2020年这21年间,中国各区域的人口密度信息。这些数据是以公里为单位的网格形式呈现,便于进行地理空间分析和研究。数据来源于Worldpop,这是一个全球人口分布和流动性的研究项目,提供高质量、高分辨率的全球人口分布数据。 在这个案例中,这些人口密度数据可以通过GIS软件进行加载和分析,以可视化和理解中国各地人口分布的时空变化。 压缩包子文件的文件名称列表中,以“chn_ppp_”开头的文件是与中国的(chn)人口密度(ppp)相关的数据。后缀为“.tif”的文件是地理信息系统常用的栅格数据格式——TIFF(Tagged Image File Format)图像文件,通常用于存储地理空间数据。文件名中的年份(如2012、2013等)代表了相应年份的数据,而“_Aggregated.tif”表示这些数据已经进行了聚合处理,即在一定区域内统计了人口总数,而不是单个个体的数据。".ovr"文件是TIFF图像的元数据或覆盖文件,它包含关于主TIFF文件的额外信息,有助于GIS软件快速访问和显示数据。
这些数据可以用来进行以下几种分析:
1. **人口增长分析**:通过比较不同年份的数据,可以分析中国各地区人口增长的速度和趋势。 2. **城市化进程研究**:可以揭示城市化区域的人口密度变化,了解城市扩张的模式。 3. **资源分配规划**:政府和决策者可以依据人口密度来优化基础设施建设、公共服务提供以及资源配置。 4. **公共卫生评估**:研究人口密集地区的疾病传播风险,指导防疫措施的实施。 5. **环境影响评估**:分析人口分布对环境压力的影响,为环境保护提供依据。 这个数据集提供了丰富的信息,对于了解和研究中国人口分布的历史变迁以及与之相关的各种议题具有重要价值。
2、QGIS数据展示
为了比较直观的展示这份人口数据,我们使用QGIS来对人口数据进行展示。将tif数据拖入展示窗口中,对tif数据进行标注,人口数据属于单波段数据。因此这里我们选择单波段伪彩色的模式进行渲染,为了将数值区分有所明显,使用渐变的颜色。具体标绘设置如下:
为了体现各人口单元数据的差异, 根据千米网格的人口数,这里我们采用分成15类来进行数据展示。
3、元数据展示
这里我们对这份2020年的中国区人口tif数据的元数据进行展示。在Qgis中打开信息页,可以看到tif数据的元数据信息,如下表所示:
序号 | 参数 | 值 |
1 | 名称 | chn_ppp_2020_1km_Aggregated |
2 | 空间参考 | EPSG:4326 - WGS 84 - 地理的 |
3 | 范围 | 73.5570830472731529,16.0329167867305387 : 134.7737494690731523,53.5662499699305386 |
4 | 单位 | 度 |
5 | 宽度 | 7346 |
6 | 高度 | 4504 |
7 | 数据类型 | Float32 - 32位浮点型 |
8 | 波段1 | STATISTICS_MAXIMUM=286414.71875 STATISTICS_MEAN=105.89345258548 STATISTICS_MINIMUM=0 STATISTICS_STDDEV=738.60967183839 |
9 | 起点 | 73.5571,53.5662 |
同时在tif中,定义了没有值的nodata的值为-9999,如下图所示:
二、GeoTools人口解析
本节将详细介绍在Geotools中如何读取GeoTiff,同时对人口值进行准确计算。
1、Maven依赖引入
在Geotools中解析GeoTiff的maven依赖添加如下:
<!-- 增加epsg支持 -->
<dependency><groupId>org.geotools</groupId><artifactId>gt-epsg-hsql</artifactId><version>${geotools.version}</version></dependency> <!-- 增加gt-geotiff支持 --><dependency><groupId>org.geotools</groupId><artifactId>gt-geotiff</artifactId><version>${geotools.version}</version></dependency>
<dependency><groupId>org.geotools</groupId><artifactId>gt-process-raster</artifactId><version>${geotools.version}</version>
</dependency>
<dependency><groupId>org.geotools</groupId><artifactId>gt-process</artifactId><version>${geotools.version}</version>
</dependency>
<dependency><groupId>org.geotools</groupId><artifactId>gt-coverage</artifactId><version>${geotools.version}</version>
</dependency>
2、Tif人口计算
使用Geotools解析tif数据的步骤如下:
第一步、使用Geotools读取tif文件,并设置重采样,关键代码如下:
File file = new File("F:/vector_data/worldPop人口数据/worldpop/chn_ppp_2020_1km_Aggregated.tif");
GeoTiffReader reader = new GeoTiffReader(file, new Hints(Hints.FORCE_LONGITUDE_FIRST_AXIS_ORDER, Boolean.TRUE));
GridCoverage2D coverage = reader.read(null);
// 设置目标坐标系并重采样
CoordinateReferenceSystem targetCRS = CRS.decode("EPSG:4326");
coverage = (GridCoverage2D) Operations.DEFAULT.resample(coverage, targetCRS);
第二步、获取栅格数据并批量读取像素值,同时通过循环计算非零像素的坐标 ,关键代码如下:
// 获取栅格数据并批量读取像素值
Raster raster = image.getData();
int width = raster.getWidth();
int height = raster.getHeight();
System.out.println(width + "\t" + height);
double[] pixels = raster.getSamples(raster.getMinX(), raster.getMinY(), width, height, 0, (double[]) null);
// 收集非零像素的坐标
List<GridCoordinates2D> nonZeroCoords = new ArrayList<>();
for (int j = 0; j < height; j++) {for (int i = 0; i < width; i++) {if (pixels[j * width + i] > 0) {nonZeroCoords.add(new GridCoordinates2D(i, j));}}
}
第三步、从收集的非零数据集合中读取指定像素人口值,代码如下:
// 获取仿射变换以手动计算坐标
MathTransform2D gridToCRS = geometry.getGridToCRS2D();
if (!(gridToCRS instanceof AffineTransform2D)) {throw new RuntimeException("仅支持仿射变换");
}
AffineTransform2D affine = (AffineTransform2D) gridToCRS;
BigDecimal total = new BigDecimal("0.0");
double t = 0;
// 处理非零像素
for (GridCoordinates2D coord : nonZeroCoords) {int i = coord.x;int j = coord.y;double[] src = new double[]{i + 0.5, j + 0.5}; // 像素中心坐标double[] dest = new double[2];affine.transform(src, 0, dest, 0, 1);double longitude = dest[0];double latitude = dest[1];/*System.out.printf("像素点 (%d, %d) 的值:%f 坐标为: %f, %f%n",i, j, pixels[j * width + i], longitude, latitude);*/total = total.add(new BigDecimal(pixels[j * width + i]));t += pixels[j * width + i];
}
System.out.println("总人数===>" + total);
System.out.println("总人数2===>" + t);
第四步、获取计算结果。经过以上的三步,就可以实现对指定的tif栅格人口数据进行汇总,在控制台中可以看到以下输出:
五月 26, 2025 10:03:54 下午 org.geotools.image.ImageWorker <clinit>
信息: Warp/affine reduction enabled: true
7346 4504
总人数===>1444326122.211248342038743430748581886291503906250
总人数2===>1.4443261222112093E9
在控制台中输出的7346和4504表示的是tif图像的宽和高。下面两个是分别使用BigDecimal和double两种数据来接收的值,可以很明显的看到,两个计算的结果是一样的,double的计算结果是科学计数法。通过计算结果可以看到,我国2020年的总人口数大约是:14.4亿左右。基本上与我国的人口规模是一致的。
三、总结
以上就是本文的主要内容,本研究旨在通过详细介绍基于 Geotools 的 Worldpop 中国 2020 年人口 tif 数据解析方法,为相关领域的研究人员和从业人员提供一套可行的技术方案和实践指导,助力他们更好地利用地理空间数据,揭示人口分布的复杂规律,从而为解决实际问题提供有力的数据支持和决策依据。这不仅有助于推动地理空间数据在多领域的广泛应用,也将进一步提升我国在人口地理研究以及相关应用领域的水平和影响力,为国家的可持续发展贡献一份力量。通过本实例,大家可以掌握如何使用Java语言通过Geotools来进行区域内的人口总量。
本文首先对WorldPop数据进行介绍,然后使用qgis来进行数据的标注展示,通过数据源的介绍让大家对基础数据有了一个更详细的了解。最后通过Java代码,使用geotools组件实现对geotiff文件的读取,通过像素值的计算实现区域范围内的人口总数计算。行文仓促,定有不足之处,欢迎各位朋友在评论区批评指正,不胜感激。篇幅有限,代码不能全部展示,更详尽的参考代码可参考以下链接:Geotools28.2读取WorldPop人口实例。
相关文章:

基于Geotools的Worldpop世界人口tif解析-以中国2020年数据为例
目录 前言 一、Worldpop数据简介 1、数据来源 2、QGIS数据展示 3、元数据展示 二、GeoTools人口解析 1、Maven依赖引入 2、Tif人口计算 三、总结 前言 在当今数字化与信息化飞速发展的时代,地理空间数据的分析与应用已然成为诸多领域研究与决策的关键支撑。…...

Unity3D仿星露谷物语开发55之保存游戏到文件
1、目标 将游戏保存到文件,并从文件中加载游戏。 Player在游戏中种植的Crop,我们希望保存到文件中,当游戏重新加载时Crop的GridProperty数据仍然存在。这次主要实现保存地面属性(GridProperties)信息。 我们要做的是…...

【无标题】C++23新特性:支持打印volatile指针
文章目录 前言背景与问题C23的解决方案实现原理使用场景硬件开发多线程调试 总结 前言 在C开发中,volatile关键字常用于修饰变量,以确保编译器不会对这些变量进行优化,从而保证程序能够正确地与硬件交互或处理多线程环境下的特殊变量。然而&…...

【第4章 图像与视频】4.2 图像的缩放
文章目录 前言示例-图像的缩放在 Canvas 边界之外绘制图像 前言 在上节中读者已经学会了如何使用 drawImage() 方法将一幅未经缩放的图像绘制到 canvas 之中。现在我们就来看看如何用该方法在绘制图像的时候进行缩放 示例-图像的缩放 未缩放的图像,显示图形原有大…...
针对C语言的开发工具推荐及分析(涵盖编辑器、集成开发环境(IDE)、编译器、调试工具及辅助工具)
以下是对C语言开发工具的全面推荐与分析,涵盖编辑器、集成开发环境(IDE)、编译器、调试工具及辅助工具,帮助您根据需求选择合适工具: 目录 一、集成开发环境(IDE) 1. Visual Studio (Windows) …...
在 WSL Ubuntu-24.04 上安装 Nacos 2.5.1 并使用 MySQL 数据库
在微服务架构中,Nacos 是一个非常重要的服务发现和配置管理工具。本文将详细介绍如何在 WSL(Windows Subsystem for Linux)中的 Ubuntu-24.04 系统上安装 Nacos 2.5.1,并将其配置为使用 MySQL 数据库进行数据存储。我们将使用 roo…...

敏捷开发中如何避免迭代失控
在敏捷开发过程中避免迭代失控,需要实施合理规划迭代目标、明确职责分工、强化沟通机制、严格控制需求变更等措施,其中合理规划迭代目标尤为重要,它确保团队聚焦于关键任务,避免因目标不清晰而导致的迭代混乱和失控。 一、合理规划…...
Python基础 | jupyter工具的安装与基本使用
@[TOC](Python基础 | jupyter工具的安装与基本使用 一、jupyter介绍1.1 jupyter简介2.2 jupyter主要特点二、实践环境介绍三、安装Python33.1 更新软件源3.2 安装Python33.3 查看版本3.4 更换pip源四、安装jupyter工具4.1 安装jupyter4.2 启动jupyter4.3 访问jupyter服务五、测…...

Python开发AI智能体(九)———构建RAG对话应用
前言 上篇文章我们介绍了如何在Langchain中构建代理 这篇文章我们将带领大家构建一个RAG对话应用 一、什么是RAG对话应用? RAG(Retrieval-Augmented Generation,检索增强生成)技术通过从外部知识库检索相关信息,并将…...

NW907NW918美光固态闪存NW920NW930
NW907NW918美光固态闪存NW920NW930 技术解析:美光NW系列固态闪存的核心突破 美光NW907、NW918、NW920、NW930四款固态闪存产品,代表了当前存储技术的顶尖水平。其核心创新在于G9 NAND架构的深度优化,采用更先进的5纳米制程工艺,…...

【Deepseek 学网络互联】跨节点通信global 和节点内通信CLAN保序
Clan模式下的源端保序与Global类似,目的端保序则退化成通道保序,此时仅支持网络单路径保序。”这里的通道保序怎么理解? 用户可能正在阅读某种硬件架构文档(比如NVIDIA的NVLink或InfiniBand规范),因为"…...
Python 迭代器:从基础到高级
在 Python 中,迭代器(Iterator)是一种非常重要的概念,它允许我们逐个访问集合中的元素,而无需暴露其内部的表示形式。迭代器是实现迭代协议(Iterator Protocol)的对象,通过这种方式&…...

9.5 Q1 | 北京协和医学院GBD发文 | 1990-2021 年全球、区域和国家心力衰竭负担及其根本原因
1.第一段-文章基本信息 文章题目:Global, regional, and national burden of heart failure and its underlying causes, 1990-2021: results from the global burden of disease study 2021 中文标题:1990-2021 年全球、区域和国家心力衰竭负担及其根本…...
软件工程 3.0:智能驱动的软件新时代
在科技飞速发展的当下,软件工程领域正经历着深刻变革,软件工程 3.0 应运而生。这一全新阶段以 “智能增强” 为核心特征,将人工智能(AI)深度融入软件开发的全流程,为行业带来前所未有的机遇与挑战。 一、…...
从C++编程入手设计模式1——单例模式
从C编程入手设计模式 在这之前,为什么要有设计模式 Design Pattern是一个非常贴近工程化的一个议题,我们首先再开始之前(尽管有一些朋友可能已经早早就掌握了设计模式,但是出于看乐子的心态还是进来看看我写的有多烂…...

根据Cortex-M3(包括STM32F1)权威指南讲解MCU内存架构与如何查看编译器生成的地址具体位置
首先我们先查看官方对于Cortex-M3预定义的存储器映射 1.存储器映射 1.1 Cortex-M3架构的存储器结构 内部私有外设总线:即AHB总线,包括NVIC中断,ITM硬件调试,FPB, DWT。 外部私有外设总线:即APB总线,用于…...
vue的h函数(在 Vue 2中也称为 createElement)理解
官方定义 定义: 返回一个“虚拟节点” ,通常缩写为 VNode: 一个普通对象,其中包含向 Vue 描述它应该在页面上呈现哪种节点的信息,包括对任何子节点的描述。用于手动编写render h函数格式说明及使用 h 接收三个参数 type: 必需,…...

MCP入门实战(极简案例)
MCP简介 MCP(Model Context Protocol,模型上下文协议)2024年11月底由 Antbropic 推出的一种开放标准,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信协议。 Function Calling是AI模型调用函数的机制,MCP是一个标准协议,使AI模型与API无缝交互,而Al Agent是一个…...
STM32中,如何理解看门狗
在STM32微控制器中,看门狗(Watchdog)是一种硬件计时器,用于监控系统运行状态,防止软件死锁或跑飞。其核心机制是:系统需定期“喂狗”(复位看门狗计数器),若未及时喂狗&am…...

Cursor从入门到精通实战指南(一):开始使用Cursor
一、简介与核心优势 Cursor是一款基于VSCode开发的AI编程工具,集成了GPT-4、Claude 3.5等先进大语言模型,支持代码补全、生成、重构、调试等功能。其核心优势包括: 高效协作:通过自然语言对话实现代码开发,支持跨文件…...
麒麟v10+信创x86处理器离线搭建k8s集群完整过程
前言 最近为某客户搭建内网的信创环境下的x8s集群,走了一些弯路,客户提供的环境完全与互联网分离,通过yum、apt这些直接拉依赖就别想了,用的操作系统和cpu都是国产版本,好在仍然是x86的,不是其他架构&…...

计算机组成原理——cache
3.4cache 出自up主Beokayy传送门 1.局部性原理 时间局部性: 在最近的未来要用到的信息,很可能是现在正在使用的信息,因为程序中存在循环。 空间局部性: 在最近的未来要用到的信息,很可能与现在正在使用的信息在存储…...

EasyExcel使用导出模版后设置 CellStyle失效问题解决
EasyExcel使用导出模版后在CellWriteHandler的afterCellDispose方法设置 CellStyle失效问题解决方法 问题描述:excel 模版塞入数据后,需要设置单元格的个性化设置时失效,本文以设置数据格式为例(设置列的数据展示时需要加上千分位…...
关于AWESOME-DIGITAL-HUMAN的部署
AWESOME-DIGITAL-HUMAN是一个开源数字人项目,可以容器化部署,资源占用少,可以对接dify,使用起来也很方便,非常感谢开发者。 容器化部署后,其实是有两个容器,分别启动两个服务,一个前…...
WebAssembly 及 HTML Streaming:重塑前端性能与用户体验
WebAssembly 及 HTML Streaming:重塑前端性能与用户体验 引言 在移动互联网时代,用户对 Web 应用的性能和体验要求日益苛刻。白屏时间、首屏渲染速度、交互流畅度,甚至 SEO 优化,都成为前端工程师必须面对的挑战。传统的前端技术…...
python同步mysql数据
python写了一个简单的mysql数据同步脚本,只作为学习练习,大佬勿喷 # -*- coding: utf-8 -*- """ Time:2025/5/29 14:38 Auth:HEhandsome """ import pymysql from pymysql import Connectclass Mysql:def __init__(self):#源数据库self.sou_hos…...
shell之通配符及正则表达式,grep参数
通配符与正则表达式 通配符(Globbing) 通配符是由 Shell 处理的特殊字符,用于路径或文件名匹配。当 Shell 在命令参数中遇到通配符时,会将其扩展为匹配的文件路径;若没有匹配项,则作为普通字符传递给命令…...
RuoYi前后端分离框架集成手机短信验证码(一)之后端篇
一、背景 本项目基于RuoYi 3.8.9前后端分离框架构建,采用Spring Security实现系统权限管理。作为企业级应用架构的子模块,系统需要与顶层项目实现用户数据无缝对接(以手机号作为统一用户标识),同时承担用户信息采集的重要职能。为此,我们在保留原有账号密码登录方式的基…...

Knife4j框架的使用
文章目录 引入依赖配置Knife4j使用Knife4j 访问 SpringBoot 生成的文档 Knife4j 是基于 Swagger 的增强工具,对 Swagger 进行了拓展和优化,从而有更美观的界面设计和更强的功能 引入依赖 Spring Boot 2.7.18 版本 <dependency> <groupId>c…...

深兰科技陈海波率队考察南京,加速AI医诊大模型区域落地应用
近日,深兰科技创始人、董事长陈海波受邀率队赴南京市,先后考察了南京江宁滨江经济开发区与鼓楼区,就推进深兰AI医诊大模型在南京的落地应用,与当地政府及相关部门进行了深入交流与合作探讨。 此次考察聚焦于深兰科技自主研发的AI医…...