Python 批量转换 Shapefile 为 GeoJSON
批量转换 Shapefile (.shp) 为 GeoJSON 文件的脚本详解 🗺️🔄
在地理信息系统(GIS)和遥感领域,Shapefile(
.shp
)格式与GeoJSON格式是两种常用的数据格式。Shapefile 作为矢量数据的标准格式之一,广泛应用于各种地理数据处理任务。
GeoJSON 格式则因其轻量级和适用于网络地图及 Web GIS 开发而备受青睐。为了简化批量处理过程,本文将详细介绍一个将指定文件夹下的 Shapefile 文件批量转换为 GeoJSON 文件的代码工具。
完整版地址
- 详细原文见
https://mp.weixin.qq.com/s?__biz=Mzk0MTU1MjU5Mw==&mid=2247485050&idx=1&sn=2c6da818d563bab539cba683796ea50b&chksm=c2d1e0c4f5a669d20e77bd1c809843be48b366a9528c6dd1f52ab621d45b3844718ee42e45e6#rd
应用场景 🌐
该脚本适用于以下场景:
- 数据格式转换: 在进行 Web GIS 开发时,常需将传统的 Shapefile 数据转换为 GeoJSON 格式,以便在网络地图中展示。
- 批量处理: 当需要处理大量 Shapefile 文件时,手动转换效率低下且易出错。该脚本能够自动化完成批量转换,提升工作效率。
- 跨系统数据共享: GeoJSON 作为一种轻量级格式,适合通过网络进行数据共享,尤其适用于 Web 应用和移动设备。
使用方法 🛠️
- 准备文件: 将所有需转换的 Shapefile 文件存放于指定文件夹中。
- 配置路径: 根据实际情况,修改脚本中的 Shapefile 文件夹路径和 GeoJSON 输出文件夹路径。
- 运行脚本: 直接运行 Python 脚本,脚本将自动扫描指定文件夹并将所有
.shp
文件转换为 GeoJSON 格式。 - 查看输出: 转换后的 GeoJSON 文件将保存在指定的目标文件夹中,文件名与原
.shp
文件一致。
代码详解与优化 💻✨
以下是实现批量转换的 Python 脚本,并附有详细注释以帮助理解其工作原理:
import os
import arcpydef convert_shp_to_geojson(shp_path: str, geojson_path: str) -> None:"""将 Shapefile 转换为 GeoJSON 文件。参数:shp_path (str): 输入的 Shapefile 文件路径。geojson_path (str): 输出的 GeoJSON 文件路径。"""# 允许覆盖输出文件arcpy.env.overwriteOutput = True# 转换 Shapefile 为 GeoJSONarcpy.conversion.FeaturesToJSON(in_features=shp_path,out_json_file=geojson_path,format_json="NOT_FORMATTED", # 原始格式不进行格式化geoJSON="GEOJSON", # 输出为 GeoJSON 格式outputToWGS84="WGS84", # 坐标系转换为 WGS84use_field_alias="USE_FIELD_NAME" # 使用字段名称作为别名)print(f'转换完成:{geojson_path}')def get_files_with_extension(directory: str, extension: str) -> list:"""获取指定文件夹中具有特定扩展名的所有文件名。参数:directory (str): 文件夹路径。extension (str): 文件扩展名(包括点,例如 '.shp')。返回:list: 包含指定扩展名文件名的列表。"""# 规范化目录路径normalized_directory = os.path.normpath(directory)# 获取文件夹中的所有文件all_files = os.listdir(normalized_directory)# 筛选出指定扩展名的文件filtered_files = [file for file in all_files if file.endswith(extension)]return filtered_filesif __name__ == '__main__':# 设置 Shapefile 和 GeoJSON 文件夹路径shapefile_dir = r"E:\_OrderingProject\F_IslandsBoundaryChange\b_ArcData\b_Global_Island_Grid\_DGS_GSV_Grids"geojson_dir = r"E:\_OrderingProject\F_IslandsBoundaryChange\b_ArcData\b_Global_Island_Grid\_DGS_GSV_Geojson"# 获取所有 .shp 文件shapefiles = get_files_with_extension(directory=shapefile_dir, extension='.shp')print(f"找到的 '.shp' 文件:{shapefiles}")# 遍历并转换每个 .shp 文件for shp in shapefiles:# 生成对应的 GeoJSON 文件名geojson_filename = os.path.splitext(shp)[0] + '.geojson'# 构建完整的文件路径shp_path = os.path.join(shapefile_dir, shp)geojson_path = os.path.join(geojson_dir, geojson_filename)# 执行转换convert_shp_to_geojson(shp_path=shp_path, geojson_path=geojson_path)
代码优化点 🔍
- 路径规范化: 使用
os.path.normpath()
标准化文件夹路径,确保在不同操作系统下路径格式的一致性。 - 批量处理: 利用
os.listdir()
获取指定文件夹下所有 Shapefile 文件,避免手动指定文件列表,提高效率。 - 自动化输出文件名: 通过
os.path.splitext()
分离文件名与扩展名,自动生成对应的 GeoJSON 文件名,确保文件名匹配且避免命名冲突。 - WGS84 坐标系转换: GeoJSON 通常采用 WGS84 坐标系,代码自动将 Shapefile 的坐标系转换为 WGS84,确保数据格式的一致性。
注意事项 ⚠️
- 环境依赖: 该脚本依赖 ArcPy 库,使用者需确保已安装 ArcGIS 桌面版或 ArcGIS Pro,并正确配置 Python 环境。
- 文件路径权限: 设置输入和输出文件夹路径时,确保拥有读写权限,以避免文件读写失败。
- 文件命名: 输入文件夹中若存在重名的 Shapefile 文件,可能导致输出文件覆盖。处理时需注意文件命名,确保唯一性。
相关函数讲解 📚
函数或术语 | 解释 |
---|---|
arcpy.conversion.FeaturesToJSON() | 用于将输入的矢量数据(Shapefile)转换为 GeoJSON 格式。geoJSON="GEOJSON" 表示输出为 GeoJSON 格式,outputToWGS84="WGS84" 确保数据符合 WGS84 坐标系。 |
os.listdir() | 获取指定目录下的所有文件名,结合 .endswith() 可筛选出特定扩展名的文件。 |
os.path.join() | 拼接文件夹路径与文件名,确保跨平台路径格式统一。 |
os.path.normpath() | 标准化路径格式,消除路径中的冗余部分,确保路径在不同操作系统下的兼容性。 |
os.path.splitext() | 分离文件名与扩展名,方便生成新的文件名或进行文件类型判断。 |
arcpy.env.overwriteOutput | 设置是否允许覆盖已有的输出文件,True 表示允许覆盖。 |
通过自动化处理、大幅提升工作效率,同时保证转换结果的准确性和一致性。该脚本灵活且易于部署,适合在不同项目中快速应用。
如果这对您有所帮助,希望点赞支持一下作者! 😊



详细全文-点击查看
相关文章:

Python 批量转换 Shapefile 为 GeoJSON
批量转换 Shapefile (.shp) 为 GeoJSON 文件的脚本详解 🗺️🔄 在地理信息系统(GIS)和遥感领域,Shapefile(.shp)格式与GeoJSON格式是两种常用的数据格式。Shapefile 作为矢量数据的标准格式之一…...

软考《信息系统运行管理员》- 4.1信息系统软件运维概述
4.1信息系统软件运维概述 文章目录 4.1信息系统软件运维概述信息系统软件运维的概念信息系统软件的可维护性及维护类型对软件可维护性的度量可以从以下几个方面进行:软件维护分类: 信息系统软件运维的体系1.**需求驱动**2.**运维流程**3.**运维过程**4.*…...
Leetcode 3319. K-th Largest Perfect Subtree Size in Binary Tree
Leetcode 3319. K-th Largest Perfect Subtree Size in Binary Tree 1. 解题思路2. 代码实现 题目链接:3319. K-th Largest Perfect Subtree Size in Binary Tree 1. 解题思路 这一题其实就是一个很常见的树的遍历,我们自底向上遍历每一个子树&#x…...

从秒级到小时级:TikTok等发布首篇面向长视频理解的多模态大语言模型全面综述
文章链接:https://arxiv.org/pdf/2409.18938 亮点直击 追踪并总结从图像理解到长视频理解的MM-LLMs的进展;回顾了各种视觉理解任务之间的差异,并强调了长视频理解中的挑战,包括更细粒度的时空细节、动态事件和长期依赖性;详细总结了MM-LLMs在…...
【CTF】敏感信息泄露 GIT SVN VIM
在CTF(Capture The Flag)比赛中,信息泄露是常见的考察方向之一。这类题目通过模拟开发人员的疏忽或系统配置的失误,导致敏感文件或数据被泄露。信息泄露题目通常相对简单,但能帮助参赛者掌握如何从公开的信息中获取潜在…...

EMQX服务器的搭建,实现本地机和虚拟机之间的MQTT通信(详细教程)
前言 MQTT是一个基于客户端-服务器的消息发布/订阅传输协议。MQTT协议是轻量、简单、开放和易于实现的,这些特点使它适用范围非常广泛。 MQTT协议中有三种身份:发布者(Publish)、代理(Broker)(…...
cordova的使用
环境 Cordova 是一个跨平台的开发框架,它允许开发者使用 HTML、CSS 和 JavaScript 创建移动应用。Cordova 的不同版本可能会有不同的环境要求。以下是 Cordova 10 和 Cordova 12 在开发 Android 和 iOS 应用时的环境要求的对比总结。 1. Cordova 10 环境要求 And…...

三种Transformer模型中的注意力机制介绍及Pytorch实现:从自注意力到因果自注意力
本文深入探讨Transformer模型中三种关键的注意力机制:自注意力、交叉注意力和因果自注意力。这些机制是GPT-4、Llama等大型语言模型(LLMs)的核心组件。通过理解这些注意力机制,我们可以更好地把握这些模型的工作原理和应用潜力。 …...

《使用Gin框架构建分布式应用》阅读笔记:p20-p31
《用Gin框架构建分布式应用》学习第2天,p20-p31总结,总计12页。 一、技术总结 1.第一个gin程序 // main.go package mainimport "github.com/gin-gonic/gin"func main() {r : gin.Default()r.GET("/", func(c *gin.Context) {c.J…...
如何修改MacOS的终端的配色和linux一样
目录 一、配色方案 二、修改配色 一、配色方案 一键更改MacOS的终端配色文件,目的就是为了让他从原本的样子变成XShell里面显示的配色样式。文件夹为蓝色,链接文件为青色,可执行文件为绿色之类的。 linux默认配色方案是"exfxcxdxbxege…...

基于百度智能体开发爱情三十六计
基于百度智能体开发爱情三十六计 文章目录 基于百度智能体开发爱情三十六计1. 爱情三十六计智能体2. 三十六计开发创意3. 智能体开发实践3.1 基础配置3.2 进阶配置3.3 调优心得3.4可能会遇到的问题 4. 为什么选择文心智能体平台 1. 爱情三十六计智能体 爱情三十六计 是一款基于…...

计算机网络:计算机网络概述 —— 描述计算机网络的参数
文章目录 数据量性能指标速率带宽数据传输速率 吞吐量时延分析时延问题 时延带宽积往返时间利用率丢包率丢包的情况 抖动可用性可靠性安全性 计算机网络是现代信息社会的基础设施,其性能和可靠性对各类应用至关重要。为了理解和优化计算机网络,我们需要深…...

Windows 11系统选项卡详解:从新手到专家的操作指南
Windows 11的“系统”选项卡是管理电脑硬件和软件设置的中心。 基础操作 1. 查看和编辑系统信息 打开“开始”菜单,点击“设置”图标。 在“设置”窗口中,选择左侧的“系统”选项卡。 点击“关于”。 在这里,我们可以查看系统规格。要编辑设…...

乐鑫ESP32-S3无线方案,AI大模型中控屏智能升级,提升智能家居用户体验
在这个由数据驱动的时代,人工智能正以其前所未有的速度和规模改变着我们的世界。随着技术的不断进步,AI已经从科幻小说中的概念,转变为我们日常生活中不可或缺的一部分。 特别是在智能家居领域,AI的应用已成为提升生活质量、增强…...

postman变量,断言,参数化
环境变量 1.创建环境变量 正式环境是错误的,方便验证环境变化 2.在请求中添加变量 3.运行前选择环境变量 全局变量 能够在任何接口访问的变量 console中打印日志 console.log(responseBody);//将数据解析为json格式 var data JSON.parse(responseBody); conso…...

Nginx实战指南:基础知识、配置详解及最佳实践全攻略
背景 在Java系统实现过程中,我们不可避免地会借助大量开源功能组件。然而,这些组件往往功能丰富且体系庞大,官方文档常常详尽至数百页。而在实际项目中,我们可能仅需使用其中的一小部分功能,这就造成了一个挑战&#…...
百度搜索引擎(SEO)优化师的未来将何去何从?
百度搜索引擎(SEO)优化师的未来将何去何从? 作为一名SEO专家(林汉文),在过去的三年里,我深感自己与快速变化的百度SEO圈子逐渐脱节。然而,在最近重拾旧业,重新审视SEO特…...

如何在UE5中创建加载屏幕(开场动画)?
第一步: 首先在虚幻商城安装好Async Loading Screen,并且在项目的插件中勾选好。 第二步: 确保准备好所需要的素材: 1)开头的动画视频 2)关卡加载图片 3)准备至少两个关卡 第三步:…...
【WebGIS】Cesium:地形加载
在 Cesium 中,地形数据用于提供三维场景的高度信息,使得地球表面的细节更加逼真。地形加载是 Cesium 应用中的关键功能,支持各种地形源和格式,如 Cesium Ion 服务、Terrain Server 等。本文将系统介绍如何在 Cesium 中加载、配置、…...
前端程序员策略:使用框架还是纯JavaScript?
前端程序员策略:使用框架还是纯JavaScript? 在现代Web开发领域,JavaScript语言占据着举足轻重的地位,而基于JavaScript的前端框架更是层出不穷,为开发者提供了丰富的选择。 然而,面对琳琅满目的框架&…...
谷歌浏览器插件
项目中有时候会用到插件 sync-cookie-extension1.0.0:开发环境同步测试 cookie 至 localhost,便于本地请求服务携带 cookie 参考地址:https://juejin.cn/post/7139354571712757767 里面有源码下载下来,加在到扩展即可使用FeHelp…...
云原生核心技术 (7/12): K8s 核心概念白话解读(上):Pod 和 Deployment 究竟是什么?
大家好,欢迎来到《云原生核心技术》系列的第七篇! 在上一篇,我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在,我们就像一个拥有了一块崭新数字土地的农场主,是时…...

C++初阶-list的底层
目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...
反向工程与模型迁移:打造未来商品详情API的可持续创新体系
在电商行业蓬勃发展的当下,商品详情API作为连接电商平台与开发者、商家及用户的关键纽带,其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息(如名称、价格、库存等)的获取与展示,已难以满足市场对个性化、智能…...
Auto-Coder使用GPT-4o完成:在用TabPFN这个模型构建一个预测未来3天涨跌的分类任务
通过akshare库,获取股票数据,并生成TabPFN这个模型 可以识别、处理的格式,写一个完整的预处理示例,并构建一个预测未来 3 天股价涨跌的分类任务 用TabPFN这个模型构建一个预测未来 3 天股价涨跌的分类任务,进行预测并输…...
Qwen3-Embedding-0.6B深度解析:多语言语义检索的轻量级利器
第一章 引言:语义表示的新时代挑战与Qwen3的破局之路 1.1 文本嵌入的核心价值与技术演进 在人工智能领域,文本嵌入技术如同连接自然语言与机器理解的“神经突触”——它将人类语言转化为计算机可计算的语义向量,支撑着搜索引擎、推荐系统、…...
Element Plus 表单(el-form)中关于正整数输入的校验规则
目录 1 单个正整数输入1.1 模板1.2 校验规则 2 两个正整数输入(联动)2.1 模板2.2 校验规则2.3 CSS 1 单个正整数输入 1.1 模板 <el-formref"formRef":model"formData":rules"formRules"label-width"150px"…...
Android第十三次面试总结(四大 组件基础)
Activity生命周期和四大启动模式详解 一、Activity 生命周期 Activity 的生命周期由一系列回调方法组成,用于管理其创建、可见性、焦点和销毁过程。以下是核心方法及其调用时机: onCreate() 调用时机:Activity 首次创建时调用。…...
【Android】Android 开发 ADB 常用指令
查看当前连接的设备 adb devices 连接设备 adb connect 设备IP 断开已连接的设备 adb disconnect 设备IP 安装应用 adb install 安装包的路径 卸载应用 adb uninstall 应用包名 查看已安装的应用包名 adb shell pm list packages 查看已安装的第三方应用包名 adb shell pm list…...
LCTF液晶可调谐滤波器在多光谱相机捕捉无人机目标检测中的作用
中达瑞和自2005年成立以来,一直在光谱成像领域深度钻研和发展,始终致力于研发高性能、高可靠性的光谱成像相机,为科研院校提供更优的产品和服务。在《低空背景下无人机目标的光谱特征研究及目标检测应用》这篇论文中提到中达瑞和 LCTF 作为多…...