文本数据保存
文本数据保存
- 工具
- 目的
- 代码
- 运行结果
工具
pycharm
目的
'''
网址:https://ljgk.envsc.cn/
需求:获取到地址(address),公司名字(ps_name),创建的时间(create_time),将数据分别保存在json文件和csv表格
'''
代码
# 动态数据,刷新网页后,有一个包含所有数据的XHR
import requests
import json
import csvclass Spider():# 初始化,text_type代表要返回的数据类型:0text,1content,2jsondef __init__(self, url, headers, file_name, data=None, json=None, text_type=0):self.list = []self.url = urlself.headers = headersself.data = dataself.json = jsonself.text_type = text_typeself.file_name = file_name # 要保存的文件名称,不包含后缀# 请求数据def get_data(self):response = requests.get(self.url, headers=self.headers, data=self.data, json=self.json)# 动态数据返回的是json格式if self.text_type == 0:return response.textelif self.text_type == 1:return response.contentelif self.text_type == 2:return response.json()# 数据处理(之后补充其他情况的代码)def parse_data(self, text):# json数据处理for i in text:list_element = {}list_element['ps_name'] = i['ps_name']list_element['address'] = i['address']list_element['create_time'] = i['create_time']self.list.append(list_element)# print(self.list)# 数据保存def save_data(self):with open('{}.json'.format(self.file_name),'w',encoding='utf8') as f:json.dump(self.list,f,ensure_ascii=False,indent=2)with open('{}.csv'.format(self.file_name),'a',encoding='utf8',newline='') as f:fieldnames = ['ps_name', 'address', 'create_time']csv_writer = csv.DictWriter(f,fieldnames=fieldnames)csv_writer.writeheader()# for list_element in self.list:# csv_writer.writerow(list_element)csv_writer.writerows(self.list)# 入口函数def run(self):text = self.get_data()self.parse_data(text)self.save_data()if __name__ == '__main__':url = 'https://ljgk.envsc.cn/OutInterface/GetPSList.ashx?regionCode=0&psname=' \'&SystemType=C16A882D480E678F&sgn=2c887fad3076724ffd70d22320308a5d7b501610' \'&ts=1691844481490&tc=11515962'headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36'}file_name = 'companies'spider = Spider(url, headers, file_name, text_type=2)spider.run()
运行结果
见资源
相关文章:
文本数据保存
文本数据保存 工具目的代码运行结果 工具 pycharm 目的 网址:https://ljgk.envsc.cn/ 需求:获取到地址(address),公司名字(ps_name),创建的时间(create_time)ÿ…...
Python爬虫:抓取表情包的下载链接
Python爬虫:抓取表情包的下载链接 1. 前言2. 具体实现3. 实现代码 1. 前言 最近发现了一个提供表情包的网址,觉得上面的内容不错,于是就考虑用Python爬虫获取上面表情包的下载链接。整体而言,实现这个挺简单的,就是找到提供表情包…...
(文章复现)基于灰狼算法(GWO)的交直流混合微网经济调度matlab代码
参考文献: [1]高瑜,黄森,陈刘鑫等.基于改进灰狼算法的并网交流微电网经济优化调度[J].科学技术与工程, 2020,20(28):11605-11611. [2]邓长征,冯朕,邱立等.基于混沌灰狼算法的交直流混合微网经济调度[J].电测与仪表, 2020, 57(04):99-107. 这两篇文章不管是从模型、…...
【Kubernetes】Kubernetes的调度
K8S调度 一、Kubernetes 调度1. Pod 调度介绍2. Pod 启动创建过程3. Kubernetes 的调度过程3.1 调度需要考虑的问题3.2 具体调度过程 二、影响kubernetes调度的因素1. nodeName2. nodeSelector3. 亲和性3.1 三种亲和性的区别3.2 键值运算关系3.3 节点亲和性3.4 Pod 亲和性3.5 P…...
题目:2511.最多可以摧毁的敌人城堡数量
题目来源: leetcode题目,网址:2511. 最多可以摧毁的敌人城堡数目 - 力扣(LeetCode) 解题思路: 顺序遍历数组,记录上一个我军城堡和没有城堡的位置。当碰到空位置时,若上一次更新的…...
22 | 书籍推荐数据分析
import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from sklearn.cluster import KMeans from sklearn import neighbors from sklearn.model_selection import train_test_split from sklearn.preprocessing import...
vscode extension 怎么区分dev prod
开发模式注入环境变量 使用vsode 提供的api...
Java学习手册——第一篇Java简介
今后Java学习手册就来给大家梳理JavaSE的基础知识啦, 除了这个专栏我们还有其他专栏:前端、安全、后端等。 希望大家可以在这里一起讨论学习哟~ Java学习手册——第一篇Java简介 1. Java基础知识2. Java能干嘛3. Java基础环境搭建 1. Java基础知识 出生…...
Prometheus流程图(自绘)-核心组件-流程详解
阿丹手绘流程图:图片可能有点小查看的时候放大看看哈! prometheus核心组件 prometheus server Prometheus Server是Prometheus组件中的核心部分,负责实现对监控数据的获取,存储以及查询。Prometheus Server可以通过静态配置管理…...
回归模型常见评估指标mae,mse,rmse
文章目录 MAE(平均绝对误差)计算公式sklearn实现numpy实现mse(均方误差)计算公式sklearn实现numpy实现rmse(均方根误差)计算公式sklearn实现MAE(平均绝对误差) 计算公式 MAE ( y ,...
服务器数据恢复-断电导致ext4文件系统文件丢失的数据恢复案例
服务器数据恢复环境: 一台服务器挂载一台存储设备,存储中划分一个Lun;服务器操作系统是Linux centos,EXT4文件系统。 服务器故障&分析: 意外断电导致服务器操作系统无法启动,系统在修复后可以正常启动&…...
链表(基础详解、实现、OJ笔试题)
文章目录 🧚什么是链表(链表概念及分类)链表分类单链表和双链表的区别 🚴♂️单链表、双向链表的实现单链表的实现双向链表的实现 🍉链表经典OJ笔试题反转单链表移除链表元素合并两个有序链表链表分割链表的中间结点…...
W5100S-EVB-PICO作为TCP Client 进行数据回环测试(五)
前言 上一章我们用W5100S-EVB-PICO开发板通过DNS解析www.baidu.com(百度域名)成功得到其IP地址,那么本章我们将用我们的开发板作为客户端去连接服务器,并做数据回环测试:收到服务器发送的数据,并回传给服务…...
大数据-玩转数据-Redis 安装与使用
一、说明 大多数企业都是基于Linux服务器来部署项目,而且Redis官方也没有提供Windows版本的安装包。因此课程中我们会基于Linux系统来安装Redis. 此处选择的Linux版本为CentOS 7. Redis的官方网站地址:http://download.redis.io/releases 二、下载 m…...
实时指标-1日留存率
2个DWD层 登录→kafka注册→kafka1个DWS 弄2条流,从kafka读取数据将昨日注册数据存到状态中,TTL为2天,存到map状态中,key为注册日期,value为set,存储注册的uid将登录流和注册流进行连接来一条登录数据&…...
【玩转23种Java设计模式】行为型模式篇:责任链模式
软件设计模式(Design pattern),又称设计模式,是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式是为了可重用代码、让代码更容易被他人理解、保证代码可靠性、程序的重用性。 汇总目录链接&…...
【C#】获取电脑CPU、内存、屏幕、磁盘等信息
通过WMI类来获取电脑各种信息,参考文章:WMI_04_常见的WMI类的属性_wmi scsilogicalunit_fantongl的博客-CSDN博客 自己整理了获取电脑CPU、内存、屏幕、磁盘等信息的代码 #region 系统信息/// <summary>/// 电脑信息/// </summary>public p…...
途乐证券-最准确的KDJ改良指标?
KDJ目标是技术剖析的一种重要目标之一,它是利用随机目标(%R)发展而来的,是一种反映商场超买和超卖状况的买卖目标。KDJ目标由快线(K线)、慢线(D线)和随机值(J线ÿ…...
数据结构——线性表
文章目录 线性表的定义和基本操作顺序表线性表的链式表示 线性表的定义和基本操作 线性表是具有相同数据类型的(n≥0)个数据元素的有限序列,其中n为表长,当n0时线性表是一个空表。若用L命名线性表,则其中一般表示为:L(a1,a2,a3, …...
SpringBoot系列之基于Jersey实现文件上传API
前言 JAX-RS:JAX-RS是可以用可以用于实现RESTFul应用程序的JAVA API,给开发者提供了一系列的RESTFul注解Jersey:是基于JAX-RX API的实现框架,用于实现RESTful Web 服务的开源框架。 JAX-RX常用的注解: javax.ws.rs.Pa…...
智能文件分拣工具:双模式智能分拣,自定义文件夹命名,按文件类型自动分类,一键批量整理海量文件,零门槛高效管理电脑数字资产
大家好,我是大飞哥。日常使用电脑时,我们总会遇到海量零散文件手动整理耗时耗力、文件夹创建繁琐、混合文件分类杂乱、归档后难以查找的核心痛点,要么花费数小时手动拖拽拆分文件,要么分类后的文件杂乱无章,后续查找使…...
5分钟免费解锁Cursor AI Pro完整功能:开发者必备的高效解决方案
5分钟免费解锁Cursor AI Pro完整功能:开发者必备的高效解决方案 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached…...
题解:洛谷 P1062 [NOIP 2006 普及组] 数列
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来,并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构,旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。 欢迎大家订阅我的专栏:算法…...
AI编程助手谁才是真·生产力引擎?2026奇点大会4大旗舰工具横向测评(含代码生成准确率、调试通过率、IDE兼容性三重压力测试)
第一章:2026奇点智能技术大会:AI编程助手对比评测 2026奇点智能技术大会(https://ml-summit.org) 在2026奇点智能技术大会上,来自全球12家主流厂商的AI编程助手接受了统一基准测试——涵盖代码补全准确率、跨文件上下文理解、调试建议有效性…...
微软新 Xbox 负责人阿莎·夏尔马忙不停:Game Pass 定价待调,“螺旋计划”影响几何?
承诺“Xbox 回归”后,负责人忙不停微软新任 Xbox 负责人承诺“Xbox 回归”后,一直忙得不可开交。阿莎夏尔马在 3 月游戏开发者大会上与发行商会面,最近几周走访微软旗下游戏工作室和产品团队。曾在微软 CoreAI 部门工作的她目前处于学习阶段&…...
Spug开源运维平台终极完整安装配置指南:高效实现企业级自动化运维
Spug开源运维平台终极完整安装配置指南:高效实现企业级自动化运维 【免费下载链接】spug 开源运维平台:面向中小型企业设计的轻量级无Agent的自动化运维平台,整合了主机管理、主机批量执行、主机在线终端、文件在线上传下载、应用发布部署、在…...
基于 macOS 虚拟化架构的自动化消息推送系统:底层原理与环境隔离技术深度解析
摘要在现代软件测试与系统自动化领域,如何在隔离环境下实现 macOS 系统的稳定交互是一个极具挑战性的课题。本文将深入探讨一种基于 macOS 虚拟机(VM)架构 的自动化消息推送方案。我们将从虚拟化底层实现、硬件指纹模拟、以及基于 AppleScrip…...
保姆级教程:用Python和NumPy手搓OpenPose的PAF(附完整代码与可视化)
从零实现OpenPose的PAF:基于NumPy的向量场构建实战 在计算机视觉领域,人体姿态估计一直是个充满挑战的课题。想象一下,你正在开发一个健身指导应用,需要实时分析用户的动作是否标准——这正是OpenPose这类技术的典型应用场景。而P…...
生产刮刮卡定制制造商推荐
在当今的商业活动中,刮刮卡作为一种集抽奖、防伪与票务功能于一体的营销利器,被广泛应用于促销活动、刮奖卡、景区门票等众多场景。然而,市面上刮刮卡的质量参差不齐,存在防伪性差、可变数据印刷错位或重复、色差大等诸多问题。今…...
CY7C68013A固件烧录与EEPROM配置实战指南
1. CY7C68013A开发板基础认知 第一次拿到CY7C68013A开发板时,我对着这个火柴盒大小的模块研究了半天。作为Cypress的经典USB2.0控制器芯片,它最大的魅力在于同时支持高速(480Mbps)和全速(12Mbps)两种传输模…...
