当前位置: 首页 > news >正文

Python爬虫康复训练——笔趣阁《神魂至尊》

还是话不多说,很久没写爬虫了,来个bs4康复训练爬虫,正好我最近在看《神魂至尊》,爬个txt文件下来看看

直接上代码

"""
神魂至尊网址-https://www.bqgui.cc/book/1519/
"""
import requests
from bs4 import BeautifulSoup
import osA=[]#存储章节标题
B=[]#存储章节链接
url='https://www.bqgui.cc/book/1519/'
header={'Referer':'https://www.bqgui.cc/s?q=%E7%A5%9E%E9%AD%82%E8%87%B3%E5%B0%8A','Cookie':'Hm_lvt_52624d0257fe48ed9dea61ff01fa3417=1720163550; HMACCOUNT=79B595C42B32BA19; hm=9a7ca0f0fe759c15c8c93eed6eb59f86; Hm_lpvt_52624d0257fe48ed9dea61ff01fa3417=1720163795','User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0'
}
reponse = requests.get(url,headers=header)
#print(reponse.text)
html = BeautifulSoup(reponse.text,'lxml')
htmls = html.select('div.listmain dl dd a')
for a in htmls:# 检查a的文本内容中是否包含特定字符串if '<<---展开全部章节--->>' not in a.text:# 如果不包含,则添加到列表A和B中A.append(a.text)B.append('https://www.bqgui.cc/' + a['href'])
for j in B:urls =jheaders={'Cookie':'Hm_lvt_52624d0257fe48ed9dea61ff01fa3417=1720163550; HMACCOUNT=79B595C42B32BA19; hm=9a7ca0f0fe759c15c8c93eed6eb59f86; Hm_lpvt_52624d0257fe48ed9dea61ff01fa3417=1720164854','Referer':'https://www.bqgui.cc/book/1519/','User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0'}reponses = requests.get(urls,headers=headers)lxml = BeautifulSoup(reponses.text,'lxml')lxmls = lxml.select('div.Readarea.ReadAjax_content')for k in lxmls:#print(k.text)for l in A:directory = '神魂至尊'if not os.path.exists(directory):os.makedirs(directory)with open(f'{'神魂至尊'}/{l}','a')as f:f.write(k.text + '\n')

效果图

 

相关文章:

Python爬虫康复训练——笔趣阁《神魂至尊》

还是话不多说&#xff0c;很久没写爬虫了&#xff0c;来个bs4康复训练爬虫&#xff0c;正好我最近在看《神魂至尊》&#xff0c;爬个txt文件下来看看 直接上代码 """ 神魂至尊网址-https://www.bqgui.cc/book/1519/ """ import requests from b…...

Kaptcha验证码

Kaptcha验证码 Kaptcha 是一个用于生成验证码的开源库&#xff0c;在 Java 中使用它可以轻松地为应用程序添加验证码功能。 一、引入依赖 首先&#xff0c;需要在项目的 pom.xml 文件&#xff08;如果是 Maven 项目&#xff09;中添加 Kaptcha 的依赖&#xff1a; <depend…...

Rufus 制作启动盘 | 便携的工作空间

唠唠闲话 最近服务器硬盘故障多&#xff0c;在修复过程中&#xff0c;学习了一些操作&#xff0c;这里做个记录。本期主要介绍 U盘启动盘的制作&#xff0c;以及持久化存储。 U 盘启动盘 镜像选择 Ubuntu 的版本命名遵循 “Adjective Animal” 的模式&#xff0c;即 “形容…...

python函数参数

Python 函数参数是函数定义时用于接收传递给函数的值的变量。在Python中&#xff0c;函数可以有多种类型的参数&#xff0c;这增加了函数的灵活性和可重用性。下面是一些主要的参数类型&#xff1a; 1. 位置参数&#xff08;Positional Arguments&#xff09; 位置参数是最常…...

深入理解 XML 和 HTML 之间的区别

在现代网络技术的世界中&#xff0c;XML&#xff08;可扩展标记语言&#xff09;和 HTML&#xff08;超文本标记语言&#xff09; 是两个非常重要的技术。尽管它们都使用标签和属性的格式来描述数据&#xff0c;但它们在形式和用途上有显著的区别。 概述 什么是 XML&#xff…...

代码随想录算法训练营第四十四天|188.买卖股票的最佳时机IV、309.最佳买卖股票时机含冷冻期、714.买卖股票的最佳时机含手续费

188.买卖股票的最佳时机IV 题目链接&#xff1a;188.买卖股票的最佳时机IV 文档讲解&#xff1a;代码随想录 状态&#xff1a;不会 思路&#xff1a; 在股票买卖1使用一维dp的基础上&#xff0c;升级成二维的即可。 定义dp[k1][2]&#xff0c;其中 dp[j][0] 表示第j次交易后持…...

YOLOv8改进 添加CVPR2024 PKINet中注意力机制CAAttention

一、PKINet论文 论文地址:2403.06258 (arxiv.org) 二、CAAttention结构 CAA(Context Anchor Attention)注意力模块是一种用于捕捉长距离上下文信息的并行模块。 在计算机视觉领域中,上下文信息是指与目标物体或任务相关的周围环境和语境信息。上下文信息可以帮助我们更好…...

油猴Safari浏览器插件:Tampermonkey for Mac 下载

Tampermonkey 是一个强大的浏览器扩展&#xff0c;用于运行用户脚本&#xff0c;这些脚本可以自定义和增强网页的功能。它允许用户在网页上执行各种自动化任务&#xff0c;比如自动填写表单、移除广告、改变页面布局等。适用浏览器&#xff1a; Tampermonkey 适用于多数主流浏览…...

如何在Vue中添加事件监听器

在Vue中添加事件监听器主要有两种方式&#xff1a;在模板中直接添加和使用Vue实例的方法。以下将详细解释这两种方法。 1. 在模板中直接添加 在Vue的模板中&#xff0c;你可以直接在HTML元素上使用v-on指令&#xff08;或其简写形式&#xff09;来监听DOM事件&#xff0c;并在…...

软设之UML图中的用例图

UML图中用例图 用例图描述一组用例&#xff0c;参与者及它们之间的关系 关系包括&#xff1a; 包含关系&#xff0c;扩展关系&#xff0c;泛化关系 用例建模的流程&#xff1a; 识别参与者 合并需求获得用例 细化用例描述 调整用例模型...

弹性伸缩高性能计算服务一一黑石裸金属服务器

在电商、直播、游戏等业务场景中&#xff0c;对服务器的性能、安全性和稳定性要求尤为苛刻。黑石裸金属服务器作为一种创新的计算服务&#xff0c;以其独特的优势&#xff0c;满足了这些行业对高性能计算服务的迫切需求。本文将详细解析黑石裸金属服务器的优势&#xff0c;并在…...

欢乐钓鱼大师攻略:西沙群岛攻略,内置自动辅助云手机!

《欢乐钓鱼大师》是一款以钓鱼为主题的休闲游戏&#xff0c;玩家可以在虚拟的钓鱼世界中体验真实的钓鱼乐趣&#xff0c;并通过捕捉各种珍稀鱼类来提升自己的钓鱼技能和成就。在这篇攻略中&#xff0c;我们将重点介绍如何在西沙群岛区域有效地捕捉各种典藏鱼类&#xff0c;并提…...

Apipost接口测试工具的原理及应用详解(六)

本系列文章简介&#xff1a; 随着软件行业的快速发展&#xff0c;API&#xff08;应用程序编程接口&#xff09;作为不同软件组件之间通信的桥梁&#xff0c;其重要性日益凸显。API的质量直接关系到软件系统的稳定性、性能和用户体验。因此&#xff0c;对API进行严格的测试成为…...

矩阵的奇异值(Singular Values)

矩阵的奇异值&#xff08;Singular Values&#xff09;是奇异值分解&#xff08;SVD&#xff09;过程中得到的一组重要特征值。它们在许多应用中非常重要&#xff0c;如信号处理、数据压缩和统计学等。以下是对奇异值及其计算和性质的详细解释&#xff1a; 奇异值分解&#xf…...

清空flowable的表定义的相关表

更多ruoyi-nbcio功能请看演示系统 gitee源代码地址 前后端代码&#xff1a; https://gitee.com/nbacheng/ruoyi-nbcio 演示地址&#xff1a;RuoYi-Nbcio后台管理系统 http://218.75.87.38:9666/ 更多nbcio-boot功能请看演示系统 gitee源代码地址 后端代码&#xff1a; h…...

Tailwind CSS 在vue里 的使用

在Vue项目中使用Tailwind CSS&#xff0c;你需要按照以下步骤操作&#xff1a; 安装Tailwind CSS npm包&#xff1a; npm install -D tailwindcss postcss autoprefixer 使用Tailwind CSS CLI工具创建配置文件&#xff1a; npx tailwindcss init -p 3.在tailwind.config.js中…...

【人工智能】--强化学习(2.0)

个人主页&#xff1a;欢迎来到 Papicatch的博客 课设专栏 &#xff1a;学生成绩管理系统 专业知识专栏&#xff1a; 专业知识 文章目录 &#x1f349;强化学习与有监督学习的区别 &#x1f348;数据特点 &#x1f348;学习目标 &#x1f348;反馈机制 &#x1f348;策略…...

跟着峰哥学java 微信小程序 第二天 封装ES7 + 后端工作

1.前端 1.1使用promise封装 使用promise封装以至于在图片路径 统一路径中修改 //封装统一请求域名 const baseUrl "http://localhost:8080"; //封装后需导出 export const getBaseUrl()>{return baseUrl; } 导入外来资源 初始化数据 设置数据 将处理后的数据…...

QT学习(6)——QT中的定时器事件,两种实现方式;事件的分发event,事件过滤器

目录 引出定时器事件QTimerEventQTimer 事件的分发事件过滤器 总结QT中的鼠标事件定义QLable的鼠标进入离开事件提升为myLabel重写QLabel的函数鼠标的事件鼠标的左中右键枚举鼠标多事件获取和鼠标移动鼠标追踪 QT中的信号和槽自定义信号和槽1.自定义信号2.自定义槽3.建立连接4.…...

ASP.NET Core 6.0 使用 Action过滤器

Action过滤器 在ASP.NET Core中&#xff0c;Action过滤器用于在执行Action方法之前或之后执行逻辑。你可以创建自定义的Action过滤器来实现这一点。 继承 ActionFilterAttribute 类&#xff1a; [TypeFilter(typeof(CustomAllActionResultFilterAttribute))]public IActionRe…...

SSH连接报kex_exchange_identification的4步根因定位法

1. 这个报错不是SSH客户端的问题&#xff0c;而是服务器在“拒之门外” “kex_exchange_identification”——这串字符第一次出现在终端里时&#xff0c;我正帮一位刚转行做运维的同事排查一台新部署的Ubuntu云服务器。他反复执行 ssh userip &#xff0c;每次都在输入密码前…...

量子计算数学基础:希尔伯特空间、张量积与密度算子核心解析

1. 量子计算的数学基石&#xff1a;从希尔伯特空间谈起搞量子计算&#xff0c;不管是做算法设计、硬件实现还是理论研究&#xff0c;绕不开的第一座大山就是它的数学语言。这不像经典编程&#xff0c;学个语法和数据结构就能上手。量子世界有自己的一套“语法规则”&#xff0c…...

量子机器学习可解释性:从黑箱到透明决策的LRP与数字孪生方法

1. 量子机器学习可解释性&#xff1a;从黑箱到透明决策量子机器学习&#xff08;QML&#xff09;这几年火得不行&#xff0c;但说实话&#xff0c;很多从业者&#xff0c;包括我自己在内&#xff0c;最初接触时都有点“懵”。模型性能上去了&#xff0c;可它到底是怎么做决策的…...

从零到一:用 LangChain 搭建你的第一个 AI Agent,让 LLM 自己干活!

导读&#xff1a;&#xff0c;2024年最火的不是大模型本身&#xff0c;而是基于大模型的 AI Agent。它能自主思考、调用工具、执行任务——不再是"你说一句我回一句"的聊天机器人&#xff0c;而是真正能帮你干活的数字员工。本文从零带你搭建一个完整的 AI Agent&…...

保姆级教程:用USM的PE和分区助手,把旧硬盘数据无损搬到新硬盘(附Win11引导修复)

Win11系统硬盘无损迁移全指南&#xff1a;USM PE与分区助手实战详解当你面对一块崭新的固态硬盘&#xff0c;既想享受飞速读写体验&#xff0c;又担心重装系统后那些精心调试的设置和重要数据丢失&#xff0c;这种纠结我太熟悉了。去年我的主力机升级时&#xff0c;整整3TB的工…...

基于SpringBoot的运动会报名与成绩录入系统毕业设计

博主介绍&#xff1a;✌ 专注于Java,python,✌关注✌私信我✌具体的问题&#xff0c;我会尽力帮助你。一、研究目的本研究旨在构建一个基于Spring Boot与Vue框架的运动会报名与成绩录入系统以解决传统体育赛事管理中存在的信息处理效率低下数据准确性不足以及资源分配不科学等问…...

神经纹理:让3D世界“活”起来的AI魔法,一篇讲透!

神经纹理&#xff1a;让3D世界“活”起来的AI魔法&#xff0c;一篇讲透&#xff01; 引言&#xff1a;从“贴图”到“思考”的纹理革命 想象一下&#xff0c;一个虚拟角色不仅能动&#xff0c;其皮肤还能随着情绪微微泛红、在阳光下呈现真实的汗渍光泽——这不再是电影特效的…...

超星***滑块逆向分析

本篇文章仅用于交流与学习&#xff0c;严禁用于任何商业与非法用途&#xff01;否则由此产生的一切后果均与作者无关&#xff01;如有侵权&#xff0c;请联系作者本人进行删除。感谢关注&#xff01;您的关注和点赞就是我的动力1.逆向目标aHR0cHM6Ly92OC5jaGFveGluZy5jb20v2.逆…...

AI代理运行时基础设施:从上下文溢出到持久化事件日志

1. 这不是新赛道&#xff0c;是 runtime 层的“操作系统时刻”来了你有没有在深夜调试一个跑了三小时的 AI 代理&#xff0c;突然发现它开始胡言乱语&#xff1f;不是模型崩了&#xff0c;不是 prompt 写错了&#xff0c;而是——它的“记忆”被挤掉了。上下文窗口就那么大&…...

游戏模组革命:BepInEx框架让每个玩家都能打造个性化游戏体验

游戏模组革命&#xff1a;BepInEx框架让每个玩家都能打造个性化游戏体验 【免费下载链接】BepInEx Unity / XNA game patcher and plugin framework 项目地址: https://gitcode.com/GitHub_Trending/be/BepInEx 想要为心爱的游戏添加新功能、修改游戏机制&#xff0c;或…...