CSDN文章质量分查询系统【赠python爬虫、提分攻略】
CSDN文章质量分查询系统
https://www.csdn.net/qc
点击链接-----> CSDN文章质量分查询系统 <------点击链接
点击链接-----> https://www.csdn.net/qc <------点击链接

点击链接-----> CSDN文章质量分查询系统 <------点击链接
点击链接-----> https://www.csdn.net/qc <------点击链接
说明:一定要是CSDN站内博文链接
效果举例展示
作者以自己这编文章展示效果
java机器学习计算指标动态阈值-CSDN博客

CSDN个人博客平均质量分查询
内容管理---》数据---》作品数据---》博客数据(默认页签)---》博客统计数据(默认页签)

获取CSDN个人博客链接地址
方式一
文章浏览页面---》复制地址栏的地址

方式二
文章浏览页面(底部)---》分享---》复制链接

Python爬虫应用【爬质量分】
Python爬虫爬csdn个人所有文章质量分
这里以MacOS为例,Windows和Linux类似

安装python3
安装过的跳过,如果有python(python2)也行
brew install python3
安装pip3
安装过的跳过,如果有python(python2)也行
brew install pip3
安装所需的库
- requests:用于发送HTTP请求
- MultipartEncoder:用于构造POST请求的请求体
# windows或是没有装homebrew的操作系统可以不带--break-system-packages
pip3 install requests --break-system-packages
pip3 install requests_toolbelt --break-system-packages
pip3 install openpyxl --break-system-packages
pip3 install pandas --break-system-packages
获取所需的请求 URL 和请求标头
第一步:打开目标网页

第二步:使用开发者工具

第三步:获取请求 URL 和请求标头

点击负载找到请求参数
第四步:分析请求url,构造参数字典
url = "https://bizapi.csdn.net/blog/phoenix/console/v1/article/list"
参数:
pageSize: 20
第五步:整代码
调整下面的代码(不同时候由于csdn官方可能有更新,地址可能会有调整)
编辑文件:csdnArticleScore.py
# pip3 install pandas --break-system-packages
import json
import pandas as pd
from openpyxl import Workbook, load_workbook
from openpyxl.utils.dataframe import dataframe_to_rows
import math
import requests# 批量获取文章信息并保存到excel
class CSDNArticleExporter:def __init__(self, username, cookies, Referer, page, size, filename):self.username = usernameself.cookies = cookiesself.Referer = Refererself.size = sizeself.filename = filenameself.page = pagedef get_articles(self):url = "https://blog.csdn.net/community/home-api/v1/get-business-list"params = {"page": {self.page},"size": {self.size},"businessType": "blog","username": {self.username}}headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3','Cookie': self.cookies, # Setting the cookies string directly in headers'Referer': self.Referer}try:response = requests.get(url, params=params, headers=headers)response.raise_for_status() # Raises an HTTPError if the response status code is 4XX or 5XXdata = response.json()return data.get('data', {}).get('list', [])except requests.exceptions.HTTPError as e:print(f"HTTP错误: {e.response.status_code} {e.response.reason}")except requests.exceptions.RequestException as e:print(f"请求异常: {e}")except json.JSONDecodeError:print("解析JSON失败")return []def export_to_excel(self):df = pd.DataFrame(self.get_articles())df = df[['title', 'url', 'postTime', 'viewCount', 'collectCount', 'diggCount', 'commentCount']]df.columns = ['文章标题', 'URL', '发布时间', '阅读量', '收藏量', '点赞量', '评论量']# df.to_excel(self.filename)# 下面的代码会让excel每列都是合适的列宽,如达到最佳阅读效果# 你只用上面的保存也是可以的# Create a new workbook and select the active sheetwb = Workbook()sheet = wb.active# Write DataFrame to sheetfor r in dataframe_to_rows(df, index=False, header=True):sheet.append(r)# Iterate over the columns and set column width to the max length in each columnfor column in sheet.columns:max_length = 0column = [cell for cell in column]for cell in column:try:if len(str(cell.value)) > max_length:max_length = len(cell.value)except:passadjusted_width = (max_length + 5)sheet.column_dimensions[column[0].column_letter].width = adjusted_width# Save the workbookwb.save(self.filename)class ArticleScores:def __init__(self, filepath):self.filepath = filepath@staticmethoddef get_article_score(article_url):url = "https://bizapi.csdn.net/trends/api/v1/get-article-score"# TODO: Replace with your actual headersheaders = {"Accept": "application/json, text/plain, */*","X-Ca-Key": "203930474","X-Ca-Nonce": "7e4ece49-5b7d-41e0-b548-30972a3e3989","X-Ca-Signature": "mXV5P9OGdBpKyv7v+OfuSmtbN66OwLg3ujL2kwGk5mw=","X-Ca-Signature-Headers": "x-ca-key,x-ca-nonce","X-Ca-Signed-Content-Type": "multipart/form-data",}data = {"url": article_url}try:response = requests.post(url, headers=headers, data=data)response.raise_for_status() # This will raise an error for bad responsesreturn response.json().get('data', {}).get('score', 'Score not found')except requests.RequestException as e:print(f"Request failed: {e}")return "Error fetching score"def get_scores_from_excel(self):df = pd.read_excel(self.filepath)urls = df['URL'].tolist()scores = [self.get_article_score(url) for url in urls]return scoresdef write_scores_to_excel(self):df = pd.read_excel(self.filepath)df['质量分'] = self.get_scores_from_excel()df.to_excel(self.filepath, index=False)if __name__ == '__main__':total = 10 #已发文章总数量# TODO:调整为你自己的cookies,Referer,CSDNid, headerscookies = 'UN=jjk_02027; fi_id=default; log_Id_pv=******。。。' # Simplified for brevityReferer = 'https://blog.csdn.net/jjk_02027?type=blog'CSDNid = 'jjk_02027't_index = math.ceil(total/100)+1 #向上取整,半闭半开区间,开区间+1。# 获取文章信息# CSDNArticleExporter("待查询用户名", 2(分页数量,按总文章数量/100所得的分页数),总文章数量仅为设置为全部可见的文章总数。# 100(最大单次查询文章数量不大于100), 'score1.xlsx'(待保存数据的文件,需要和下面的一致))for index in range(1,t_index): #文章总数filename = "score"+str(index)+".xlsx"exporter = CSDNArticleExporter(CSDNid, cookies, Referer, index, 100, filename) # Replace with your usernameexporter.export_to_excel()# 批量获取质量分score = ArticleScores(filename)score.write_scores_to_excel()
第六步:运行Python爬虫
python3 csdnArticleScore.py
第七步:查询质量分文件
运行Python爬虫后会在当前目录生成excel文件:

文件示例:

我从事了10多年的java工作,是个python新手,真正被python的强大惊讶到了,从性能、便捷性方面不输java,虽然我用java也写过,性能也相差无几,但是这里还是觉得python更好用~
附件一:Python官网及教程
Python官网 https://www.python.org/
Python3教程 Python3 教程 | 菜鸟教程
附件二:Python抓分常见问题
1、macOS python3安装requests库 报error: externally-managed-environment
使用Homebrew来安装requests库,而不是直接使用pip(跳过,装python库用pip3,非python库才用brew)
brew install python-requests
2、macOS pip3安装pipx报error: externally-managed-environment
pip3 install pipx --break-system-packages
3、macOS pip3安装requests报error: externally-managed-environment
pip3 install requests --break-system-packages
附件三:CSDN提高博客质量分攻略
在提高CSDN博客质量分(即提高博客的排名和曝光度)时,有几个关键的策略可以帮助你优化你的内容,从而吸引更多的读者和搜索引擎的关注。以下是一些实用的建议:
1. 内容质量
-
原创性:确保你的文章是原创的,避免抄袭。
-
深度和广度:提供有价值的信息,不仅限于表面,而是深入探讨话题。
-
准确性:确保所有信息都是准确无误的,避免误导读者。
2. 文章结构
-
清晰的标题:使用吸引人的标题,同时包含关键词。
-
良好的段落划分:合理使用标题(H2, H3等),使文章结构清晰。
-
列表和子标题:使用列表和子标题来增强可读性。
3. 关键词优化
-
关键词研究:使用工具如Google Keyword Planner或SEMrush来找到相关的关键词。
-
关键词密度:在文章中合理分布关键词,但避免过度堆砌。
-
元标签优化:优化文章的元描述和关键词标签。
4. 多媒体内容
-
图片和视频:合理使用图片和视频,增强内容的吸引力。
-
ALT标签:为图片添加描述性的ALT标签,这有助于SEO。
5. 外部链接
-
高质量链接:提供有价值的外部链接,增加文章的可信度和深度。
-
内部链接:链接到你的其他相关博客文章,提高页面浏览量和SEO价值。
6. 社交媒体分享
-
易于分享:在文章中添加社交分享按钮,鼓励读者分享你的内容。
-
社交媒体互动:在社交媒体上宣传你的文章,增加曝光率。
7. 定期更新和维护
-
定期更新:保持博客的活跃状态,定期发布新内容。
-
评论管理:及时回复评论,与读者互动,建立良好的社区氛围。
8. 使用SEO插件和工具
-
使用SEO插件:如Yoast SEO(对于WordPress用户),它可以帮助你优化内容。
-
分析工具:使用Google Analytics和Google Search Console来监控你的博客表现,并根据数据进行调整。
9. 用户体验优化
-
快速加载速度:优化图片和其他媒体文件的大小,确保网站快速加载。
-
移动友好性:确保你的博客在移动设备上也能良好显示。
通过实施上述策略,你可以显著提高CSDN博客的质量分,从而增加你的博客的访问量和影响力。记住,持续的努力和改进是关键。
总结
本文讲述:
1、如何查文章质量分
2、如何获取文章链接
3、使用爬虫一次性爬所有文章质量分
4、附CSDN提高博客质量分攻略
小伙伴们,快快点赞、关注、收藏吧~
相关文章:
CSDN文章质量分查询系统【赠python爬虫、提分攻略】
CSDN文章质量分查询系统 https://www.csdn.net/qc 点击链接-----> CSDN文章质量分查询系统 <------点击链接 点击链接-----> https://www.csdn.net/qc <------点击链接 点击链接-----> CSDN文章质量分查询系统 <------点击链接 点击链…...
GPT-SoVITS更新V3 win整合包
GPT-SoVITS 是由社区开发者联合打造的开源语音生成框架,其创新性地融合了GPT语言模型与SoVITS(Singing Voice Inference and Timbre Synthesis)语音合成技术,实现了仅需5秒语音样本即可生成高保真目标音色的突破。该项目凭借其开箱…...
nginx ngx_http_module(8) 指令详解
nginx ngx_http_module(8) 指令详解 nginx 模块目录 nginx 全指令目录 一、目录 1.1 模块简介 ngx_http_ssi_module:服务器端包含(SSI)模块,允许在HTML页面中插入其他内容或动态生成的内容。通过特殊的SSI指令(如 …...
CSS三大特性——继承、优先级与层叠
1. 层叠性 概念:如果发生了样式冲突,那就会根据一定的规则(选择器优先级),进行样式的层叠(覆 盖)。 什么是样式冲突? ——— 元素的同一个样式名,被设置了不同的值&…...
Java 中的方法参数传递与值传递
文章目录 Java 中的方法参数传递与值传递代码示例代码运行结果分析原因1. Java 中的参数传递机制2. 代码执行过程 值传递的图示如何实现真正的交换?1. 使用数组2. 使用对象 总结 Java 中的方法参数传递与值传递 在 Java 编程中,理解方法参数传递的机制是…...
敏捷开发06:用户故事估算方法介绍
估算介绍 在以前开发 IT 软件时,使用较多的衡量软件开发工作量的单位是:小时、人天 或 人月。它是预估开发时间。比如:这个功能张三一个人开发需要 3 天时间完成。 这种 “人天” 估算只是 “理想人天” 的估算,有时与实际开发完…...
在原有基础上的Python正则表达式终极指南,新增高级用法、复杂案例和底层原理分析
以下是Python正则表达式终极指南,新增高级用法、复杂案例和底层原理分析: Python正则表达式终极指南 一、正则表达式引擎原理 1. 回溯机制解析 NFA(非确定性有限自动机)工作原理回溯的产生场景及性能影响灾难性回溯案例:# 危险模式示例 re.match(r(a+)+b, aaaaaaaaac) …...
进制转换及C语言中进制转换方法
进制转换是计算机科学和数学中的基础操作,主要用于不同数制之间的数值表示转换。以下是常见进制(二进制、八进制、十进制、十六进制)的转换方法及示例: 一、其他进制 → 十进制 方法:按权展开,逐位相加。 …...
【我要成为配环境高手】node卸载与nvm安装
node卸载与nvm安装 1. node卸载 参考了这篇文章: https://blog.csdn.net/weixin_43801036/article/details/141487791 2. nvm安装 参考了这两篇文章: https://www.cnblogs.com/rnny/p/17839190.html#tid-z7A3nR https://blog.csdn.net/weixin_45811…...
环境变量与本地变量
目录 本地变量的创建 环境变量VS本地变量 认识完了环境变量我们来认识一下本地变量。 本地变量的创建 我们如果直接env是看不到本地变量的,因为本地变量和环境变量都具有独立性,环境变量是系统提供的具有全局属性的变量,都存在bash进程的…...
Docker安装Kafka(不依赖ZooKeeper)
创建docker-compose.yaml version: "3.9" #版本号 services:kafka:image: apache/kafka:3.9.0container_name: kafkahostname: kafkaports:- 9092:9092 # 容器内部之间使用的监听端口- 9094:9094 # 容器外部访问监听端口environment:KAFKA_NODE_ID: 1KAFKA_PROCES…...
Visual Studio中打开多个项目
1) 找到解决方案窗口 2) 右键添加→ 选择现有项目 3) 选择.vcxproj文件打开即可...
rust笔记7-生命周期显式标注
Rust 的生命周期(Lifetimes)是 Rust 内存安全模型的核心部分,用于确保引用始终有效,避免悬垂引用(Dangling References)。下面我们从生命周期的设计出发点、标注语法以及在不同上下文中的应用(函数、方法、结构体、trait 等)来详细介绍。 1. 生命周期设计的出发点 Rus…...
广西壮族自治区园区投促中心党委书记陶德文率团到访深兰科技
2月16日,广西壮族自治区园区投促中心党委书记、主任,自治区园区办党组成员陶德文率团来到深兰科技集团上海总部考察调研,并与深兰科技集团创始人、董事长陈海波等集团管理层座谈交流,双方围绕深兰科技人工智能项目落地广西的相关事…...
1005 K 次取反后最大化的数组和(贪心)
文章目录 题目[](https://leetcode.cn/problems/maximize-sum-of-array-after-k-negations/)算法原理源码总结 题目 如上图,k是取反的次数,在数组【4,-1,3】中,当k 1,把-2取反为2,和为9;在数组…...
Softing线上研讨会 | 自研还是购买——用于自动化产品的工业以太网
| 线上研讨会时间:2025年1月27日 16:00~16:30 / 23:00~23:30 基于以太网的通信在工业自动化网络中的重要性日益增加。设备制造商正面临着一大挑战——如何快速、有效且经济地将工业以太网协议集成到其产品中。其中的关键问题包括:是否只需集成单一的工…...
SpringBoot整合Redis和Redision锁
参考文章 1.Redis 1.导入依赖 <!--Redis依赖--><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId></dependency><dependency><groupId>org.apache.c…...
【Pandas】pandas Series rename_axis
Pandas2.2 Series Computations descriptive stats 方法描述Series.align(other[, join, axis, level, …])用于将两个 Series 对齐,使其具有相同的索引Series.case_when(caselist)用于根据条件列表对 Series 中的元素进行条件判断并返回相应的值Series.drop([lab…...
数仓搭建(hive):DM搭建(数据集市层)
DM层 数据集市层 (Data Mart) 粒度上卷(Roll-up): 指的是沿着维度层次向上聚合汇总数据,从细粒度到粗粒度观察数据的操作。 示例 数仓的上一层DWS的是按日汇总 DM层基于DWS层主题日宽表上卷统计出按年,月,周的数…...
用LightRAG+智谱GLM-4提升政务对话精度:从知识图谱到精准问答的实战指南
在政务场景中,对话系统的精度至关重要,一个不准确的回答可能导致政策误解甚至行政失误。LightRAG结合智谱GLM-4,通过知识增强(如知识图谱、检索增强生成RAG和动态上下文)显著提升问答准确性。本文从代码实现到架构优化…...
用 Python 实现 DeepSeek R1 本地化部署
DeepSeek R1 以其出色的表现脱颖而出,不少朋友想将其本地化部署,网上基于 ollama 的部署方式有很多,但今天我要带你领略一种全新的方法 —— 使用 Python 实现 DeepSeek R1 本地化部署,让你轻松掌握,打造属于自己的 AI…...
动态内存分配算法对比:最先适应、最优适应、最坏适应与邻近适应
动态内存分配算法对比:最先适应、最优适应、最坏适应与邻近适应 在操作系统中,动态内存分配算法用于管理空闲内存块的分配和回收。最先适应算法(First Fit)、最优适应算法(Best Fit)和最坏适应算法&#x…...
GitHub基本操作及Git简单命令
GitHub简介 GitHub就是一个远程仓库,远程仓库可以理解为就是一个可以保存自己代码的地方,在实际开发当中一个项目往往是有多个人来共同协作开发完成的,那么就需要一个统一代码保存的地方,而GitHub就是起到一个共享和汇总代码的作…...
AI工作流+专业知识库+系统API的全流程任务自动化
我有点悲观,甚至很沮丧,因为AI留给普通人的机会不多了,这既是人类之间权力的斗争,也是硅基生命和碳基生命的斗争。AI自动化是无法避免的趋势,如果人类不能平权,那就只能跪下接受审判。 通过整合AI工作流、专…...
C++深拷贝\浅拷贝
C 中的深拷贝(Deep Copy)和浅拷贝(Shallow Copy)是指在对象复制时,对象成员的复制方式不同。理解这两种拷贝构造方式非常重要,尤其是在涉及到动态内存分配和资源管理时。 浅拷贝(Shallow Copy&…...
本地文件共享——HFS
目录 1.介绍: 2.下载: 3.开始使用: 1.介绍: HFS(HTTP File Server)是一款轻量级的本地文件共享软件,主要用于快速搭建一个基于网页的临时文件服务器,支持通过浏览器直接上传或下载…...
第十二届先进制造技术与材料工程国际学术会议 (AMTME 2025)
重要信息 大会官网:www.amtme.org(了解会议,投稿等) 大会时间:2025年3月21-23日 大会地点:中国-广州 简介 2025年第十二届先进制造技术与材料工程 (AMTME 2025) 定于2025年3月21-23日在中国广州隆重举…...
【Alertmanager】alertmanager告警系统原理剖析与应用实战,应有尽有非常全面
✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全…...
C语言预处理学习笔记
1. 预处理器的功能 预处理器(Preprocessor)在编译C语言程序之前对源代码进行预处理。预处理指令以#号开头,主要包括文件包含、宏定义、条件编译等功能。 2. 文件包含 文件包含功能用于在一个文件中包含另一个文件的内容,通常用…...
jQuery AJAX 方法详解
jQuery AJAX 方法详解 引言 随着互联网技术的不断发展,前端开发领域的技术也在不断更新迭代。jQuery 作为一种广泛使用的前端JavaScript库,极大地简化了DOM操作和事件处理。在众多jQuery功能中,AJAX(Asynchronous JavaScript and XML)方法尤为突出,它允许我们在不重新加…...

