当前位置: 首页 > article >正文

Python实战:5分钟搞定微博爬虫,自动备份你的微博内容(附完整代码)

Python实战5分钟搞定微博个人内容备份零基础友好版每次刷微博时看到自己多年前发的动态总有种时光穿越的错觉。那些深夜的碎碎念、旅行的打卡照、突发奇想的段子都是珍贵的数字记忆。但平台内容随时可能调整展示规则甚至存在误删风险。今天要分享的这套方案能让你的微博内容像照片一样定期自动备份到本地电脑。1. 准备工作小白也能搭建的环境在开始之前我们需要准备最基础的工具箱。别被编程二字吓到整个过程就像组装乐高积木一样简单。必备工具清单Python 3.6推荐3.8版本代码编辑器VS Code或PyCharm社区版微博账号需要登录状态安装Python时记得勾选Add Python to PATH选项这样系统才能识别python命令。验证安装是否成功只需要在命令行输入python --version接下来安装我们需要的三个关键组件pip install requests pandas tqdmrequests负责网络通信pandas处理数据导出tqdm则提供美观的进度条。这三个库的组合就像瑞士军刀的基础模块能解决80%的自动化需求。2. 获取你的微博专属密钥微博的移动端接口比网页版更友好我们需要先找到自己的用户ID。登录微博网页版后打开个人主页地址栏中那一串数字就是你的UIDhttps://weibo.com/u/1234567890其中的1234567890就是需要记录的ID。更简单的方法是直接在搜索框输入你的昵称从结果页URL获取这串数字。为了确保能获取完整内容我们还需要临时获取登录状态标识。按F12打开开发者工具切换到Network网络标签刷新页面后任意点击一个请求在Headers选项卡中找到Cookie字段复制整个字符串备用。注意Cookie相当于临时密码请勿分享给他人。脚本运行完成后可以立即在微博账号设置中清除已登录设备。3. 完整备份脚本解析下面这个不到100行的脚本包含了所有核心功能。新建weibo_backup.py文件复制以下代码import requests import pandas as pd from tqdm import tqdm import time import os class WeiboArchiver: def __init__(self, cookie): self.headers { User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X), Cookie: cookie } self.session requests.Session() def fetch_weibos(self, uid, max_pages5): weibo_data [] container_id f107603{uid} for page in tqdm(range(1, max_pages1), desc备份进度): url fhttps://m.weibo.cn/api/container/getIndex?typeuidvalue{uid}containerid{container_id}page{page} try: resp self.session.get(url, headersself.headers).json() if resp[ok]: for card in resp[data][cards]: if mblog in card: blog card[mblog] weibo_data.append({ 发布时间: blog[created_at], 正文内容: blog[text], 点赞数: blog[attitudes_count], 转发数: blog[reposts_count], 评论数: blog[comments_count] }) time.sleep(1) # 礼貌性延迟 except Exception as e: print(f第{page}页获取异常: {str(e)}) return pd.DataFrame(weibo_data) if __name__ __main__: YOUR_UID input(请输入你的微博UID: ).strip() YOUR_COOKIE input(粘贴复制的Cookie: ).strip() archiver WeiboArchiver(YOUR_COOKIE) df archiver.fetch_weibos(YOUR_UID) backup_file fweibo_backup_{time.strftime(%Y%m%d)}.xlsx df.to_excel(backup_file, indexFalse) print(f\n备份完成文件已保存为: {backup_file}) print(f共备份{len(df)}条微博最早发布于{df[发布时间].iloc[-1]})4. 一键执行与结果查看保存脚本后在文件所在目录打开命令行Windows用户按住Shift右键选择在此处打开Powershell窗口输入python weibo_backup.py按照提示输入你的UID和Cookie后程序就会开始工作。你会看到一个动态进度条每完成一页数据获取进度条就会前进一格。默认设置会备份最近5页内容约100-150条微博如果想调整数量修改脚本中max_pages参数即可。执行完成后当前目录会生成一个Excel文件命名格式为weibo_backup_日期.xlsx。文件内容示例发布时间正文内容点赞数转发数评论数05-20 10:15今天天气真好 #随手拍243505-18 22:30分享一个冷知识...15628425. 进阶技巧与个性化设置基础功能实现后我们可以根据需求添加更多实用功能图片备份增强版 在fetch_weibos方法内添加图片处理逻辑if pics in blog: pic_urls [pic[large][url] for pic in blog[pics]] weibo_data[-1][图片链接] \n.join(pic_urls) # 自动下载图片 for i, url in enumerate(pic_urls): img_data requests.get(url, headersself.headers).content with open(fweibo_images/{blog[id]}_{i}.jpg, wb) as f: f.write(img_data)定时自动备份 使用Windows任务计划或Mac/Linux的crontab设置每周自动运行# Linux/Mac定时任务示例每周日23点运行 0 23 * * 0 cd /path/to/script python weibo_backup.py多账号管理 创建config.ini文件存储多个账号信息[account1] uid 123456 cookie abcdef [account2] uid 789012 cookie ghijk然后在主程序中读取配置import configparser config configparser.ConfigParser() config.read(config.ini)6. 常见问题排雷指南Q1运行时报SSL证书错误pip install --upgrade certifiQ2获取的内容不全检查Cookie是否过期有效期通常2-3天增加max_pages参数值在headers中添加X-Requested-With: XMLHttpRequestQ3Excel打开乱码导出时指定编码格式df.to_csv(backup.csv, indexFalse, encodingutf_8_sig)Q4想备份特定时间段的微博修改API请求URL添加since_id参数url fhttps://m.weibo.cn/api/container/getIndex?since_id{since_id}...这套方案我已经稳定使用两年多累计备份了8000条微博。最惊喜的是某次找回了一条被系统误删的纪念日动态。现在我的备份脚本每周日晚上自动运行生成的Excel文件会自动同步到NAS和云盘形成了三重保险。

相关文章:

Python实战:5分钟搞定微博爬虫,自动备份你的微博内容(附完整代码)

Python实战:5分钟搞定微博个人内容备份(零基础友好版) 每次刷微博时,看到自己多年前发的动态总有种时光穿越的错觉。那些深夜的碎碎念、旅行的打卡照、突发奇想的段子,都是珍贵的数字记忆。但平台内容随时可能调整展示…...

MusicFree歌单导入终极指南:如何快速迁移你的音乐收藏

MusicFree歌单导入终极指南:如何快速迁移你的音乐收藏 【免费下载链接】MusicFree 插件化、定制化、无广告的免费音乐播放器 项目地址: https://gitcode.com/maotoumao/MusicFree 你是否厌倦了在不同音乐平台之间切换时,精心整理的音乐收藏总是被…...

RevokeMsgPatcher防撤回工具深度指南:让重要消息不再消失的完整解决方案

RevokeMsgPatcher防撤回工具深度指南:让重要消息不再消失的完整解决方案 【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁(我已经看到了,撤回也没用了) 项目地址: h…...

千问3.5-2B 黑马点评项目AI赋能:智能推荐与评论分析实战

千问3.5-2B 黑马点评项目AI赋能:智能推荐与评论分析实战 1. 项目背景与痛点分析 "黑马点评"作为本地生活服务领域的知名平台,每天面临三大核心挑战:商铺推荐千人一面缺乏个性、海量用户评论难以有效挖掘、客服咨询重复率高响应慢…...

如何构建 Flink SQL 任务的血缘分析

版本一:干燥苦涩、缺乏深度(反面回答素材)面试者语气:(机械地背诵,没有眼神交流,缺乏实践细节)“关于 Flink SQL 的血缘分析,我认为主要分为以下几个步骤:首先…...

OpenClaw版本升级:无缝迁移Kimi-VL-A3B-Thinking对接配置

OpenClaw版本升级:无缝迁移Kimi-VL-A3B-Thinking对接配置 1. 升级前的准备工作 上周我在升级OpenClaw时遇到了一个棘手的问题——新版本与现有的Kimi-VL-A3B-Thinking模型对接出现了兼容性问题。这让我意识到,对于依赖特定模型服务的自动化工作流来说&…...

SEO_资深专家分享SEO内容优化的核心方法

SEO内容优化的核心方法:资深专家分享 在当今竞争激烈的互联网时代,搜索引擎优化(SEO)已经成为提升网站流量和品牌知名度的关键。资深专家在SEO领域积累了丰富的经验,他们提出了许多实用的方法来优化内容。本文将详细探…...

新手福音:通过快马生成wsl2入门项目,轻松迈出linux开发第一步

作为一个刚接触Linux开发的新手,我最近在尝试使用WSL2搭建开发环境时遇到了不少麻烦。从安装配置到基础命令学习,每一步都让我这个Windows用户感到手足无措。直到发现了InsCode(快马)平台,它帮我生成了一套完整的WSL2入门项目,让我…...

Pixel Couplet Gen 保姆级部署教程:VSCode远程开发环境搭建

Pixel Couplet Gen 保姆级部署教程:VSCode远程开发环境搭建 1. 前言:为什么选择VSCode远程开发 如果你正在使用星图GPU平台上的Pixel Couplet Gen服务,可能会遇到一个常见问题:如何在本地高效地开发和调试对联生成项目&#xff…...

新站如何运用SEO手段快速上首页_网站链接建设有助于SEO快速排名吗

新站如何运用SEO手段快速上首页 在互联网时代,新站如何快速上首页成为了许多网站创始人和SEO专业人士的共同关注点。快速攀升到搜索引擎的首页不仅能带来大量流量,还能提升品牌知名度。新站应如何运用SEO手段来实现这一目标呢?本文将从多个角…...

G-Helper:实现华硕笔记本硬件级控制的5个轻量高效解决方案

G-Helper:实现华硕笔记本硬件级控制的5个轻量高效解决方案 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix…...

AB测试、质量监控都离不开它:深入浅出聊聊样本均值的t分布与F检验

AB测试与质量监控的统计基石:t分布与F检验实战指南 当产品经理纠结于哪个按钮颜色能带来更高转化率,当质量工程师需要判断生产线波动是否超出正常范围,背后都隐藏着两个关键统计工具:t分布与F检验。这些理论概念之所以能走出教科书…...

VideoAgentTrek Screen Filter作品集:处理前后对比展示多行业应用效果

VideoAgentTrek Screen Filter作品集:处理前后对比展示多行业应用效果 最近在整理一些屏幕录像素材时,我发现了一个挺有意思的工具——VideoAgentTrek Screen Filter。它不是什么复杂的视频编辑软件,核心功能很聚焦:自动识别并处…...

WorkshopDL:跨平台Steam创意工坊资源获取工具

WorkshopDL:跨平台Steam创意工坊资源获取工具 【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 在游戏玩家的日常体验中,创意工坊模组往往是提升游戏乐趣的…...

跨平台迁移零成本转换:MusicFree实现音乐收藏自由的完整指南

跨平台迁移零成本转换:MusicFree实现音乐收藏自由的完整指南 【免费下载链接】MusicFree 插件化、定制化、无广告的免费音乐播放器 项目地址: https://gitcode.com/maotoumao/MusicFree 当你从一个音乐平台转向另一个时,精心整理的歌单往往成为最…...

从按键消抖到I2C总线:一个上拉电阻,在STM32 GPIO配置里到底有多少种玩法?

从按键消抖到I2C总线:一个上拉电阻,在STM32 GPIO配置里到底有多少种玩法? 第一次接触STM32开发板时,看到GPIO配置选项里的"上拉输入"、"开漏输出"这些专业术语,相信不少初学者和我当初一样感到困惑…...

C++的std--format编译期检查与类型安全输出在模板中的实现

C20引入的std::format为现代C带来了类型安全的格式化输出能力,其编译期检查机制与模板的结合更是为开发者提供了强大的工具。本文将深入探讨std::format在模板中的实现原理,揭示其如何通过编译期检查确保类型安全,并展示其在泛型编程中的独特…...

HunterPie:怪物猎人世界终极数据覆盖层工具,实时监控提升狩猎效率

HunterPie:怪物猎人世界终极数据覆盖层工具,实时监控提升狩猎效率 【免费下载链接】HunterPie-legacy A complete, modern and clean overlay with Discord Rich Presence integration for Monster Hunter: World. 项目地址: https://gitcode.com/gh_m…...

Calibre中文路径保护插件:彻底解决中文文件名乱码的终极方案

Calibre中文路径保护插件:彻底解决中文文件名乱码的终极方案 【免费下载链接】calibre-do-not-translate-my-path Switch my calibre library from ascii path to plain Unicode path. 将我的书库从拼音目录切换至非纯英文(中文)命名 项目地…...

ECharts饼图隐藏数据实战:如何优雅处理空值项的指示线与Tooltip(附完整代码)

ECharts饼图隐藏数据实战:如何优雅处理空值项的指示线与Tooltip(附完整代码) 在数据可视化项目中,我们经常遇到需要隐藏某些数据项的场景。比如当某个分类的数据值为零或空时,传统的饼图会显示一个极小的扇形区域&…...

自动驾驶规划新范式:像人一样用‘矢量关系’思考,VAD三大安全约束详解

自动驾驶规划新范式:像人一样用‘矢量关系’思考,VAD三大安全约束详解 想象一下,在高峰时段的城市十字路口,人类驾驶员能瞬间判断左侧公交车的变道意图,同时预判右前方自行车可能出现的摇摆——这种基于空间关系的直觉…...

Cursor Free VIP:三步解锁AI编程助手完整功能的终极指南

Cursor Free VIP:三步解锁AI编程助手完整功能的终极指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your t…...

SEO_快速诊断并修复网站SEO问题的有效方法

快速诊断网站SEO问题的方法 在当今互联网时代,一个高效的SEO策略至关重要。无论你经营的是什么类型的网站,优化搜索引擎表现都能显著提升你的流量和收益。很多网站在SEO方面遇到了各种问题,导致流量下降,这时候,快速诊…...

革新性语音合成与转换工具:零基础掌握AI语音克隆技术

革新性语音合成与转换工具:零基础掌握AI语音克隆技术 【免费下载链接】GPT-SoVITS 1 min voice data can also be used to train a good TTS model! (few shot voice cloning) 项目地址: https://gitcode.com/GitHub_Trending/gp/GPT-SoVITS 在数字内容创作爆…...

Qwen3.5-2B算法学习伴侣:动态图解与代码实现一键生成

Qwen3.5-2B算法学习伴侣:动态图解与代码实现一键生成 1. 算法学习的新方式 算法学习一直是开发者成长路上的必经之路,但传统的学习方式往往面临几个痛点:文字解释太抽象、静态图示不够直观、代码实现需要反复调试。Qwen3.5-2B的出现&#x…...

3天从零到精通:录播姬全方位实战指南

3天从零到精通:录播姬全方位实战指南 【免费下载链接】BililiveRecorder 录播姬 | mikufans 生放送录制 项目地址: https://gitcode.com/gh_mirrors/bi/BililiveRecorder 你是否曾经因为错过心爱主播的直播而感到遗憾?是否在录制直播时遇到各种技…...

跨平台浏览器字体渲染优化:从技术原理到实战应用

跨平台浏览器字体渲染优化:从技术原理到实战应用 【免费下载链接】GreasyFork-Scripts The open source code of this project is used for userscripts (油猴脚本) for desktop browsers, including Font Rendering (Customized) (字体渲染(自用脚本&am…...

pytorch求二维张量转置的几种方法

方法1方法2方法3方法4...

用HC-SR501打造智能家居:5分钟搞定人体感应自动灯(附Arduino代码)

用HC-SR501打造智能家居:5分钟搞定人体感应自动灯(附Arduino代码) 智能家居的入门项目里,人体感应自动灯绝对是最实用且容易上手的方案之一。想象一下:深夜起床不用摸黑找开关,走到走廊灯光自动亮起&#x…...

卡证检测矫正模型与ChatGPT联动:打造智能问答审核助手

卡证检测矫正模型与ChatGPT联动:打造智能问答审核助手 你有没有遇到过这样的场景?用户上传了一张歪歪扭扭、光线昏暗的身份证照片,你需要手动把它摆正、调亮,然后一个字一个字地把姓名、身份证号敲进系统里核对。或者&#xff0c…...