当前位置: 首页 > news >正文

摸鱼用python获取弹幕的两种方式【前者简单,后者数据好看】

嗨害大家好鸭!我是小熊猫~

相信大家对于 “弹幕文化” 已经相当熟悉啦

你不是一个人在看——这就是弹幕网站的存在感。
它形成了新的“抱团”观看模式,
也真正实现了无时空距离的社交。

有网友表示,弹幕简直比剧情还有趣。
看似简单的寥寥几句弹幕,
却也是无数观众在那一刻最想要传达的感想。

如果说中年人使用社交平台更多是进行一种信息交换,
希望社交平台简洁有序,
那么年轻人的社交平台则更加丰富有趣。
当下年轻人正在通过信息技术展现自身独特的社交属性,
正是如此才会有弹幕文化、各种缩略语的出现。

而相比点赞、评论、转发等方式,
弹幕的“共时性”打破了观众之间地域、时间、空间的限制,
满足了年轻观众在特定时刻的及时互动与社交需求。

本文源码、其他python资料电子书:点击此处跳转文末名片获取

在这里插入图片描述

今天就教大家如何获取弹幕的数据

环境

  • python 3.8
  • pycharm
  • requests
  • re

获取方式一: <简单, 但是弹幕很少>

先打开网站,找到你想要的视频,然后在网址bili前加个i,这样你就可以直接的找到弹幕的地址
复制地址打开,你就可以看到你想要的弹幕数据,写代码时直接请求这个地址就可以了

部分网页弹幕数据

在这里插入图片描述

请求数据

url = '平台审核不给过'
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
print(response)

请添加图片描述

获取数据

response.encoding = 'utf-8'
print(response.text)

请添加图片描述

解析数据

content_list = re.findall('<d p=".*?">(.*?)</d>', response.text)
content = '\n'.join(content_list)
print(content_list)

请添加图片描述

保存数据

with open('方式一.txt', mode='a', encoding='utf-8') as f:f.write(content)

请添加图片描述

获取方式二: <复杂一点点, 弹幕比较多,按日期来>

先回到视频播放地址,打开开发者工具,选择其他日期天数,然后会出现带有当天日期的数据包,右边就是我们要找的url地址

在这里插入图片描述
在这里插入图片描述

获取URL

在这里插入图片描述
在这里插入图片描述

也出现了乱码的弹幕数据

请添加图片描述

请求数据

url = f'网站开发者工具自己获取'
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36','cookie': '加自己的'
}
response = requests.get(url=url, headers=headers)

解析数据

content_list = re.findall('[\u4e00-\u9fa5]+', response.text)
content = '\n'.join(content_list)

翻页

for page in range(1, 24):url = f'https://api.bilibili.com/x/v2/dm/web/history/seg.so?type=1&oid=967256583&date=2023-02-{page}'

保存数据

with open('方式二.txt', mode='a', encoding='utf-8') as f:f.write(content)
print(content_list)

请添加图片描述

👇问题解答 · 源码获取 · 技术交流 · 抱团学习请联系👇

相关文章:

摸鱼用python获取弹幕的两种方式【前者简单,后者数据好看】

嗨害大家好鸭&#xff01;我是小熊猫~ 相信大家对于 “弹幕文化” 已经相当熟悉啦 你不是一个人在看——这就是弹幕网站的存在感。 它形成了新的“抱团”观看模式&#xff0c; 也真正实现了无时空距离的社交。 有网友表示&#xff0c;弹幕简直比剧情还有趣。 看似简单的寥寥…...

【C++】继承与多态

目录前言1. 继承1.1 继承的概念1.2 继承的定义1.3 切片赋值1.4 继承中的作用域1.5 派生类的默认成员函数1.6 继承与友元、静态成员1.7 多继承、菱形继承、菱形虚拟继承1.7.1 区分单继承与多继承1.7.2 菱形继承1.7.3 菱形虚拟继承1.7.4 菱形虚拟继承的原理2. 多态2.1 概念2.2 多…...

每日分享(微信社区小程序/h5/圈子论坛贴吧交友/博客/社交)

1.Java单元测试实战 高清PDF中文版 Java单元测试实战来自于作者多年来的单元测试实践&#xff0c;最初发表在阿里内网的ATA上&#xff0c;成为了很多阿里同学单元测试学习的必读文章。很多程序员认为单元测试会花费大量的时间&#xff0c;因此他们写单元测试的意愿比较低&…...

第51章 初识第3方阿里云短信验证发送服务

1 第3方阿里云短信验证发送服务准备工作 2 其它第3方短信发送服务平台 当前常用第3方短信发送服务平台还有容联云和凯信通过&#xff0c;在配置上来说阿里云和容联云配置都比较复杂&#xff0c;网上程序集成示例完善&#xff0c;资费灵活。凯信通配置十分简单只要在程序中指定其…...

CSGO社区服搭建服务器架设游戏服务端教程

CSGO社区服搭建服务器架设游戏服务端教程 我是艾西&#xff0c;上一篇说了搭建CSGO服务器需要准备服务器以及安装好所需要的环境&#xff0c;那么今天说一下CSGO社区私人服务器怎么搭建游戏服务端 搭建CSGO服务器比较简单&#xff0c;Valve开发者社区wiki也给出了安装指导&…...

【Linux学习】基础IO——系统调用 | 文件描述符fd | 重定向

&#x1f431;作者&#xff1a;一只大喵咪1201 &#x1f431;专栏&#xff1a;《Linux学习》 &#x1f525;格言&#xff1a;你只管努力&#xff0c;剩下的交给时间&#xff01; 基础IO&#x1f34e;文件操作&#x1f349;使用C接口进行文件操作&#x1f349;文件操作的系统调…...

PLC实验—西门子S7 1200读取超声波传感器数据

PLC实验—西门子S7 1200读取超声波传感器数据 US-016超声波测距模块 实验箱上是US-016超声波测距模块&#xff0c;其有关信息可以看实验室的博客 US-016超声波测距模块 1号Pin&#xff1a;接VCC电源&#xff08;直流5V&#xff09; 2号Pin&#xff1a;量程设置引脚&#xff…...

一次Linux系统密码修改失败事件

一、事件描述 某业务系统采用移动云主机&#xff0c;某次因误操作导致移动云内嵌密码管理相关Pga进程导致页面无法修改密码&#xff0c;东移动云主机web终端登录也无法修改&#xff0c;密码错误次数最大已无法登录&#xff0c;无奈只能重启主机&#xff0c;修改密码&#xff1b…...

C语言循环控制语句Break,goto,continue语句讲解

循环控制语句改变你代码的执行顺序。通过它你可以实现代码的跳转。 C 语言中 break 语句有以下两种用法&#xff1a; 当 break 语句出现在一个循环内时&#xff0c;循环会立即终止&#xff0c;且程序流将继续执行紧接着循环的下一条语句。 它可用于终止 switch 语句中的一个 …...

Zabbix“专家坐诊”第183期问答汇总

问题一 Q&#xff1a;老师&#xff0c;请问一下zabbix采集的数据怎么过滤&#xff0c;获取数据是nottime20:30 notafter3&#xff0c;怎么过滤出netafter3 &#xff1f;谢谢。 A&#xff1a;过滤器设置如下图。 问题二 Q&#xff1a;大佬&#xff0c;请问一下被管节点部署了…...

以太网协议和DNS

目录 &#x1f415;今日良言:跨过困难,去迎接更好的自己. &#x1f433;一、以太网桢格式 &#x1f433;二、DNS &#x1f415;今日良言:跨过困难,去迎接更好的自己. &#x1f433;一、以太网桢格式 数据链路层考虑的是相邻两个节点(通过网线/光纤/无线直接相连的两个设备…...

【设计模式】原型模式与建造者模式

原型模式 原型模式是指通过原型实例指定创建对象的种类&#xff0c;然后通过拷贝的方式创建新的对象。属于创建型模式 原型模式的核心在于拷贝原型对象&#xff0c;主要用于对对象的复制。当你需要通过一大段get/set方法去构建对象的时候&#xff0c;就可以考虑使用原型模式了…...

QT之Http请求

今天我们介绍一下QT的http请求&#xff0c;这里有post和get两种方式 一、post请求方式&#xff1a;参数分为网址和具体请求值两个部分&#xff0c;有时候还需要设置头信息&#xff0c;看具体情况定 1 void MainWindow::sendPostRequest()2 {3 QNetworkAccessManager *m_pH…...

何谓dB , dB怎么理解?

dB 是什么单位 ?愈低愈好吗?对于声频 ( 声学及电子声学 ) 方面的单位&#xff0c;它是以分贝(decibel &#xff0c;dB ) 来做结果的。斯多里一生专注于科学,1876 发明电话&#xff0c;我们都知道贝尔发明了电话&#xff0c;然而重要的是&#xff0c;他发现我们人类耳朵对声音…...

【数据聚类|深度聚类】Unsupervised Deep Embedding for Clustering Analysis(DEC)论文研读

DEC算法由两部分组成 第一部分会预训练一个SDAE模型;第二部分选取SDAE模型中的Encoder部分,加入聚类层,然后最小化KL散度进行训练聚类Absratct 提出了一种利用深度神经网络同时进行表征学习和聚类分配的方法,称之为深度嵌入聚类。该方法学习从数据空间到低纬空间的映射,并…...

Nuxt.js项目开发过程遇到的问题以及对Nuxt.js的学习与总结

文章目录&#x1f4cb;前言&#x1f4bb;Nuxtjs3快速了解&#x1f3af;nuxtjs是什么&#xff1f;官网是这样介绍它的。&#x1f3af;关于nuxtjs的SSR开发&#x1f9e9;SSR应用场景&#x1f9e9;nuxtjs的特性&#x1f4bb;nuxtjs的初始目录结构&#x1f3af;关于各个目录的解释&…...

JavaSE:异常机制

异常概念异常发生的原因用户输入非法数据要打开的文件不存在网络中断/JVM内存溢出&#xff08;JVM是JRE的一部分。它是一个虚构出来的计算机&#xff09;除0、非法参数等三种类型的异常&#xff0c;用以理解异常检查性异常【otherException】&#xff1a;程序员无法预见的&…...

Go mockito 使用说明 (github/mockey)

GitHub - bytedance/mockey: a simple and easy-to-use golang mock library Go mockito 是什么? mockey是一个简单易用的golang mock库&#xff0c;可以快速方便的mock函数和变量。目前广泛应用于字节跳动服务的单元测试编写。底层是monkey patch&#xff0c;通过在运行时重…...

Spring Boot+Vue前后端分离项目练习01之网盘项目的搭建

1.前期设计 一般看来&#xff0c;网盘系统主要实体包括&#xff1a;用户、存储信息、用户文件、文件、回收文件等基本功能点。 各实体对应的表结构如下所示&#xff1a; 表名&#xff1a;user&#xff08;用户表&#xff09; 字段名属性说明userIdbigint主键usernamevarcha…...

超详细MySQL(免安装版)安装与配置

一、MySQL下载 首先打开MySQL官网&#xff0c;官网首页地址为 MySQL官网首页地址 进入官网后如下图所示&#xff0c;点击DOWNLOADS进入下载页面 下滑页面找到MySQL Community&#xff08;GPL&#xff09;Downloads>>并点击 接下来点击MySQL Community Server 若想要安…...

3个技巧让窗口管理更智能:如何用开源工具提升专注力?

3个技巧让窗口管理更智能&#xff1a;如何用开源工具提升专注力&#xff1f; 【免费下载链接】AlwaysOnTop Make a Windows application always run on top 项目地址: https://gitcode.com/gh_mirrors/al/AlwaysOnTop 想象一下这样的工作场景&#xff1a;你正在编写代码…...

GlosSI系统级Steam控制器:打破平台限制的终极解决方案

GlosSI系统级Steam控制器&#xff1a;打破平台限制的终极解决方案 【免费下载链接】GlosSI Tool for using Steam-Input controller rebinding at a system level alongside a global overlay 项目地址: https://gitcode.com/gh_mirrors/gl/GlosSI GlosSI&#xff08;Gl…...

构建个人效率工具集:模块化Shell环境配置与自动化工作流实践

1. 项目概述与核心价值最近在整理个人技术栈和自动化工具时&#xff0c;发现了一个挺有意思的项目&#xff0c;叫“Tsai1030/Tsai_PIG”。乍一看这个仓库名&#xff0c;可能会让人有点摸不着头脑&#xff0c;PIG&#xff1f;和数据处理框架Apache Pig有关吗&#xff1f;还是某种…...

AI智能体长期记忆系统:从RAG到Memory-Skill的工程实践

1. 项目概述&#xff1a;一个关于“记忆”的AI技能最近在折腾AI智能体&#xff08;Agent&#xff09;和RAG&#xff08;检索增强生成&#xff09;相关的东西&#xff0c;发现一个挺有意思的GitHub项目&#xff0c;叫memory-skill。光看名字&#xff0c;你可能会觉得这是个简单的…...

国产手机涨价,苹果却开启了降价模式,618可能还要降,怎么打?

苹果的iPhone17可能是苹果史上降价最慢的手机了&#xff0c;这款手机上市以来降价速度非常缓慢&#xff0c;但是昨晚苹果CEO库克还中国的时候&#xff0c;苹果就官宣iPhone17Pro系列降价1000元&#xff0c;与国产手机因存储芯片涨价而涨价形成鲜明对比。值得注意的是当下iPhone…...

Git提交规范自动化:Husky与Commitlint提升团队协作效率

1. 项目概述&#xff1a;一个被低估的开发者效率神器 如果你和我一样&#xff0c;每天都要在终端里敲下几十次 git commit -m “fix: xxx” &#xff0c;并且每次都要纠结于提交信息的格式、规范&#xff0c;甚至因为一个拼写错误而不得不重新修改提交&#xff0c;那么你一定…...

如何彻底移除Windows Defender:13项核心服务完整卸载与系统性能优化终极指南

如何彻底移除Windows Defender&#xff1a;13项核心服务完整卸载与系统性能优化终极指南 【免费下载链接】windows-defender-remover A tool which is uses to remove Windows Defender in Windows 8.x, Windows 10 (every version) and Windows 11. 项目地址: https://gitco…...

面试题详解:GraphRAG 全面解析——知识图谱增强 RAG、Local Search、Global Search、社区摘要、工程落地与评估指标一次讲透

一、什么是 GraphRAG&#xff1f;1.1 先用一句话讲清楚GraphRAG 可以理解为&#xff1a;在传统 RAG 的基础上&#xff0c;把文档里的实体、关系、事件和主题组织成一张图&#xff0c;再利用这张图来增强检索和生成。普通 RAG 更像“在文档块里找相似内容”&#xff0c;GraphRAG…...

云工场科技成为海淀3x3超级争霸赛与无锡杯官方算力支持伙伴

真正的速度&#xff0c;从来不只是快。5月&#xff0c;北京海淀3x3超级争霸赛与无锡杯篮球赛相继启动。云工场科技&#xff08;HK.02512&#xff09;以“官方算力支持伙伴”身份参与赛事合作&#xff0c;将算力服务能力带到赛场现场。一个多元化、速度与城市活力&#xff1b;一…...

论文降 AI 软件红黑榜!这 3 类是套壳 ChatGPT 改完 AI 率反涨 30% 别用

论文降 AI 软件红黑榜&#xff01;这 3 类是套壳 ChatGPT 改完 AI 率反涨 30% 别用 每年毕业季都有同学跑来问我——「学姐我花了 200 块买的降 AI 工具&#xff0c;降完之后送知网检测 AI 率反而涨了 30 个点&#xff0c;怎么回事&#xff1f;」这不是段子&#xff0c;是 202…...