当前位置: 首页 > news >正文

python分析实战(4)--获取某音热榜

1. 分析需求

打开某音热搜,选择需要获取的热榜如图
在这里插入图片描述

查找包含热搜内容的接口返回如图
在这里插入图片描述
将url地址保存
在这里插入图片描述

2. 开发

定义请求头

headers = {'Cookie': '自己的cookie','Accept': 'application/json, text/plain, */*','Accept-Encoding': 'gzip, deflate','Host': 'www.douyin.com','User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/15.4 Safari/605.1.15','Accept-Language': 'zh-CN,zh-Hans;q=0.9','Referer': 'https://www.douyin.com/hot','Connection': 'keep-alive'
}

配置上面获取到的url
定义抓取元素数组

    position_list = []  # 热搜排名title_list = []  # 热搜标题time_list = []  # 热搜时间hot_value_list = []  # 热度值hot_url = []  # 热搜链接

开始请求

    r = requests.get(url, headers=headers)# 用json接收请求数据json_data = r.json()

解析响应

    data_list = json_data['data']['word_list']

循环赋值

    for data in data_list:title = data.get('word', '')  # 热搜标题title_list.append(title)position = data.get('position', 0)  # 热搜排名position_list.append(position)hot_value = data.get('hot_value', '')  # 热搜值hot_value_list.append(hot_value)event_time = data.get('event_time', '')  # 热搜时间戳if event_time:timestamp = float(event_time)# 时间戳转时间dt_object = datetime.datetime.fromtimestamp(timestamp)formatted_date = dt_object.strftime("%Y-%m-%d %H:%M:%S")time_list.append(formatted_date)else:time_list.append('')hot_url.append('https://www.douyin.com/hot/' + data.get('sentence_id', ''))  # 热榜链接

写入csv

    df = pd.DataFrame({'热搜排名': position_list,'热搜标题': title_list,'热搜时间': time_list,'热度值': hot_value_list,'热搜链接': hot_url,})# 保存结果到csv文件df.to_csv('抖音热搜.csv', index=False, encoding='utf_8_sig')

3. 效果验证

在这里插入图片描述

相关文章:

python分析实战(4)--获取某音热榜

1. 分析需求 打开某音热搜,选择需要获取的热榜如图 查找包含热搜内容的接口返回如图 将url地址保存 2. 开发 定义请求头 headers {Cookie: 自己的cookie,Accept: application/json, text/plain, */*,Accept-Encoding: gzip, deflate,Host: www.douyin.com,…...

Java根据List集合中的一个字段对集合进行去重

利用HashSet 创建了一个HashSet用于存储唯一的字段值&#xff0c;并创建了一个新的列表uniqueList用于存储去重后的对象。遍历原始列表时&#xff0c;如果字段值未在HashSet中出现过&#xff0c;则将其添加到HashSet和uniqueList中。 List<Person> originalList new Ar…...

(AtCoder Beginner Contest 315)

A.直接模拟即可 import random import sys import os import math from collections import Counter, defaultdict, deque from functools import lru_cache, reduce from itertools import accumulate, combinations, permutations from heapq import nsmallest, nlargest, h…...

API 接口选择那个?RESTful、GraphQL、gRPC、WebSocket、Webhook

大家好&#xff0c;我是比特桃。目前我们的生活紧紧地被大量互联网服务所包围&#xff0c;互联网上每天都有数百亿次API调用。API 是两个设备相互通讯的一种方式&#xff0c;人们在手机上每次指尖的悦动&#xff0c;背后都是 API 接口的调用。 本文将列举常见的一些 API 接口&…...

「Python|音视频处理|环境准备」如何在Windows系统下安装并配置音视频处理工具FFmpeg

本文主要介绍如何在Windows系统下安装并配置音视频处理工具FFmpeg&#xff0c;方便使用python进行音视频相关的下载或编辑处理。 文章目录 一、下载软件二、解压并配置三、验证安装 一、下载软件 首先要去 ffmpeg官网 下载软件包 由于上面直接下载的按钮是.tar.xz格式的。为了…...

软考高级架构师下篇-12层次式架构设计理论与实践

目录 1. 考情分析2. 层次式体系结构概述3. 表现层框架设计4. 中间层框架设计5. 数据访问层设计6. 数据架构规划与设计7. 物联网层次架构设计8. 前文回顾1. 考情分析 根据考试大纲,层次式架构设计理论与实践知识点会涉及单选题型(约占2~5分)和案例题(25分),本小时内容偏重于方…...

234. 回文链表

234. 回文链表 给你一个单链表的头节点 head &#xff0c;请你判断该链表是否为回文链表。如果是&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* L…...

LInux之例行工作

目录 场景 单一执行例行任务 --- at&#xff08;一次性&#xff09; 安装 命令详解 语法格式 参数及作用 时间格式 案例 at命令执行过程分析 循环执行的例行性任务--crontab&#xff08;周期性&#xff09; crontd服务安装 linux 任务调度的工分类 crontab工作过程…...

C++,从“hello world“开始

一、"hello world" #inclue <iostream>using namespace std;int main() {cout << "hello world" << endl;return 0; } 1.1 #include&#xff1a;预处理标识 1.2 <iostream>&#xff1a;输入输出流类所在头文件 1.2.1 istream&a…...

/root/.ssh/config line 2: Bad protocol 2 host key algorithms ‘+ssh-rsa‘.

文章目录 1、问题2、查看openssh版本3、解决问题4、重新生成密钥5、查看是否可连接工蜂 1、问题 ssh访问工蜂报错&#xff1a; [rootlocalhost .ssh]# ssh -T gitgit.code.tencent.com /root/.ssh/config line 2: Bad protocol 2 host key algorithms ‘ssh-rsa’. 2、查看o…...

mac m1上系统内录内部声音的方法/无需安装Blackhole

总所周知&#xff0c;m1的mac不能录制桌面音频&#xff0c;obsstudio都不行。 最快的解决方法就是下载飞书&#xff1a; 登陆后新建直播/视频会议&#xff1a; 共享的时候选择下面的两个钩上去就好了...

数字人学习目录

数字人学习目录 百度PaddlePaddleHub图像风格迁移模型pp-tinypose模型 PaddleGANPaddleLitePaddleDetectionPP-TinyPose 人体骨骼关键点识别 PaddleSpeechVisualDLPaddleBobo TransformerWav2LibCLIPFFMpeg模型库数据集学习天地PythonJupyter Notebook Unity3DUE 百度Paddle P…...

PHP 房产网站系统Dreamweaver开发mysql数据库web结构php编程计算机网页项目

一、源码特点 PHP 房产网站系统是一套完善的WEB设计系统&#xff0c;对理解php编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。 源码 https://download.csdn.net/download/qq_41221322/88233553 论文 https://download…...

0基础入门代码审计-2 Fortify初探

0x01 序言 目前又加入一位新童鞋了&#xff0c;最近将会再加入cs相关的专栏&#xff0c;都是以基础为主&#xff0c;毕竟太复杂的东西&#xff0c;能看懂的人太少。 0x02 准备工具 1、Fortify 2、需要审计的源码 0x03 Fortify的简单使用 1、 1、在开始菜单栏中找到Audit Wo…...

qiiuzhiji4

本篇是从慧与离职后到2023年8月21日这段时间的经历 2023/7/31至2023/8/21 本篇初次写于2023年8月21日 从慧与离职后基本上就是在专心找工作了&#xff0c;但是有在这段时间找工作经历的人都明白&#xff0c;IT行业不复以往了。尤其是对于我这样的普通二本学历的人来说&#xff…...

构建 NodeJS 影院微服务并使用 docker 部署【01/4】

图片来自谷歌 — 封面由我制作 一、说明 构建一个微服务的电影网站&#xff0c;需要Docker、NodeJS、MongoDB&#xff0c;这样的案例您见过吗&#xff1f;如果对此有兴趣&#xff0c;您就继续往下看吧。 在本系列中&#xff0c;我们将构建一个 NodeJS 微服务&#xff0c;并使用…...

变频器和plc之间无线MODBUS通讯

在工业现场由PLC远程控制变频器的应用非常常见&#xff0c;如果挖沟布线不便或者变频器在移动设备上&#xff0c;那么采用无线通讯就是最佳方案。 这里我们选用最常用的三菱 FX2N PLC和三菱变频器为例&#xff0c;并结合日系plc专用无线通讯终端DTD435M来说明PLC与变频器之间的…...

【云原生】3分钟快速在Kubernetes1.25部署Prometheus2.42+Grafana9.5.1+Alertmanager0.25

文章目录 1、简介2、GitHub地址3、环境信息4、安装5、访问Grafana1、简介 Prometheus-operator帮助我们快速创建Prometheus+Grafana+Alertmanager等服务,而kube-prometheus更加完整的帮助我们搭建全套监控体系,这包括部署多个 Prometheus 和 Alertmanager 实例, 指标导出器…...

Redis中常见的缓存穿透、缓存击穿、缓存雪崩、缓存预热解决方案

文章目录 一、缓存穿透1. 什么是缓存穿透2. 解决方案2.1 无效的key存放到Redis2.2 引入布隆过滤器2.3 如何选择&#xff1a; 二、缓存击穿1. 什么是缓存击穿2. 解决方案 三、缓存雪崩1. 什么是缓存雪崩2. 解决方案2.1 均匀过期2.2 热点数据缓存永远不过期2.3 采取限流降级的策略…...

第二章-自动驾驶卡车-自动驾驶卡车前装量产的要求

1、自动驾驶卡车的特点与挑战 重卡主要运行在相对封闭的高速公路&#xff0c;相较城市道路场景看似更简单。但是&#xff0c;由于重卡特有的物理特性、运行环境和商业运营要求&#xff0c;相较于乘用车的自动驾驶系统&#xff0c;重卡的自动驾驶系统对车辆的感知距离和精度、系…...

深度解析so-vits-svc声压级标准化:提升语音转换质量的实用指南

深度解析so-vits-svc声压级标准化&#xff1a;提升语音转换质量的实用指南 【免费下载链接】so-vits-svc 项目地址: https://gitcode.com/gh_mirrors/sov/so-vits-svc so-vits-svc作为当前最流行的AI语音转换工具&#xff0c;声压级标准化是确保音频质量一致性的核心技…...

OpenClaw+nanobot自动化写作:Qwen3-4B模型内容生成实测

OpenClawnanobot自动化写作&#xff1a;Qwen3-4B模型内容生成实测 1. 为什么需要自动化写作助手 作为一个技术博客作者&#xff0c;我经常面临一个困境&#xff1a;有太多想写的内容&#xff0c;但时间总是不够用。从选题、资料收集到初稿撰写、排版校对&#xff0c;每个环节…...

TAI-TECH台庆 WCM2012F2SF-900T04 SOP-4 共模滤波器

特性 1.高频下具有高共模阻抗&#xff0c;实现优异的噪声抑制性能。 2.WCM2012F2SF系列实现小型化和低外形。尺寸为2.0x1.2x1.2mm。3.无铅(Pb)且不含卤素&#xff0c;符合RoHS标准。4.工作温度-40~125C(包括自温升)...

基于CosyVoice与Docker的AI辅助开发实战:从模型部署到生产环境优化

最近在搞一个AI语音合成的项目&#xff0c;用到了CosyVoice这个不错的TTS模型。但在部署环节&#xff0c;真是踩了不少坑&#xff0c;从开发机到测试服务器&#xff0c;再到生产环境&#xff0c;各种Python版本、CUDA版本、依赖库冲突的问题层出不穷&#xff0c;让人头疼。后来…...

开源项目依赖管理:从冲突解决到高效协作的实践指南

开源项目依赖管理&#xff1a;从冲突解决到高效协作的实践指南 【免费下载链接】IPED IPED Digital Forensic Tool. It is an open source software that can be used to process and analyze digital evidence, often seized at crime scenes by law enforcement or in a corp…...

Windows/Mac双平台实测:Qt 6.9.0离线安装包+在线安装器对比评测

Qt 6.9.0跨平台安装全攻略&#xff1a;离线包与在线安装器的深度实测 当开发团队需要为Windows和macOS双平台部署Qt 6.9.0开发环境时&#xff0c;选择正确的安装方式往往能节省数小时的配置时间。本文将基于真实企业级部署场景&#xff0c;通过20组对照实验数据&#xff0c;揭示…...

佣金乱、订单乱?换推客系统立刻理顺

做分销、带推客&#xff0c;最头疼的不是没人卖&#xff0c;而是账乱、单乱、人心乱。订单对不上、佣金算不准、退款没回冲、归属说不清&#xff0c;每天都在扯皮、对账、解释&#xff0c;生意越做越心累。其实问题根本不在人&#xff0c;而在系统。佣金乱、订单乱&#xff1f;…...

5个维度打造你的专属音乐中心:开源音乐播放器MusicFree全解析

5个维度打造你的专属音乐中心&#xff1a;开源音乐播放器MusicFree全解析 【免费下载链接】MusicFree 插件化、定制化、无广告的免费音乐播放器 项目地址: https://gitcode.com/GitHub_Trending/mu/MusicFree 你是否厌倦了主流音乐平台的广告轰炸和版权限制&#xff1f;…...

如何快速上手Awesome Burp Extensions:新手必看的10个核心插件

如何快速上手Awesome Burp Extensions&#xff1a;新手必看的10个核心插件 【免费下载链接】awesome-burp-extensions A curated list of amazingly awesome Burp Extensions 项目地址: https://gitcode.com/gh_mirrors/aw/awesome-burp-extensions Burp Suite作为Web应…...

仅限内部技术团队流通的Dify异步接入SOP(含安全审计清单+可观测性埋点规范)

第一章&#xff1a;Dify 自定义节点异步处理如何实现快速接入在 Dify v1.0 版本中&#xff0c;自定义节点&#xff08;Custom Node&#xff09;支持通过 Webhook 或本地 Python 函数方式扩展业务逻辑。当节点需执行耗时操作&#xff08;如大模型微调、外部 API 调用、文件批量处…...