爬虫工具you-get
you-get是一个简单易上手的爬虫小工具,可以从网络中爬取多媒体信息,包括图片、音频和视频。you-get的github项目地址为:https://github.com/soimort/you-get
一、安装
以下为相关依赖,需要分别安装:
- Python 3 (必须)
- FFmpeg(必须)
- Libav (可选)
- RTMPDump (可选)
推荐使用PyPI镜像中的pip包管理器安装:
pip3 install you-get
二、升级
如果需要升级,可使用以下命令:
pip3 install --upgrade you-get
三、使用
1.视频画质与格式
直接输入you-get+空格+"网址"即可。
网址两端的双引号其实不必要,但是强烈推荐,这样防止某些网站的字符串中有奇奇怪怪的东西,导致you-get误判报错。
$ you-get "https://www.youtube.com/watch?v=jNQXAC9IVRw"
site: YouTube
title: Me at the zoo
stream:- itag: 43container: webmquality: mediumsize: 0.5 MiB (564215 bytes)# download-with: you-get --itag=43 [URL]Downloading zoo.webm ...
100.0% ( 0.5/0.5 MB) ├████████████████████████████████████████┤[1/1] 7 MB/sSaving Me at the zoo.en.srt ...Done.
此时下载的视频默认为最高画质,DEFAULT。如这个视频带有字幕,将被一同下载,并以SubRip格式保存。
如需下载其他画质,可以使用 --info/-i,以查看所有可用画质与格式,并使用给出的对应 --itag 代码下载:
$ you-get -i "https://www.youtube.com/watch?v=jNQXAC9IVRw"
site: YouTube
title: Me at the zoo
streams: # Available quality and codecs[ DEFAULT ] _________________________________- itag: 43container: webmquality: mediumsize: 0.5 MiB (564215 bytes)# download-with: you-get --itag=43 [URL]- itag: 18container: mp4quality: medium# download-with: you-get --itag=18 [URL]- itag: 5container: flvquality: small# download-with: you-get --itag=5 [URL]- itag: 36container: 3gpquality: small# download-with: you-get --itag=36 [URL]- itag: 17container: 3gpquality: small# download-with: you-get --itag=17 [URL]
2.下载路径
默认下载路径即you-get的安装文件夹,但是很乱且不好找。
可以使用 --output-dir/-o 设定路径, --output-filename/-O 设定输出文件名:
you-get -o D:\桌面\百度图片\视频 "https://www.bilibili.com/video/BV1p4411d7/"
四、常见Q&A
1.B站的视频下载报错
① 优先更新you-get,低版本的you-get有时不适用;
② 由于B站更新了链接点击流量统计,所以有时会报错。可以把B站的网站链接中所有BV号之后的内容全部删除,如:
B站默认的链接:
https://www.bilibili.com/video/BV1jb411W7c3/?spm_id_from=333.337.search-card.all.click&vd_source=9a70128ce0e23fdc92b35d3a812c66d5删除分享者ID跟踪后的链接:
https://www.bilibili.com/video/BV1jb411W7c3/?spm_id_from=333.337.search-card.all.click删除点击统计,仅保留原视频BV号的链接:
https://www.bilibili.com/video/BV1jb411W7c3/
③ 记得用双引号把网址字符串括起来,防止you-get误判;
④ 有时候代理导致报错,把梯子关了。
2.'vd source'不是内部或外部命令,也不是可运行的程序 或批处理文件。
这个错误可能是由于you-get的安装位置没有添加到环境变量中导致的。
① 首先查找you-get的安装位置;
pip show you-get
② 在返回的结果中找到Location,即安装位置;
Name: you-get
Version: 0.4.1650
Summary: Dumb downloader that scrapes the web
Home-page: https://you-get.org/
Author: Mort Yao
Author-email: mort.yao@gmail.com
License: MIT
Location: c:\users\hp\appdata\roaming\python\python310\site-packages
Requires:
Required-by:
③ 将该路径添加到系统的环境变量中;
etx PATH"%PATH%;c:\users\hp\appdata\roaming\python\python310\site-packages\scripts"
注意,%PATH%;和\scripts之间的路径,即为Location中给出的位置;
④ 此时再重新打开终端并运行you-get应该就不会报错了,如果还有报错,那大概率是被网址中的字符串干扰了,例如B站的链接就会有这种情况,这时用双引号把网站括起来即可。
相关文章:
爬虫工具you-get
you-get是一个简单易上手的爬虫小工具,可以从网络中爬取多媒体信息,包括图片、音频和视频。you-get的github项目地址为:https://github.com/soimort/you-get 一、安装 以下为相关依赖,需要分别安装: Python 3 (必须…...
hal_stm32_RTC函数
1设置当前时间: 调用 HAL_RTC_SetTime 来设置小时、分钟、秒和亚秒。 调用 HAL_RTC_SetDate 来设置年、月、日和星期。 HAL_StatusTypeDef HAL_RTC_SetTime(RTC_HandleTypeDef *hrtc, RTC_TimeTypeDef *sTime, uint32_t Format); HAL_StatusTypeDef HAL_RTC_SetDat…...
【大数据·Hadoop】从词频统计由浅入深介绍MapReduce分布式计算的设计思想和原理
一、引入:词频统计问题 假如我们有一亿份文档,需要统计这一亿份文档的词频。我们会怎么做,有以下思路 使用单台PC执行:能不能存的下不说,串行计算,一份一份文档读,然后进行词频统计࿰…...
win10建立共享文件夹和ipad共享文件
win10端设置 查看自己的局域网IP 在任意地方新建一个文件夹 打开文件夹的属性,点到共享的地方 点击高级共享 然后点击应用,确认 再回到之前哪个地方,点击共享 把Everyone的权限改为读取/写入 最后点击共享就欧克了 失败的可能原因 ipad端设置 然后回出现一个要输入用户名和…...
手机在网状态多方面重要性
手机在网状态的重要性体现在多个方面,它是现代社会中人们保持联系、获取信息以及进行日常活动不可或缺的一部分。以下是一些关于手机在网状态重要性的详细解释: 通信联系: 手机是在现代社会中进行通信联系的主要工具。当手机处于在网状态时&…...
Multitouch for Mac:手势自定义,提升工作效率
Multitouch for Mac作为一款触控板手势增强软件,其核心功能在于手势的自定义和与Mac系统的深度整合。通过Multitouch,用户可以轻松设置各种手势,如三指轻点、四指左右滑动等,来执行常见的任务,如打开应用、切换窗口、滚…...
IDEA创建springboot项目时不能选择java 8或者java 11等等版本的问题,解决方案
文章目录 1. Project JDK 和 Java 的区别2. 没有 java 8 或 java 11 等版本2.1 方案一2.2 方案二2.3 方案三 1. Project JDK 和 Java 的区别 我们在利用 idea 创建 spring boot 项目时,会有以上两个选项,这两个选项有什么区别? 答ÿ…...
SpringCloudAlibaba:4.3云原生网关higress的JWT 认证
概述 简介 JWT是一种用于双方之间传递安全信息的简洁的、URL安全的声明规范。 定义了一种简洁的,自包含的方法用于通信双方之间以Json对象的形式安全的传递信息,特别适用于分布式站点的单点登录(SSO)场景 session认证的缺点 1.安…...
【机器学习】Reinforcement Learning-强化学习基本概念
1、Q值与V值 1.1 Q值和V值的定义 Q值:也称为动作价值函数,评估动作的价值,它代表了智能体选择这个动作后,一直到最终状态奖励总和的期望,表示为Q(s, a),其中 s是状态,a是动作。 V值ÿ…...
vim编辑器---(1)vim编辑器介绍?
(1)vim编辑器介绍? 1 目录 (a)IC简介 (b)vim简介 (c)Verilog简介 (d)vim编辑器介绍? (e)结束 1 IC简介…...
解密 Unix 中的 “rc“ 后缀:自定义你的工作环境
在文件名中,rc 通常表示 “run commands”(运行命令)或者 “runtime configuration”(运行时配置)。这种命名惯例源自早期的 Unix 系统,用于指示这些文件包含了一系列要在程序运行时执行的命令或配置选项。…...
Java使用csv导出多字段大数据文件(无需写实体映射,自动遍历)
csv工具类CsvUtils 此处使用LinkedHashMap链表哈希表,实现键值中值为空时仍存在数据以及保证顺序与sql顺序一致。 package com.xxx.xxx.utils;import lombok.val; import org.springframework.util.CollectionUtils; import javax.servlet.http.HttpServletRespons…...
Redis 本机无法访问
问题 我在服务器上有两个 Redis 实例,服务端口号分别是 6379 和 6380,Redis 服务器地址假设为 10.0.0.12。其中 6379 这个实例不需要密码即可访问,6380 需要密码访问。 在正常使用几天后,本机突然无法访问 6379 这个实例&#x…...
【论文笔记】Training language models to follow instructions with human feedback B部分
Training language models to follow instructions with human feedback B 部分 回顾一下第一代 GPT-1 : 设计思路是 “海量无标记文本进行无监督预训练少量有标签文本有监督微调” 范式;模型架构是基于 Transformer 的叠加解码器(掩码自注意…...
stm32——OLED篇
技术笔记! 一、OLED显示屏介绍(了解) 1. OLED显示屏简介 二、OLED驱动原理(熟悉) 1. 驱动OLED驱动芯片的步骤 2. SSD1306工作时序 三、OLED驱动芯片简介(掌握) 1. 常用SSD1306指令 2. …...
重卡生产流程的可视化管理与优化
重卡车间可视化是一个将车间内部生产流程、设备状态及人员配置直观展现的技术手段,确保制造过程的每个环节都在最优状态下运行。 在重卡制造领域,从底盘组装、车身焊接、涂装到最终的总装和检验,每一个工作过程都至关重要,对于保…...
软考-软件工程
软件工程概述 软件工程指的是应用计算机科学、数学及管理科学等原理,以工程化的原则和方法来解决软件 问题的工程,目的是提高软件生产率、提高软件质量、降低软件成本。 概述: 软件开发模型:指导软件开发的体系 需求分析确定软件…...
Agent AI智能体:未来社会的角色、发展路径与挑战
目录 引言 一、Agent AI智能体的发展路径 1. 技术进步与智能化水平提升 2. 应用场景拓展与普及 二、Agent AI智能体在未来社会中的角色 1. 提高生产效率与生活品质 2. 促进社会进步与发展 三、Agent AI智能体可能带来的挑战 1. 隐私与安全问题 2. 就业与社会结构变革 …...
Vue 3.x组件生命周期
一、Vue 2 VS Vue 3 从 Vue 2 升级到 Vue 3 ,在保留对 Vue 2 的生命周期支持的同时,Vue 3 也带来了一定的调整。Vue 2 的生命周期写法名称是 Options API (选项式 API ), Vue 3 新的生命周期写法名称是 Composition API (组合式 API )。 Vue 3 组件默认支持 Options A…...
onnx模型截取部分
这个是有需求的,比如有多个输入节点,我只用其中几个,或有多个输出节点,我只用其中几个。 比如这个输入,我们可以直接把transpose去掉,用类pytorch的N,C,H,W的格式输入。 还有如下输出: tran…...
别再死记硬背了!用Python+仿真软件复现莱顿瓶实验,轻松理解电容器原理
用Python仿真软件复现莱顿瓶实验:从历史装置到现代电容教学 在工程教育中,电容原理常常是学生遇到的第一个抽象概念。传统的板书推导和公式记忆往往让学习者陷入"知其然而不知其所以然"的困境。18世纪的莱顿瓶作为人类最早的电容器,…...
AI插件深度对比 | Copilot、Tabnine、Codeium谁是王者
Copilot 的代码补全能力确实厉害,我试过在写 Python 函数的时候,只要输入注释,它就能自动生成函数体。比如写 “# 计算斐波那契数列”,它能直接给出递归和迭代两种实现方式。不过有时候生成的代码有点冗长,需要手动精简…...
K3s离线安装保姆级避坑指南:从镜像准备到集群验证(含Harbor私有仓库配置)
K3s离线安装全流程实战:从私有仓库搭建到集群高可用 在金融、军工、政务等对网络安全要求极高的领域,离线环境部署Kubernetes集群已成为刚需。作为轻量级Kubernetes发行版,K3s凭借其小于50MB的二进制体积和内置组件简化设计,成为隔…...
杰理微蓝牙芯片AC696系列入门
1.文章背景 此篇文章以ac696n_soundbox_sdk_v1.7.0版本进行入门讲解: 写这篇文章的目的是因为自己在尝试入门杰理微的时候遇到了好多的问题点,想尝试用买到的开发板来驱动一颗LED闪烁却一直没有按自己想象的逻辑成功跑出效果,在网上到处翻找手…...
数科OFD阅读历史清理全攻略:统信UOS/麒麟KYLINOS下图形界面与命令行两种方法实测
数科OFD阅读历史清理全攻略:统信UOS/麒麟KYLINOS下图形界面与命令行两种方法实测 在国产化办公环境中,数科OFD作为主流的版式文档阅读工具,其使用痕迹管理常被忽视却至关重要。无论是个人用户希望保护阅读隐私,还是企业IT管理员需…...
微信虚拟支付求支招
最近微信小程序不是要求必须接入虚拟支付吗,然后我们接入了,并走通了流程。但是!!使用其它体验极差,具体如下: 1.这块的开发流程手册,狗看了都摇头。我看着流程自己理解的意思是,我们…...
从拍照到HDR:用OpenCV玩转多曝光融合,让你的摄像头拍出大片感(C++实战)
从拍照到HDR:用OpenCV玩转多曝光融合,让你的摄像头拍出大片感(C实战) 当你在逆光环境下拍摄时,是否经常遇到这样的困境——要么天空过曝变成一片惨白,要么前景欠曝沦为剪影?传统相机的动态范围有…...
颈椎健康互助平台
颈椎健康互助平台选题背景分析随着信息技术的飞速发展和现代社会工作、生活方式的深刻变革,颈椎健康问题已从一个单纯的医学议题,演变为一个影响广泛、亟待社会协同解决的公共健康挑战。颈椎健康互助平台的选题,正是在这一宏观背景下应运而生…...
给Yahboom Dofbot机械臂写个‘身份证’:手把手教你从零创建URDF模型(附完整代码)
从零构建Yahboom Dofbot机械臂的URDF数字身份证:一份工程师视角的完整指南 当你第一次拆开Yahboom Dofbot机械臂的包装时,那些精致的金属关节和伺服电机可能会让你既兴奋又忐忑。作为ROS机器人开发的标准起点,URDF模型就像是机械臂的"数…...
Android 开发问题:TextView 内容超过宽度时,默认不会换行
在 Android 开发,TextView 内容超过宽度时,默认不会换行,如下例 <TextViewandroid:layout_width"200dp"android:layout_height"wrap_content"android:text"这是一段很长的文本,这是一段很长的文本&am…...
