当前位置: 首页 > news >正文

使用 Typhoeus 和 Ruby 编写的爬虫程序

以下是一个使用 Typhoeus 和 Ruby 编写的爬虫程序,用于爬取 ,同时使用了 jshk.com.cn/get_proxy 这段代码获取代理:

#!/usr/bin/env rubyrequire 'typhoeus'
require 'json'def get_proxyurl = "https://www.duoip.cn/get_proxy"response = Typhoeus.get(url)if response.code == 200proxy_json = JSON.parse(response.body)proxy_ip = proxy_json['data']['ip']proxy_port = proxy_json['data']['port']return proxy_ip, proxy_portend
rescue Typhoeus::Error => eputs "Error: #{e.message}"exit(1)
enddef crawl_ebay(proxy_ip, proxy_port)url = "https://www.ebay.com"headers = {'User-Agent' => 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36','Accept' => 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8','Accept-Language' => 'zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.4','Accept-Encoding' => 'gzip, deflate, br','Referer' => 'https://www.google.com','Connection' => 'keep-alive'}# 使用 Typhoeus 的 Hydra 对象进行并发请求hydra = Typhoeus::Hydra.new# 创建一个使用代理的请求request = Typhoeus::Request.new(url, headers: headers, proxy: { ip: proxy_ip, port: proxy_port })# 使用 Hydra 对象发送请求response = hydra.queue(request)# 如果请求成功,输出响应体if response.code == 200puts "Request successful. Response body: #{response.body}"# 如果请求失败,输出错误信息elseputs "Request failed. Error: #{response.code}"end# 关闭 Hydra 对象hydra.close
end# 获取代理
proxy_ip, proxy_port = get_proxy# 使用获取到的代理进行爬取
crawl_ebay(proxy_ip, proxy_port)

这个程序首先获取一个代理IP和端口,然后使用这个代理进行 ebay.com 的爬取。请注意,这个示例代码可能会随着网站的变化而失效,您可能需要根据实际情况进行调整。同时,请注意,在使用这个程序之前,请确保已经安装了 Typhoeus 库。在这里插入图片描述

相关文章:

使用 Typhoeus 和 Ruby 编写的爬虫程序

以下是一个使用 Typhoeus 和 Ruby 编写的爬虫程序,用于爬取 ,同时使用了 jshk.com.cn/get_proxy 这段代码获取代理: #!/usr/bin/env rubyrequire typhoeus require jsondef get_proxyurl "https://www.duoip.cn/get_proxy"respon…...

Git 安装和基础命令、IDEA 基础操作

目录 总结命令:1、安装:1、安装2、配置环境变量: 2、Git操作:1、初始化:1、姓名邮箱:2、初始化仓库:3、工作区和暂存区分析 2、提交文件3、查看版本库状态4、安装小乌龟git不显示图标 5、查看提…...

做一个最新版的淘宝客返利程序源码有多难?

我们都知道淘宝客返利程序成为了很多人的创业和赚钱的工具。这种程序允许通过推广淘宝商品来获得佣金。然而,你知道构建这样一个淘宝客返利程序有多难吗?今天我们就从最基本的API说起,现在我将介绍构建一个最新版淘宝客返利程序所需的关键API…...

day5:Node.js 第三方库

day5:Node.js 第三方库 文章目录 day5:Node.js 第三方库使用 Express.js 构建 Web 应用安装 Express第一个 Express 框架实例第二个 Express 框架实例Node.js 连接 MySQL查询数据插入数据更新数据删除数据使用 Express.js 构建 Web 应用 Express框架是Node.js生态系统中的一…...

如何正确停止线程?为什么 volatile 标记位的停止方法是错误的?

Java全能学习面试指南:https://javaxiaobear.cn 今天我们主要学习如何正确停止一个线程?以及为什么用 volatile 标记位的停止方法是错误的? 首先,我们来复习如何启动一个线程,想要启动线程需要调用 Thread 类的 start…...

pytorch nn.Embedding 读取gensim训练好的词/字向量(有例子)

最近在跑深度学习模型,发现Embedding随机性太强导致模型结果有出入,因此考虑固定初始随机向量,既提前训练好词/字向量,不多说上代码!! 1、利用gensim训练字向量(词向量自行修改) #…...

2.1.1BFS中的Flood Fill和最短路模型

1.池塘计数 农夫约翰有一片 N ∗ M N∗M N∗M 的矩形土地。 最近,由于降雨的原因,部分土地被水淹没了。 现在用一个字符矩阵来表示他的土地。 每个单元格内,如果包含雨水,则用”W”表示,如果不含雨水,…...

Mysql 新增更新、删除新增、忽略

当主键或唯一键冲突时,Mysql可以进行更新、删除新增、忽略插入等操作。 1.更新 当主键或唯一键冲突时,可以指定更新内容。 INSERT INTO table_name (column_name, column_name, column_name) VALUES (column_value, column_value,column_value) ON DUPL…...

Node-模块系统的用法

题记 node.js模块系统的用法,以下是具体操作过程和代码 为了让Node.js的文件可以相互调用,Node.js提供了一个简单的模块系统。 模块是Node.js 应用程序的基本组成部分,文件和模块是一一对应的。 一个 Node.js 文件就是一个模块,这…...

XSS攻击(1), 测试XSS漏洞, 获取cookie

XSS漏洞, 测试XSS漏洞, 获取cookie 一, 概念: XSS(Cross-Site Scripting), 跨站攻击脚本, XSS漏洞发生在前端, 依赖于浏览器的解析引擎, 让前端执行攻击代码. XSS其实也算注入类的攻击, XSS代码注入需要有JavaScript编程基础. 二, 目的: XSS(跨站脚本&#xff0…...

linux任务优先级

这篇笔记记录了linux任务(指线程而非进程)优先级相关的概念,以及用户态可以用来操作这些优先级的系统调用。 基本概念 调度策略 linux内核中的调度器为任务定义了调度策略,也叫调度类,每个任务同一时刻都有唯一的调…...

JVM内存模型概述

这里主要分为五大块,分别是:本地方法栈、方法区、java堆、程序计数器和java栈。其中重点是方法区、java堆和java栈。 下面就把各个区域的性质总结一下:(说明,下面的只是结论,没有详细的对各个内存块进行详细…...

【JavaEE】CAS -- 多线程篇(7)

CAS 1. 什么是 CAS2. CAS 伪代码3. CAS 是怎么实现的4. CAS的应用4.1 实现原子类4.2 实现自旋锁 5. CAS 的 ABA 问题 1. 什么是 CAS CAS: 全称Compare and swap,字面意思:”比较并交换“能够比较和交换 某个寄存器中的值和内存中的值, 看是否相等, 如果相等, 则把另…...

18-spring 事务

文章目录 1. xml和注解配置方式的对象2.spring事务传播特性3. 注解事务的初始化流程4. 创建事务信息流程图5. 事务回滚流程图 1. xml和注解配置方式的对象 2.spring事务传播特性 事务传播行为类型说明PROPAGATION_REQUIRED如果当前没有事务,就新建一个事务&#xf…...

Qt窗体设计的布局

本文介绍Qt窗体的布局。 Qt窗体的布局分为手动布局和自动布局,手动布局即靠手工排布各控件的位置。而自动布局则是根据选择的布局类型自动按此类型排布各控件的位置,使用起来比较方便,本文主要介绍Qt的自动布局。 1.垂直布局 垂直布局就是…...

分布式锁 - 理论篇

一、为什么需要分布式锁 二、分布式锁实现 1.分布式锁演进 - 基本原理 我们可以同时去一个地方“占坑”,如果占到,就执行逻辑。否则就必须等待,直到释放锁。“占坑”可以去redis,可以去数据库,可以去任何大家都能访…...

复杂的菱形继承及菱形虚拟继承(详解)

复杂的菱形继承及菱形虚拟继承 复杂的菱形继承及菱形虚拟继承虚拟继承解决数据冗余和二义性的原理笔试面试题 复杂的菱形继承及菱形虚拟继承 单继承:一个子类只有一个直接父类时称这个继承关系为单继承 多继承:一个子类有两个或以上直接父类时称这个继…...

【快捷测试模型是否可以跑通】设置一张图片的张量形式,送入自己写的模型进行测试

文章目录 1. 1. import torch.nn as nn import torch from einops import rearrange, repeat from einops.layers.torch import Rearrange import torch.nn.functional as Fclass PreNorm(nn.Module):def __init__(self, dim, fn):super().__init__()self.norm nn.LayerNorm(…...

软考系列(系统架构师)- 2019年系统架构师软考案例分析考点

试题一 软件架构(架构风格、质量属性) 【问题1】(13分) 针对用户级别与折扣规则管理功能的架构设计问题,李工建议采用面向对象的架构风格,而王工则建议采用基于规则的架构风格。请指出该系统更适合采用哪种…...

安防视频监控系统EasyCVR视频汇聚存储平台定制化开发:新增kafka配置

安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快,可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等,以及支持厂家私有协议与SDK接入,包括海康Ehome、海大宇等设备的SDK等。平台可拓展性强、…...

终极指南:如何用DeepMosaics一键搞定马赛克处理

终极指南:如何用DeepMosaics一键搞定马赛克处理 【免费下载链接】DeepMosaics Automatically remove the mosaics in images and videos, or add mosaics to them. 项目地址: https://gitcode.com/gh_mirrors/de/DeepMosaics 你是否曾经需要为图片或视频添加…...

DDrawCompat:三步搞定经典DirectX游戏兼容性问题的终极方案

DDrawCompat:三步搞定经典DirectX游戏兼容性问题的终极方案 【免费下载链接】DDrawCompat DirectDraw and Direct3D 1-7 compatibility, performance and visual enhancements for Windows Vista, 7, 8, 10 and 11 项目地址: https://gitcode.com/gh_mirrors/dd/D…...

C# Winform Chart控件实战:如何将数据库数据动态绑定到饼状图?(以SQL Server为例)

C# Winform Chart控件实战:SQL Server数据动态绑定饼状图全解析 在企业级应用开发中,数据可视化是决策支持系统的核心组件。本文将深入探讨如何将SQL Server数据库中的实时业务数据动态绑定到Winform的Chart控件,构建专业级的饼状图分析界面…...

别再只用JTAG下载程序了!手把手教你用边界扫描给BGA芯片做‘体检’

硬件工程师的BGA检测秘籍:边界扫描实战指南 当一块搭载BGA封装芯片的电路板从产线下来,如何快速判断数百个焊点是否存在虚焊、短路?传统方法可能需要X光检测或破坏性测试,而边界扫描技术提供了一种非侵入式、高效率的解决方案。本…...

Go语言怎么做API限流_Go语言令牌桶限流教程【实战】

Go 推荐用 golang.org/x/time/rate.Limiter 实现令牌桶限流,因其轻量、线程安全、支持突发控制;需复用实例、合理设置 rate 和 burst(如 rate.Every(100ms), burst20),并在路由前统一拦截,避免误用 Allow()…...

Focus编辑器多文件编辑技巧:掌握工作区管理的5个核心方法

Focus编辑器多文件编辑技巧:掌握工作区管理的5个核心方法 【免费下载链接】focus A simple and fast text editor 项目地址: https://gitcode.com/gh_mirrors/fo/focus Focus是一款轻量级且高效的文本编辑器,专为提升多文件编辑效率而设计。本文将…...

Android Compose 应用中实现全局Dialog管理器的设计与实践

文章目录 前言一、传统 Dialog 实现的问题二、全局状态管理的实现1.CompositionLocal 介绍2.全局状态管理应用①. 定义 CompositionLocal②. 抽象基类设计③. 具体 Dialog 参数类型实现④. 全局 Dialog 组件 3.实现 DialogManager设计优势 4.实际应用①. 提供全局状态②. 使用③…...

WinUtil:Windows系统优化与软件管理的终极解决方案

WinUtil:Windows系统优化与软件管理的终极解决方案 【免费下载链接】winutil Chris Titus Techs Windows Utility - Install Programs, Tweaks, Fixes, and Updates 项目地址: https://gitcode.com/GitHub_Trending/wi/winutil 你是否曾经为Windows系统的繁琐…...

3分钟快速汉化Figma!FigmaCN中文插件完整使用指南

3分钟快速汉化Figma!FigmaCN中文插件完整使用指南 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma的英文界面而烦恼吗?作为一名中文设计师&#xff0…...

别再只盯着时序了!深入LPDDR4的ZQ校准,聊聊手机内存稳定性的幕后功臣

别再只盯着时序了!深入LPDDR4的ZQ校准,聊聊手机内存稳定性的幕后功臣 当你在《原神》里释放大招时突然闪退,或是冬季户外拍摄4K视频遭遇卡顿,是否想过这些问题的根源可能藏在内存芯片里一组不起眼的电阻网络中?在LPDDR…...