Huginn服务部署
工作中需要使用爬虫系统,做为技术选型需要对Huginn系统进行部署并进行功能验证。下面的文章会记录了Huginn的部署过程,本次部署采用的Ubuntu-23.0.4系统,使用Docker部署。部署过程需要翻墙。
一、安装Docker
删除旧版本
sudo apt-get remove docker docker-engine docker.io containerd runc
使用脚本安装Docker
curl -fsSL https://test.docker.com -o test-docker.shsudo sh test-docker.sh
二、启动Docker容器
配置Docker镜像
sudo vim /etc/docker/daemon.json
注:Ubuntu默认不安装vim命令需要自己安装,也可以使用vi命令
sudo apt install vim
需要在daemon.json文件中写入下方内容
{"registry-mirrors": ["https://docker.mirrors.ustc.edu.cn"]
}
启动Docker服务
systemctl start docker
查看Docker服务状态
systemctl status docker
配置Docker服务为开机启动
systemctl enable docker
三、安装Huginn镜像并运行
拉取Huginn镜像
从仓库拉取镜像,创建并指定端口创建启动一个容器
sudo docker run -it -p 3000:3000 huginn/huginn
查看Docker中现有的镜像
sudo docker image ls
删除镜像
sudo docker image rm huginn/huginn
四、试用结果
1、开源版本可适用于单一页面数据采集,例如采集天气的温度或湿度信息,或者单一静态页面的信息。不适合复杂页面的数据采集。
2、若要实现复杂页面信息的采集,需要适用商业版(开源版本有BUG)并且需要适用一个叫做PhantomJsCloud API Service - It just works! 的云服务(这个服务是收费的)
3、这个软件的主要优势在于可以通过一系列的配置实现对复杂网页数据的获取,而不需要通过编写代码实现。
4、软件中将对一个网页数据的爬取的过程抽象为多个Agents,通过对Agents的配置完成对网页数据的爬取。例如需要从某一个网站的首页获取到所有文章,则需要先创建一个Agents来获取文章列表然后将列表数据做为事件传递到下一个Agents 中用来获取文章的详情。
相关文章:
Huginn服务部署
工作中需要使用爬虫系统,做为技术选型需要对Huginn系统进行部署并进行功能验证。下面的文章会记录了Huginn的部署过程,本次部署采用的Ubuntu-23.0.4系统,使用Docker部署。部署过程需要翻墙。 一、安装Docker 删除旧版本 sudo apt-get remo…...
深入解析Java数据包装类型:特性、机制与最佳实践
文章目录 1. 基本概念2. 自动装箱与拆箱3. 缓存机制4. 不可变性5. 常见陷阱与最佳实践a. 空指针异常b. 不要用 比较两个包装类实例c. 高精度计算d. 字符串解析 总结 1. 基本概念 Java提供了每个基本数据类型的包装类,位于java.lang包中。这些包装类允许我们将基本…...
【Java基础入门篇】二、控制语句和递归算法
Java基础入门篇 二、控制语句和递归算法 2.1 switch-case多分支选择语句 switch执行case语句块时,若没有遇到break,则运行下一个case直到遇到break,最后的default表示当没有case与之匹配时,默认执行的内容,代码示例如…...
PostgreSQL WAL日志膨胀处理
作者:Digital Observer(施嘉伟) Oracle ACE Pro: Database PostgreSQL ACE Partner 11年数据库行业经验,现主要从事数据库服务工作 拥有Oracle OCM、DB2 10.1 Fundamentals、MySQL 8.0 OCP、WebLogic 12c OCA、KCP、PCTP、PCSD、P…...
用户该怎么管理维护自己的服务器?
管理和维护自己的服务器是确保其长期稳定、高效和安全运行的重要任务。以下是一些关键的服务器管理和维护的步骤和建议,适用于Linux或Windows服务器。 1.定期备份数据 定期备份是防止数据丢失和恢复故障的关键步骤。备份策略应包括: 全量备份:…...
【MYSQL数据库相关知识介绍】
MySQL 在我们日常技术中是一个广泛使用的开源关系型数据库管理系统,所以作为测试同学,掌握mysql的相关知识是必不可少的技能之一,所以小编从软件测试的角色出发,来整理一些跟测试相关的知识,希望能够帮助到大家。 一、…...
初窥 HTTP 缓存
引言 对于前端来说, 你肯定听说过 HTTP 缓存。 当然不管你知不知道它, 对于提高网站性能和用户体验, 它都扮演着重要的角色! 它通过在客户端和服务器之间存储和重用先前获取的资源副本, 来减少网络流量和降低资源加载时间, 从而提升用户体验! 以下是 HTTP 缓存的重要性: 减少…...
yolov8的深度学习环境安装(cuda12.4、ubuntu22.04)
目录 一、先安装基础环境包 1.首先给Ubuntu安装Chrome浏览器(搜索引擎换成百度即可) 2、ubuntu 22.04中文输入法安装 3、安装 terminator 4、安装WPS for Linux 5、安装其它之前需要先安装anaconda 6、安装配置anaconda 7、安装完成anaconda后创建…...
RSA算法和AES算法,哪种更安全
目录 一、RSA (非对称加密算法) 二、AES (对称加密算法) 三、对比总结 四、更安全的选择 五、结合使用:RSA AES RSA 和 AES 是两种不同类型的加密算法,适用于不同的场景,因此它们的安全性不能直接比较,而是取决于具体的应用…...
Vue教程|搭建vue项目|Vue-CLI新版脚手架
一、安装Node环境 安装Node及Npm环境 Node下载地址:Node.js — Run JavaScript EverywhereNode.js is a JavaScript runtime built on Chromes V8 JavaScript engine.https://nodejs.org/en/ 安装完成后,检查安装是否成功,并检查版本,命令如下: node -v npm -v mac@Macd…...
kdump调试分析(适用于麒麟,ubuntu等OS)
1. kdump基本原理 1.1 内核崩溃处理机制 当 Linux 系统内核发生崩溃时,通常会触发 panic,系统停止正常运行。Kdump 在这种情况下: 使用一个备用的内核(称为 crash kernel)来启动最小化的环境。从崩溃的主内核中复制内存内容(转储文件)。将转储文件保存到预定义的存储位…...
houdini肌肉刷pin点的方法
目标:产生gluetoanimation这个属性 主要节点:attribute paint(或者muscle paint) 步骤1: 导入肌肉资产 导入的是rest shape的肌肉 在有侧边栏可以打开display group and attribute list,方便查看group。不同的肌肉块按照muscl…...
JMeter 并发策略-针对准点秒杀场景的压测实现
一、场景的压测实现 1,创建线程组,10并发用户执行5次; 2,创建 Synchronizing Timer 元件,用于同步线程,设置同步元件 Synchronizing Timer 3,创建 http 请求4,创建 view results in table 元件…...
龙迅#LT6912适用于HDMI2.0转HDMI+LVDS/MIPI,分辨率高达4K60HZ,支持音频和HDCP2.2
1. 描述 LT6912是一款高性能的HDMI2.0转HDMI和LVDS和MIPI转换器。 HDMI2.0 输入和输出均支持高达 6Gbps 的数据速率,为4k60Hz视频提供足够的带宽。此外,还支持 HDCP2.2 进行数据解密(无数据 加密)。 对于 LVDS 输出,…...
RBF神经网络预测结合NSGAII多目标优化
目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 RBF神经网络预测结合NSGAII多目标优化 rbf神经网络预测结合nsga2多目标优化 题外话: 多目标优化是指在优化问题中同时考虑多个目标函数的优化过程。在多目标优化中,通常存在多个冲突的目标&am…...
如何看linux系统内核是aarch64 ,还是64-bit
要查看 Linux 系统内核是 aarch64 架构还是 64-bit 架构,可以通过以下几种方法来确认: 方法 1:使用 uname 命令 uname 命令用于显示系统信息。使用以下命令查看系统的架构: uname -m如果输出是 aarch64,说明你的系统…...
如何通过 ADB 安装 xapk
Android开发这么久,今天发现还能这么操作!😂 记录通过ADB安装xapk、apks的两种方式: 1.ADB命令安装使用APK-Splits技术分包的应用程序 这位大佬的方式步骤较为繁琐,不过兼容性应该较好,亲测成功安装。 2.How to install xapk, apks, or multiple-apks via adb? 这个…...
QT:多ui界面显示
文章目录 1.多ui界面添加2.跳转函数3.返回函数4.Qt5源码工程5.模态显示 1.多ui界面添加 最终生成这个目录 2.跳转函数 void MainWindow::on_pushButton_clicked() {//this->setWindowModality(Qt::WindowModal);test1 *t1 new test1();t1->setParentData(this);this-…...
redis cluster 3主3从部署方案
文章目录 1 Redis Cluster 介绍1 Redis cluster 架构2 Redis cluster的工作原理2.1 数据分区2.2 集群通信2.3 集群伸缩2.3.1 集群扩容2.3.2 集群缩容 2.4 故障转移2.4.1 主观下线2.4.2 客观下线 3 Redis Cluster 部署架构说明3.1 部署方式介绍3.2 实战案例:基于Redi…...
前端学习笔记之文件下载(1.0)
因为要用到这样一个场景,需要下载系统的使用教程,所以在前端项目中就提供了一个能够下载系统教程的一个按钮,供使用者进行下载。 所以就试着写一下这个功能,以一个demo的形式进行演示,在学习的过程中也发现了中文路径…...
15 年后谷歌用 Gemini 重做电脑,Googlebook 能助其重入 PC 牌桌吗?
15 年后谷歌用 Gemini 重做电脑,Googlebook 能否助其重入 PC 牌桌?15 年前,谷歌推出 Chromebook,那时强调轻量、云端、浏览器优先,一个 Chrome 浏览器加一个 Google 账号就能成为新的电脑入口。15 年后的 AI 时代&…...
分形AI:用自相似递归构建动态神经网络,实现多尺度高效学习
1. 项目概述:从分形到AI的桥梁最近在探索一些前沿的AI模型架构时,一个名为“fractalic-ai/fractalic”的项目引起了我的注意。这个项目名本身就很有意思,它把“分形”(Fractal)和“人工智能”(AI࿰…...
NotebookLM知识库搭建全链路解析:从零配置到AI智能问答,90%企业忽略的4个关键配置点
更多请点击: https://intelliparadigm.com 第一章:NotebookLM知识库搭建全链路概览 NotebookLM 是 Google 推出的基于用户自有文档构建可交互式 AI 助手的实验性工具,其核心能力依赖于高质量、结构清晰的知识库。搭建一个可用的知识库并非简…...
74.人工智能实战:LLM 工具参数校验怎么做?从 Agent 乱填参数到 JSON Schema、业务校验与执行前拦截
人工智能实战:LLM 工具参数校验怎么做?从 Agent 乱填参数到 JSON Schema、业务校验与执行前拦截 一、问题场景:Agent 选对了工具,却填错了参数 很多 Agent 系统出问题,并不是模型完全选错工具,而是: 工具选对了,参数填错了。例如用户问: 帮我查一下订单 O202605130…...
OpenClaw交易助手:从事件驱动架构到实盘部署的量化系统实践
1. 项目概述:一个为交易者打造的智能助手如果你在GitHub上搜索过量化交易或者自动化交易工具,大概率会看到过各种以“trading-bot”、“quant-strategy”命名的项目。但当我第一次看到openclaw-trade/openclaw-trading-assistant这个仓库时,直…...
国产FPGA在数控系统中的应用:设计、实现与优化全解析
1. 项目概述:当数控系统遇上国产FPGA在工业自动化领域,数控系统(Numerical Control System)是机床、机器人等装备的“大脑”,其性能直接决定了加工精度、效率和可靠性。长久以来,这个核心大脑的设计&#x…...
开放标准如何重塑多媒体设备开发:从碎片化到模块化
1. 项目概述:为什么我们需要一个“开放标准”?如果你在消费电子、汽车座舱或者智能家居领域待过几年,一定会对“多媒体设备”这个词又爱又恨。爱的是,它代表了用户体验的核心——那块屏幕、那套音响、那个能看视频能听歌的交互界面…...
GSM8K测试TOP 0.3%解题路径曝光:DeepSeek如何用符号感知+分步验证拿下最难15题(附可复现prompt库)
更多请点击: https://intelliparadigm.com 第一章:GSM8K基准测试与DeepSeek破局意义 GSM8K(Grade School Math 8K)是一个由8,500道人工编写的多步数学应用题构成的高质量推理基准,题目覆盖算术、比例、时间计算等小学…...
YOLOv8-face人脸检测模型架构解析与部署优化实践
YOLOv8-face人脸检测模型架构解析与部署优化实践 【免费下载链接】yolov8-face yolov8 face detection with landmark 项目地址: https://gitcode.com/gh_mirrors/yo/yolov8-face YOLOv8-face是基于YOLOv8架构专门优化的人脸检测模型,在WIDER FACE数据集上表…...
ESP32-S3开发实战:从点灯到Wi-Fi联网的完整指南
1. 项目概述:从点灯到联网的ESP32-S3实战之旅拿到一块新的开发板,第一件事是什么?我的习惯永远是先让它“眨眨眼”。这个看似简单的LED闪烁,在嵌入式开发里,就像程序员的“Hello World”,是检验硬件、软件环…...
