引流技术-通过文件中增加联系方式并传播
文章目录
- 前言
- 文档增加联系方式
- 扩散
- 网盘扩散
- 自建网站
- 借力
- 注意
前言
很多人在找资料的时候可能都遇到过下图情况:
1、文档最后面留一个自己的联系方式;
2、找的一堆文件中都有相同的情况;
3、一段时间全网搜到的很多相同文件也有这个联系方式。
那么这个怎么做的?今天我们来亲自试验一下。

文档增加联系方式
我们看到的文档可能有PDF、word,首先我们来看看word当怎么处理,word一般会有两种后缀名:doc、docx,docx比较好处理,是基于XML的,而doc格式的文档是一个较老的、二进制格式的文件。所以我们需要把doc转换成docx文档后再批量添加图片。
还有一个问题就是我电脑是MAC,一般我们会用到win32com来处理doc文档转换,但是mac不支持,所以我们要用到另外一个工具LibreOffice
需要下载安装后配置环境变量。
下载官网:https://www.libreoffice.org/
安装后正常配置环境变量哦
下面我们来看看具体代码:
import os
import subprocess
from docx import Document
from docx.shared import Inches
from docx.enum.text import WD_ALIGN_PARAGRAPHdef convert_doc_to_docx(doc_path):"""使用LibreOffice将DOC文件转换为DOCX文件"""docx_path = doc_path + 'x'subprocess.run(["/Applications/LibreOffice.app/Contents/MacOS/soffice", "--headless", "--convert-to", "docx", doc_path, "--outdir", os.path.dirname(doc_path)])return docx_pathdef add_image_to_docx(docx_path, image_path):"""在DOCX文档末尾添加居中的图片"""doc = Document(docx_path)p = doc.add_paragraph()run = p.add_run()run.add_picture(image_path, width=Inches(2.0)) # 图片大小可以根据需要调整paragraph_format = p.paragraph_formatparagraph_format.alignment = WD_ALIGN_PARAGRAPH.CENTERdoc.save(docx_path)def convert_docx_to_pdf(docx_path):"""使用LibreOffice将DOCX文件转换为PDF"""subprocess.run(["/Applications/LibreOffice.app/Contents/MacOS/soffice", "--headless", "--convert-to", "pdf", docx_path, "--outdir", os.path.dirname(docx_path)])def process_folder(folder_path, image_path):"""处理文件夹中的所有DOC和DOCX文件"""for filename in os.listdir(folder_path):file_path = os.path.join(folder_path, filename)if filename.endswith('.doc'):docx_path = convert_doc_to_docx(file_path)add_image_to_docx(docx_path, image_path)convert_docx_to_pdf(docx_path)os.remove(docx_path) # 删除转换后的DOCX文件print(f"Processed {filename}")elif filename.endswith('.docx'):add_image_to_docx(file_path, image_path)convert_docx_to_pdf(file_path)print(f"Processed {filename}")# 调用函数
folder_path = 'path/to/your/documents' # 替换为你的文档所在的目录
image_path = 'path/to/your/image.jpg' # 替换为你要添加的图片的路径
process_folder(folder_path, image_path)
接下来我们看一下PDF怎么处理,PDF比较特殊的就是加密的文件了,这种文件没办法直接写,需要创建新文件把内容copy进去后在最后面增加图片。
具体代码如下:
import os
import fitz # PyMuPDFdef add_image_to_pdf_centered(pdf_path, image_path):"""在PDF文档的最后添加一个新页面,并在其中居中插入一张图片"""# 打开原始PDFpdf_doc = fitz.open(pdf_path)# 获取PDF的尺寸以适配新页面if pdf_doc.page_count > 0:page = pdf_doc[0]page_width, page_height = page.rect.width, page.rect.heightelse:# 如果PDF为空,使用默认的A4尺寸page_width, page_height = fitz.paper_rect('a4').size# 添加新页面pdf_doc.new_page(width=page_width, height=page_height)# 计算图片的位置以使其居中img = fitz.open(image_path)img_width, img_height = img[0].rect.width, img[0].rect.heightscale = min(page_width / img_width, page_height / img_height)new_width, new_height = img_width * scale, img_height * scalex1 = (page_width - new_width) / 2y1 = (page_height - new_height) / 2rect = fitz.Rect(x1, y1, x1 + new_width, y1 + new_height)# 在新页面上插入居中的图像last_page = pdf_doc[-1]last_page.insert_image(rect, filename=image_path)# 保存修改后的PDF,重写整个文件new_pdf_path = pdf_path.replace('.pdf', '_new.pdf') # 创建新文件以避免覆盖原文件pdf_doc.save(new_pdf_path)pdf_doc.close()# 调用函数
folder_path = 'path/to/your/documents' # 替换为你的文档所在的目录
image_path = 'path/to/your/image.jpg' # 替换为你要添加的图片的路径for filename in os.listdir(folder_path):if filename.endswith('.pdf'):pdf_path = os.path.join(folder_path, filename)add_image_to_pdf_centered(pdf_path, image_path)print(f"Image added to {filename}")
当然我们也可以把两个脚本合并,直接一把梭。
import os
import fitz # PyMuPDF
import subprocess
from docx import Document
from docx.shared import Inches
from docx.enum.text import WD_ALIGN_PARAGRAPH# 处理PDF的函数
def add_image_to_pdf_centered(pdf_path, image_path):pdf_doc = fitz.open(pdf_path)if pdf_doc.page_count > 0:page = pdf_doc[0]page_width, page_height = page.rect.width, page.rect.heightelse:# 使用默认的A4尺寸page_width, page_height = fitz.paper_rect('a4').sizepdf_doc.new_page(width=page_width, height=page_height)img = fitz.open(image_path)img_width, img_height = img[0].rect.width, img[0].rect.heightscale = min(page_width / img_width, page_height / img_height)new_width, new_height = img_width * scale, img_height * scalex1 = (page_width - new_width) / 2y1 = (page_height - new_height) / 2last_page = pdf_doc[-1]last_page.insert_image(fitz.Rect(x1, y1, x1 + new_width, y1 + new_height), filename=image_path)new_pdf_path = pdf_path.replace('.pdf', '_new.pdf')pdf_doc.save(new_pdf_path)pdf_doc.close()# 处理Word的函数
def convert_doc_to_docx(doc_path):docx_path = doc_path + 'x'subprocess.run(["/Applications/LibreOffice.app/Contents/MacOS/soffice", "--headless", "--convert-to", "docx", doc_path, "--outdir", os.path.dirname(doc_path)])return docx_pathdef add_image_to_docx(docx_path, image_path):doc = Document(docx_path)p = doc.add_paragraph()run = p.add_run()run.add_picture(image_path, width=Inches(2.0))paragraph_format = p.paragraph_formatparagraph_format.alignment = WD_ALIGN_PARAGRAPH.CENTERdoc.save(docx_path)def convert_docx_to_pdf(docx_path):subprocess.run(["/Applications/LibreOffice.app/Contents/MacOS/soffice", "--headless", "--convert-to", "pdf", docx_path, "--outdir", os.path.dirname(docx_path)])# 综合处理函数
def process_files(folder_path, image_path):for filename in os.listdir(folder_path):file_path = os.path.join(folder_path, filename)if filename.endswith('.pdf'):add_image_to_pdf_centered(file_path, image_path)print(f"Image added to {filename}")elif filename.endswith('.doc'):docx_path = convert_doc_to_docx(file_path)add_image_to_docx(docx_path, image_path)convert_docx_to_pdf(docx_path)os.remove(docx_path) # 删除转换后的DOCX文件print(f"Processed {filename}")elif filename.endswith('.docx'):add_image_to_docx(file_path, image_path)convert_docx_to_pdf(file_path)print(f"Processed {filename}")# 设置文件夹和图片路径
folder_path = 'path/to/your/documents' # 替换为你的文档所在的目录
image_path = 'path/to/your/image.jpg' # 替换为你要添加的图片的路径# 调用处理函数
process_files(folder_path, image_path)
至此,我们就可以把我们的文档全部添加自己的联系方式。

扩散
有了文档,我们就可以进行扩散了,介绍几个我了解的方式:
网盘扩散
通过网盘,把自己文件放在网盘中,然后再通过文章等传播即可。
这种可能很多人要看电影的时候也会遇到,你搜到的电影文档内没有内容,只有一个联系方式,让你加联系方式进群后再把相关的视频发你,达到引流作用。
自建网站
可以自己建一个网站,把所有文档放在服务器,然后让大家去下载。
当然很多人说这样子的话我直接在网站首页留联系方式不是更直接,这个有其他可能,就是有些人在你网站下载了文件,给了他的朋友看,这是不是间接传播了。
借力
我们可以找一些类似于百度文库、还有其他的学习论坛有收集文档的情况,我们把自己的文档上传,借助这些平台的流量,扩大文档被检索的可能。
注意
很多文档可能有版权,这个要注意。
很多平台会检测文档中是否有联系方式等违规的内容。
相关文章:
引流技术-通过文件中增加联系方式并传播
文章目录 前言文档增加联系方式扩散网盘扩散自建网站借力 注意 前言 很多人在找资料的时候可能都遇到过下图情况: 1、文档最后面留一个自己的联系方式; 2、找的一堆文件中都有相同的情况; 3、一段时间全网搜到的很多相同文件也有这个联系方式…...
分布式搜索引擎_学习笔记_2
分布式搜索引擎_学习笔记_2 在昨天的学习中,我们已经导入了大量数据到elasticsearch中,实现了elasticsearch的数据存储功能。但elasticsearch最擅长的还是搜索和数据分析。 所以今天,我们研究下elasticsearch的数据搜索功能。我们会分别使用…...
【学习笔记】树上差分总结(点差分/边差分)
一.树上差分的基本概念 1.树上差分的定义 树上差分,顾名思义,意思就是在树上做差分。 至于什么是差分呢?如果不会的同学,可以先看看我的这篇博客:一维,二维差分の详解(简单易懂)_一维差分-CSDN博客 2.树…...
Vue.js设计与实现(霍春阳)
Vue.js设计与实现 (霍春阳) 电子版获取链接:Vue.js设计与实现(霍春阳) 编辑推荐 适读人群 :1.对Vue.js 2/3具有上手经验,且希望进一步理解Vue.js框架设计原理的开发人员; 2.没有使用过Vue.js,但对Vue.js框架设计感兴趣…...
go消息队列RabbitMQ - 订阅模式-fanout
1、发布订阅 订阅模式,消息被路由投递给多个队列,一个消息被多个消费者获取。 1) 可以有多个消费者 2) 每个消费者有自己的queue(队列) 3) 每个队列都要绑定到Exchange(交换机&…...
科普类——5G远程实时操控技术在国内港口应用简介(十三)
在中国,5G远程实时操控技术已经在多个港口得到应用,并且应用规模不断扩大,展现出良好的发展前景。以下是一些具体的应用案例: 上港集团洋山港:上港集团与华为合作,在全球港口首次将F5G技术应用于超远程控制…...
整理:汉诺塔简析
大体上,要解决一个汉诺塔问题,就需要解决两个更简单的汉诺塔问题 以盘子数量 3 的汉诺塔问题为例 要将 3 个盘子从 A 移动到 C,就要: 将两个盘子从 A 移动到 B(子问题 1) 为了解决子问题 1,就…...
Android 8.1 设置--声音中增加通话音量
Android 8.1 设置--声音中增加通话音量 近来收到项目需求,想要在设置--声音中增加一项通话音量调节,具体修改参照如下: /vendor/mediatek/proprietary/packages/apps/MtkSettings/res/values/strings.xml <!-- Sound: Title for the opt…...
C#中使用OpenCvSharp4绘制直线、矩形、圆、文本
C#中使用OpenCvSharp4绘制直线、矩形、圆、文本 继之前的Python中使用Opencv-python库绘制直线、矩形、圆、文本和VC中使用OpenCV绘制直线、矩形、圆和文字,将之前的Python和C示例代码翻译成C#语言,很简单,还是借用OpenCvSharp4库中的Line、…...
Qt程序设计-自定义控件(提升法)
本文讲解如何使用提升法自定义控件,控件有界面。 实现自定义一个开关控件,控件上显示当前的状态。实现过程如下: 1、在创建的项目上,添加qt设计界面类。 2、选择widget 3、更改名称为MySwitchButton 4、添加两个图标资源文件,用来显示开关状态 5、添加两个label,一个…...
计算机网络基础知识笔记
1 HOST和PORT Claude-2-100k: 我来用简单的语言解释一下HOST和PORT这两个网络术语: HOST就是设备的IP地址,比如"127.0.0.1"就是我们本机的IP地址; PORT就是端口号,可以把它简单理解为设备上的门牌号。 举个类比,我们要给某个人发信件,需要知道…...
【iOS ARKit】2D肢体动作捕捉
人体肢体动作捕捉在动漫影视制作、游戏CG 动画、实时模型驱动中有着广泛的应用,利用 ARKit,无须额外的硬件设备即可实现 2D和3D人体一系列关节和骨骼的动态捕捉,由于移动AR 的便携性及低成本,必将促进相关产业的发展。 ARBody Tr…...
MAC word删除空白页
问题:MAC word删除空白页 解决: option删除键...
字面跳动前端面试题:React Hook为什么不能放在if/循环/嵌套函数里面?
答:首先,React Hooks 是为了简化组件逻辑和提高代码可读性而设计的。将 Hook 放在 if/循环/嵌套函数中会破坏它们的封装性和可预测性,使得代码更难维护和理解。同时,这样做也增加了代码的复杂度,可能会导致性能下降和潜…...
【SpringBoot】SpringBoot的web开发
📝个人主页:五敷有你 🔥系列专栏:SpringBoot ⛺️稳重求进,晒太阳 Wbe开发 使用Springboot 1)、创建SpringBoot应用,选中我们需要的模块; 2)、SpringBoot已经默…...
houdini 入门指南-参考自用,内有翻译错误
HOUDINI 18.5列1 GETTING STARTED 入门指南 What’s new in Houdini 18.5 胡迪尼18.5有什么新内容 New features and changes in Houdini 18.5.胡迪尼18.5的新功能和变化。Basics基础The basics of working with Houdini’s user interface.使用胡迪尼用户界面的基本知识。Shel…...
【笔记】SPN和PLMN 运营商网络名称显示
一、业务术语 缩写 全称 释义 CDNR Carrier Display Name Ressource 运营商显示名称资源 PLMN Public Land Mobile Network 公共陆地移动网络。 表示最终显示的网络运营商名字 SPN Service Provider Name SIM卡EF文件6F46。表示服务提供商名字,主要是SIM卡服务 OPL Operator …...
Selenium处理Alert弹窗
页面弹窗有 3 种类型: alert(警告信息) confirm(确认信息) prompt(提示输入) 对于页面出现的 alert 弹窗,Selenium 提供如下方法: 序号 方法/属性 描述 1 ac…...
FCIS 2023:洞悉网络安全新前沿,引领未来安全创新狂潮
在数字化浪潮席卷全球的今天,网络安全问题愈发凸显其重要性。 FCIS 2023网络安全创新大会作为业界瞩目的盛会,不仅汇聚了国际顶尖的网络安全专家,更展示了最前沿的安全技术与研究成果。那么,参与这场大会,我们究竟能学…...
4个最佳的免费全磁盘加密程序,总有一款适合你
全磁盘加密软件加密整个驱动器,而不仅仅是几个文件或文件夹。加密计算机的驱动器可以使你的私人数据免受窥探,即使你的计算机被盗。 你也不仅仅局限于一个硬盘驱动器。闪存驱动器和外部硬盘驱动器等外部设备也可以通过磁盘加密软件进行加密。 注意:Windows和macOS都集成了…...
Vim 调用外部命令学习笔记
Vim 外部命令集成完全指南 文章目录 Vim 外部命令集成完全指南核心概念理解命令语法解析语法对比 常用外部命令详解文本排序与去重文本筛选与搜索高级 grep 搜索技巧文本替换与编辑字符处理高级文本处理编程语言处理其他实用命令 范围操作示例指定行范围处理复合命令示例 实用技…...
学习STC51单片机31(芯片为STC89C52RCRC)OLED显示屏1
每日一言 生活的美好,总是藏在那些你咬牙坚持的日子里。 硬件:OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写,"1306" 是产品编号。 驱动 OLED 屏幕的 IIC 总线数据传输格式 示意图 …...
智能分布式爬虫的数据处理流水线优化:基于深度强化学习的数据质量控制
在数字化浪潮席卷全球的今天,数据已成为企业和研究机构的核心资产。智能分布式爬虫作为高效的数据采集工具,在大规模数据获取中发挥着关键作用。然而,传统的数据处理流水线在面对复杂多变的网络环境和海量异构数据时,常出现数据质…...
关键领域软件测试的突围之路:如何破解安全与效率的平衡难题
在数字化浪潮席卷全球的今天,软件系统已成为国家关键领域的核心战斗力。不同于普通商业软件,这些承载着国家安全使命的软件系统面临着前所未有的质量挑战——如何在确保绝对安全的前提下,实现高效测试与快速迭代?这一命题正考验着…...
10-Oracle 23 ai Vector Search 概述和参数
一、Oracle AI Vector Search 概述 企业和个人都在尝试各种AI,使用客户端或是内部自己搭建集成大模型的终端,加速与大型语言模型(LLM)的结合,同时使用检索增强生成(Retrieval Augmented Generation &#…...
HDFS分布式存储 zookeeper
hadoop介绍 狭义上hadoop是指apache的一款开源软件 用java语言实现开源框架,允许使用简单的变成模型跨计算机对大型集群进行分布式处理(1.海量的数据存储 2.海量数据的计算)Hadoop核心组件 hdfs(分布式文件存储系统)&a…...
Docker 本地安装 mysql 数据库
Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ;并安装。 基础操作不再赘述。 打开 macOS 终端,开始 docker 安装mysql之旅 第一步 docker search mysql 》〉docker search mysql NAME DE…...
【VLNs篇】07:NavRL—在动态环境中学习安全飞行
项目内容论文标题NavRL: 在动态环境中学习安全飞行 (NavRL: Learning Safe Flight in Dynamic Environments)核心问题解决无人机在包含静态和动态障碍物的复杂环境中进行安全、高效自主导航的挑战,克服传统方法和现有强化学习方法的局限性。核心算法基于近端策略优化…...
jmeter聚合报告中参数详解
sample、average、min、max、90%line、95%line,99%line、Error错误率、吞吐量Thoughput、KB/sec每秒传输的数据量 sample(样本数) 表示测试中发送的请求数量,即测试执行了多少次请求。 单位,以个或者次数表示。 示例:…...
适应性Java用于现代 API:REST、GraphQL 和事件驱动
在快速发展的软件开发领域,REST、GraphQL 和事件驱动架构等新的 API 标准对于构建可扩展、高效的系统至关重要。Java 在现代 API 方面以其在企业应用中的稳定性而闻名,不断适应这些现代范式的需求。随着不断发展的生态系统,Java 在现代 API 方…...
