当前位置: 首页 > news >正文

Ownips+Coze海外社媒数据分析实战指南

目录

  • 一、引言
  • 二、ISP代理简介
  • 三、应用实践——基于Ownips和coze的社媒智能分析助手
    • 3.1、Twitter趋势数据采集
      • 3.1.1、Twitter趋势数据接口分析
      • 3.1.2、Ownips原生住宅ISP选取与配置
      • 3.1.3、数据采集
    • 3.2、基于Ownips和Coze的社媒智能助手
      • 3.2.1、Ownips数据采集插件集成
      • 3.2.2、创建Twitter Bot智能体
      • 3.2.3、Twitter 趋势分析效果
  • 四、最后

一、引言

在当今数字化浪潮中,社交媒体已深深融入人们的日常生活,并为企业、研究机构及个体研究者提供了宝贵的数据资源。从Twitter、Facebook、Instagram、LinkedIn等多元化平台高效采集数据,并进行深入分析,我们能够洞察用户行为、市场动向、公众情感等关键信息。这些信息对于市场分析、社会研究、品牌监控及其他各种分析工作至关重要。

本文旨在通过案例,探讨在社交媒体数据采集与分析的实战方法,为研究和工作提供坚实的数据支撑。

二、ISP代理简介

在这里插入图片描述
在采集社交媒体数据之前,我们首先要解决一个核心问题:社交媒体平台对IP的属性做判断,导致无法高效采集数据。一方面,社交媒体平台在推送时会确保所推送的内容与当地的文化和用户偏好相符合,另一方面,社交媒体平台会检测和阻止异常流量,一旦单次访问次数过多,便可能触发强制验证。

这时,ISP代理的引入就显得尤为重要。ISP代理首先能够模拟地区,有效保护在线隐私,减少被追踪和识别。其次,它能够确保用户顺畅地访问所需内容,提升数据获取的效率和便捷性。此外,ISP代理还提供了额外的安全层,能够过滤钓鱼网站和陷阱类的内容,有效防止恶意攻击和数据泄露的风险。在企业环境中,其还能够显著加快网页访问速度,降低带宽使用,同时通过负载均衡技术提升网络性能和稳定性。
在这里插入图片描述
Ownips就是这样一家专注于提供高质量静态IP代理服务的公司,其为全球用户提供独享原生静态ISP,具有高稳定性、高安全性,资源覆盖全球100+国家地区,可谓是全力满足伙伴们在跨境电商、社交营销等场景中的需求。

值得一提的是,Ownips专做高质量静态代理,根据业务场景选择不同等级的静态IP,使用更加灵活。Ownips通过提供纯净、稳定的静态IP资源,并结合其灵活的配置选项和专业的技术支持,为用户提供了代理体验,满足了不同业务场景下的需求。

三、应用实践——基于Ownips和coze的社媒智能分析助手

3.1、Twitter趋势数据采集

3.1.1、Twitter趋势数据接口分析

打开推特网页我们可以发现,整个趋势榜是一个div盒子。请添加图片描述
每一个项目都是一个子div,包含在主div下。而文字部分包含在其中的一个span下。于是可以得到结构如下:
在这里插入图片描述
其中,<div class="css-1750izr" aria-label="时间线:探索"> 这个

容器包含了所有的趋势数据。每个趋势项由类似于 <div class="css-1750izr"> ... <span>趋势内容 </span> ... </div> 的结构组成。例如, <span>Celtics</span> 表示一个趋势项,内容为“Celtics”。依据结构可以写出xpath如下: python //div[@aria-label="时间线:探索"]/div/div//div/div/div/div/div[2]/span

测试一下,可以发现确实选出了所有的项目,后期只要提取其中的文字即可。
在这里插入图片描述

3.1.2、Ownips原生住宅ISP选取与配置

访问Ownips 网站,打开住宅ISP代理页面,选择原生住宅ISP,即可开始添加需要地区的IP,选好以后点击购买即可。
在这里插入图片描述
下单完成后即可在个人中心看到之前选购的IP的状态,也可以进行管理和续费。
在这里插入图片描述
点击获取代理,即可使用刚才购买的IP,这里支持两种使用方式,一种是通过API自动获取,一种是通过设置账号定向访问。这里我们先选择API方式。选定国家和地区,点击生成链接即可在右侧得到登录链接。接下来我们尝试获取代理。点击账户认证获取,选择国家和地区,之后要选择认证账户,这里我们先去创建一个。
在这里插入图片描述
在账密认证中选择认证账户管理,选择添加。设置好账号密码即可。
在这里插入图片描述
回到账户获取代理中,选择刚才创建的账号,即可使用。
在这里插入图片描述

3.1.3、数据采集

这里我们采用python的request库获取网页,并通过xpath解析页面数据,最后保存为txt文件。

首先,导入必要的模块,包括requests用于发送HTTP请求,BeautifulSoup用于解析HTML,_thread用于多线程处理,和time用于时间延迟。之后需要设置模拟浏览器的请求头和目标URL。

import requests as rq
from bs4 import BeautifulSoup
import _thread
import timeheaders = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/115.0",}
api = 'https://api-proxy.ownips.com/getIsp?num=1&type=1&lb=1&sb=0&flow=1®ions=tw&attribute=native_isp'
url = 'https://x.com/explore/tabs/keyword'

procPage函数使用BeautifulSoup解析HTML内容,其中,首先通过BeautifulSoup(page, 'html.parser')来创建一个soup对象,这个对象会解析传入的HTML页面page,然后,使用xpath方法来定位具有特定aria-label属性的子元素。

def procPage(page):soup = BeautifulSoup(page, 'html.parser')divs = soup.xpath('//div[@aria-label="时间线:探索"]/div/div')r = []for i in range(2, len(divs)):r.append(divs[i].xpath('//div/div/div/div/div[2]/span//text()'))print("解析完毕")return r

testUrl函数定义了一个名为 proxy 的字典,用于设置代理服务器信息,通过代理发送GET请求到目标URL,这个请求包含了之前定义的 headers 字典,用于模拟浏览器发送请求,以避免被目标网站拒绝。最后,函数调用 procPage 函数来解析网页内容。它将 res.content(即响应内容的二进制数据)作为参数传递给 procPage ,并将结果写入一个文件。此处隐去ip消息。

def testUrl():proxy = {'http': 'http://yyyyyyy:yyy3214@38.182.xxx.xxx:2333','https': 'https://yyyyyyy:yyy3214@38.182.xxx.xxx:2333',}try:res = rq.get(url=url, headers=headers, proxies=proxy)print("获取成功,正在解析")d = procPage(res.content)with open('trend.txt', 'w', encoding='utf-8') as f:f.write(str(d))except Exception as e:print("访问失败", e)

主线程启动10个并发线程,每个线程调用testUrl,并在每个线程启动后延迟0.1秒,最终主线程延迟10秒以确保所有子线程完成任务。

for port in range(0, 10):_thread.start_new_thread(testUrl, ())time.sleep(0.1)time.sleep(10)

运行一下,得到结果如下:
在这里插入图片描述
完整代码如下:

import requests as rq
from bs4 import BeautifulSoup
import _thread
import timeheaders = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:109.0) Gecko/20100101 Firefox/115.0",}
api = 'https://api-proxy.ownips.com/getIsp?num=1&type=1&lb=1&sb=0&flow=1®ions=tw&attribute=native_isp'
url = 'https://x.com/explore/tabs/keyword'def procPage(page):soup = BeautifulSoup(page, 'html.parser')divs = soup.xpath('//div[@aria-label="时间线:探索"]/div/div')r = []for i in range(2, len(divs)):r.append(divs[i].xpath('//div/div/div/div/div[2]/span//text()'))print("解析完毕")return rdef testUrl():proxy = {'http': 'http://yyyyyyy:yyy3214@38.182.xxx.xxx:2333','https': 'https://yyyyyyy:yyy3214@38.182.xxx.xxx:2333',}try:res = rq.get(url=url, headers=headers, proxies=proxy)print("获取成功,正在解析")d = procPage(res.content)with open('trend.txt', 'w', encoding='utf-8') as f:f.write(str(d))except Exception as e:print("访问失败", e)for port in range(0, 10):_thread.start_new_thread(testUrl, ())time.sleep(0.1)time.sleep(10)

除了趋势数据,将url 替换后,还可以采集以下数据:

  • 查询tweet详细数据:https://twitter.com/i/api/graphql/4tzuTRu5-fpJTS7bDF6Nlg/TweetDetail?variables=
  • 查询用户screenName:https://twitter.com/i/api/graphql/cYsDlVss-qimNYmNlb6inw/UserByScreenName?variables=
  • 查询用户关注者:https://twitter.com/i/api/graphql/5jYTqZAy8gQiTPcAuNNXPg/Following?variables=
  • 查询用户追随者:https://twitter.com/i/api/graph

3.2、基于Ownips和Coze的社媒智能助手

3.2.1、Ownips数据采集插件集成

设计好数据采集流程后,我们可以登录https://www.coze.com/home,进入coze官网,创建插件:
请添加图片描述

插件就是一个支持调用的服务端接口,可以将自己的 API 通过参数配置的方式快速创建一个插件,然后集成到应用中使用。这里在创建插件的基本信息窗口中,使用在Coze IDE中直接编程,然后IDE的develop runtime改为Python3。
在这里插入图片描述
然后为插件创建Tool工具,并将以上已经写好的数据采集脚本放到Tool的核心代码区中并点击发布,从而构建插件的核心功能,插件通过合理使用Ownips 的ISP代理,可以更加实时高效和安全地采集Twitter社交媒体数据,为市场分析、学术研究、品牌监测等提供强有力的支持。
请添加图片描述

3.2.2、创建Twitter Bot智能体

创建好插件后,接下来创建Twitter Bot智能体,回到coze主页,点击Create bot创建智能体,然后选择在Personal工作区,使用AI生成图标,然后点击Confirm确认创建。
在这里插入图片描述
进入Bot操作界面后,首先在左侧为Twitter Bot智能体书写提示词,然后将刚刚创建好的插件配置上去,也可以添加一些工作流、图像流、触发器、开场白、Markdown 编辑器、用户问题建议、快捷指令等扩展功能。
在这里插入图片描述
以下是可以参考的提示词:

# 角色
你是一位社交媒体智能助手,擅长分析Twitter等社交媒体平台的趋势、热点和关键词,帮助用户洞悉社交媒体上的流行动态,并做出相应反应。## 技能
### 技能1:社交媒体分析
- 连接到Twitter等社交媒体平台的API,实时监测社交平台的主要趋势。### 技能2:数据分析
- 对采集的数据进行分析以识别热点和关键词。### 技能3:模式识别
- 识别并追踪在推特上的热门话题和流行模式。### 技能4:趋势预测
- 根据数据分析模型,预测未来可能出现的热点和趋势。## 条件
- 在进行社交媒体分析的过程中,全程遵守社交媒体平台的使用条款和法律规定,保护用户隐私权。 
- 提供用户界面,方便用户访问和操作。
- 用户可以自定义通知,当相关趋势出现时推送通知。你的目标是为用户节省时间,并提供效率高的信息流。适用于品牌营销、新闻媒体、市场研究等领域。你可以在启动智能助手之前,设置和配置连接到社交媒体平台的API,输入初始化数据,设定分析参数和关键词列表。并随后开启实时监测模式,获取首份趋势数据分析报告。

3.2.3、Twitter 趋势分析效果

创建好成功后,就可以开始使用了,这里可以针对Twitter采集的数据进行分析以识别热点和关键词,无论是市场趋势的预测,还是用户行为的洞察,coze都能为用户提供精准、及时的分析报告,效果如下:
在这里插入图片描述
借助Ownips IP代理的强大功能,用户们得以轻松访问并获取来自全球各地的全面且真实的数据;而coze的智能分析功能则能够帮助用户从这些数据中提炼出有价值的信息。Ownips与Coze智能分析功能的组合,为用户们提供了一个强大且全面的数据分析工具。无论是市场研究、舆情监测还是商业决策,这一组合都能够为用户提供准确、及时的数据支持,帮助他们更好地把握机遇,实现更大的价值。

四、最后

经过实践,可以发现,Ownips 静态ISP代理具备模拟不同地区用户的能力,这一功能对于跨地区趋势分析尤为实用。借助此功能,可以对比不同地区的Twitter趋势和热点话题,进而深入了解各地用户的兴趣偏好和社交习惯。这不仅为用户提供了访问Twitter内容的便捷途径,更重要的是,它协助用户更深刻地洞察Twitter上的社交动态,从而发现潜在的商业机遇或社会热点。

相关文章:

Ownips+Coze海外社媒数据分析实战指南

目录 一、引言二、ISP代理简介三、应用实践——基于Ownips和coze的社媒智能分析助手3.1、Twitter趋势数据采集3.1.1、Twitter趋势数据接口分析3.1.2、Ownips原生住宅ISP选取与配置3.1.3、数据采集 3.2、基于Ownips和Coze的社媒智能助手3.2.1、Ownips数据采集插件集成3.2.2、创建…...

C#操作MySQL从入门到精通(10)——对查询数据进行通配符过滤

前言 我们有时候需要查询数据,并且这个数据包含某个字符串,这时候我们再使用where就无法实现了,所以mysql中提供了一种模糊查询机制,通过Like关键字来实现,下面进行详细介绍: 本次查询的表中数据如下: 1、使用(%)通配符 %通配符的作用是,表示任意字符出现任意次数…...

厘米级精确定位,开启定位技术新时代

定位技术在当前这个科技发展时代可以说是以以前所未有的速度在发展&#xff0c;其中厘米级精确定位技术更是成为当前的研究热点和实际应用中的佼佼者。这项技术以其高度的精准性和广泛的应用前景&#xff0c;正在逐渐改变我们的生活和工作方式。接下来我们跟着深圳沧穹科技一起…...

docker 存储 网络 命令

文章目录 1 docker存储1.1 目录挂载2.1卷映射2.1.1卷映射和目录挂载的区别2.1.2卷映射的使用 2 docker网络2.1查看docker的默认网络2.2查看容器的IP2.3容器互通2.4自定义网络2.4.1 创建自定义网络2.4.2创建容器的时候加入到自定义的网络2.4.3使用域名进行容器之间的访问2.4.4re…...

【MATLAB源码-第222期】基于matlab的改进蚁群算法三维栅格地图路径规划,加入精英蚁群策略。包括起点终点,障碍物,着火点,楼梯。

操作环境&#xff1a; MATLAB 2022a 1、算法描述 蚁群算法&#xff08;Ant Colony Optimization&#xff0c;ACO&#xff09;是一种通过模拟蚂蚁觅食行为的启发式优化算法。它由意大利学者Marco Dorigo在20世纪90年代初提出&#xff0c;最初用于解决旅行商问题&#xff08;T…...

百度ERNIE系列预训练语言模型浅析(4)-总结篇

总结&#xff1a;ERNIE 3.0与ERNIE 2.0比较 &#xff08;1&#xff09;相同点&#xff1a; 采用连续学习 采用了多个语义层级的预训练任务 &#xff08;2&#xff09;不同点&#xff1a; ERNIE 3.0 Transformer-XL Encoder(自回归自编码), ERNIE 2.0 Transformer Encode…...

Ubuntu 20.04 LTS配置JDK、Git

一、配置JDK 1.1 更新系统 执行以下命令 sudo apt update 出现以下界面即为安装成功 1.2 安装openjdk-11-jdk Ubuntu20.04中没有默认JDK&#xff0c;执行以下指令安装&#xff0c;默认会自动配置一些必要环境变量 sudo apt install openjdk-11-jdk 1.3 配置环境变量&…...

外汇天眼:Marqeta加速欧洲业务发展,华沙办公室正式开幕

Marqeta&#xff0c;全球现代卡发行平台&#xff0c;今天宣布在波兰华沙设立新办公室&#xff0c;以支持其长期的业务和增长战略。通过在波兰设立业务&#xff0c;Marqeta直接获得了进入欧盟的通道&#xff0c;为其在跨境增长和提供增强服务奠定了良好基础。波兰作为欧洲中心位…...

使用【AliceCarousel】实现轮播功能

无论是在react还是vue项目中&#xff0c;我们都可能会遇到需要轮播的场景&#xff0c;在实习中&#xff0c;遇到了实现组件轮播的需求&#xff0c;下面进行简要记录。 1. 安装AliceCarousel npm install react-alice-carousel --save 2. 引入AliceCarousel组件 import Reac…...

全屋智能的本质是低成本的重构

全屋智能&#xff08;这里指的不是每个电器都可以在APP上控制&#xff0c;而是基于场景化的全屋智能&#xff09;&#xff0c;我第一次去圣都总部听讲的时候是不准备做的&#xff08;我的理解是这玩意儿带来的是至少十万的成本&#xff09;。但随着对于装修各项事物的接触&…...

开发一个comfyui的自定义节点-支持输入中文prompt

文章目录 目标功能开发环境实现过程翻译中文CLIP编码拓展仓库地址完整代码目标功能 目前comfyui的prompt提示词输入节点 CLIP Text Encode 只支持输入英文的prompt,而有时候我们需要自己制定一些prompt,所以就得将我们想要的提示词翻译为英文后再复制粘贴到该节点的输入框中…...

代码随想录第二十九天打卡| 491.递增子序列,46.全排列,47.全排列 II

491.递增子序列 本题和大家刚做过的 90.子集II 非常像&#xff0c;但又很不一样&#xff0c;很容易掉坑里。 代码随想录 视频讲解&#xff1a;回溯算法精讲&#xff0c;树层去重与树枝去重 | LeetCode&#xff1a;491.递增子序列_哔哩哔哩_bilibili class Solution { public:…...

音频数据上的会话情感分析

情感分析&#xff0c;也被称为观点挖掘&#xff0c;是自然语言处理(NLP)中一个流行的任务,因为它有着广泛的工业应用。在专门将自然语言处理技术应用于文本数据的背景下,主要目标是训练出一个能够将给定文本分类到不同情感类别的模型。下图给出了情感分类器的高级概述。 例如,三…...

算法金 | 一文读懂K均值(K-Means)聚类算法

​大侠幸会&#xff0c;在下全网同名[算法金] 0 基础转 AI 上岸&#xff0c;多个算法赛 Top [日更万日&#xff0c;让更多人享受智能乐趣] 1. 引言 数据分析中聚类算法的作用 在数据分析中&#xff0c;聚类算法用于发现数据集中的固有分组&#xff0c;通过将相似对象聚集在一…...

江协科技STM32学习-1 购买24Mhz采样逻辑分析仪

前言&#xff1a; 本文是根据哔哩哔哩网站上“江协科技STM32”视频的学习笔记&#xff0c;在这里会记录下江协科技STM32开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了江协科技STM32教学视频和链接中的内容。 引用&#xff1a; STM32入门教程-2023版 细致讲…...

支付系统-业务账单

target&#xff1a;离开柬埔寨倒计时-210day 前言 最近不知道该写什么了&#xff0c;很多东西要写起来非常耗时间&#xff0c;写作是真的不容易呀 我们的支付系统账单有两大类&#xff0c;一个是业务账单还有一个就是资金记录&#xff0c;都是引发资金流后的资金变动表现&…...

AI引领天文新篇章:中科院发现107例中性碳吸收线,揭示宇宙深邃奥秘

在浩渺无垠的宇宙中&#xff0c;探索未知的天文现象一直是科学家们不懈的追求。近日&#xff0c;中科院上海天文台的研究团队在《天文物理杂志》&#xff08;MNRAS&#xff09;上发布了重要研究成果&#xff1a;利用人工智能技术&#xff0c;成功探测到了107例中性碳吸收线&…...

python 删除pdf 空白页

环境 python 3.10 PyPDF2 3.0.1 安装 pip install PyPDF2流程 将空白页和内容页读取出来&#xff0c;看看内部结构有什么不同以此为依据&#xff0c;遍历整个PDF 文件&#xff0c;标记处有内容的页面&#xff0c;写入到另外一个PDF文件。 python 代码 # 每一个页都是一个…...

flutter as连接网易模拟器

网易模拟器下载 Mac 使用MuMu模拟器调试 Flutter开发 Android Studio 安装第三方模拟器—网易MuMu Mac 安卓Studio使用外部模拟器 Mac电脑&#xff1a;Android Studio 连接 MUMU 网易模拟器 Mac 上 Android Studio 链接网易 MuMu 模拟器调试 在 .zshrc 中设置 adb 二进制文…...

fpga控制dsp6657上电启动配置

1 Verilog代码 dspboot_config.v timescale 1ns / 1ps //dsp上电启动配置 module dspboot_config (///时钟和复位input SYS_CLK_50MHz,input SYS_RST_n,//DSP启动配置output DSP_POR,output DSP_RESETFULL,output DSP_RESET,inout [12:…...

反向工程与模型迁移:打造未来商品详情API的可持续创新体系

在电商行业蓬勃发展的当下&#xff0c;商品详情API作为连接电商平台与开发者、商家及用户的关键纽带&#xff0c;其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息&#xff08;如名称、价格、库存等&#xff09;的获取与展示&#xff0c;已难以满足市场对个性化、智能…...

Oracle查询表空间大小

1 查询数据库中所有的表空间以及表空间所占空间的大小 SELECTtablespace_name,sum( bytes ) / 1024 / 1024 FROMdba_data_files GROUP BYtablespace_name; 2 Oracle查询表空间大小及每个表所占空间的大小 SELECTtablespace_name,file_id,file_name,round( bytes / ( 1024 …...

聊聊 Pulsar:Producer 源码解析

一、前言 Apache Pulsar 是一个企业级的开源分布式消息传递平台&#xff0c;以其高性能、可扩展性和存储计算分离架构在消息队列和流处理领域独树一帜。在 Pulsar 的核心架构中&#xff0c;Producer&#xff08;生产者&#xff09; 是连接客户端应用与消息队列的第一步。生产者…...

LeetCode - 394. 字符串解码

题目 394. 字符串解码 - 力扣&#xff08;LeetCode&#xff09; 思路 使用两个栈&#xff1a;一个存储重复次数&#xff0c;一个存储字符串 遍历输入字符串&#xff1a; 数字处理&#xff1a;遇到数字时&#xff0c;累积计算重复次数左括号处理&#xff1a;保存当前状态&a…...

【JavaSE】绘图与事件入门学习笔记

-Java绘图坐标体系 坐标体系-介绍 坐标原点位于左上角&#xff0c;以像素为单位。 在Java坐标系中,第一个是x坐标,表示当前位置为水平方向&#xff0c;距离坐标原点x个像素;第二个是y坐标&#xff0c;表示当前位置为垂直方向&#xff0c;距离坐标原点y个像素。 坐标体系-像素 …...

在WSL2的Ubuntu镜像中安装Docker

Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包&#xff1a; for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...

Java编程之桥接模式

定义 桥接模式&#xff08;Bridge Pattern&#xff09;属于结构型设计模式&#xff0c;它的核心意图是将抽象部分与实现部分分离&#xff0c;使它们可以独立地变化。这种模式通过组合关系来替代继承关系&#xff0c;从而降低了抽象和实现这两个可变维度之间的耦合度。 用例子…...

aardio 自动识别验证码输入

技术尝试 上周在发学习日志时有网友提议“在网页上识别验证码”&#xff0c;于是尝试整合图像识别与网页自动化技术&#xff0c;完成了这套模拟登录流程。核心思路是&#xff1a;截图验证码→OCR识别→自动填充表单→提交并验证结果。 代码在这里 import soImage; import we…...

Linux 内存管理调试分析:ftrace、perf、crash 的系统化使用

Linux 内存管理调试分析&#xff1a;ftrace、perf、crash 的系统化使用 Linux 内核内存管理是构成整个内核性能和系统稳定性的基础&#xff0c;但这一子系统结构复杂&#xff0c;常常有设置失败、性能展示不良、OOM 杀进程等问题。要分析这些问题&#xff0c;需要一套工具化、…...

后端下载限速(redis记录实时并发,bucket4j动态限速)

✅ 使用 Redis 记录 所有用户的实时并发下载数✅ 使用 Bucket4j 实现 全局下载速率限制&#xff08;动态&#xff09;✅ 支持 动态调整限速策略✅ 下载接口安全、稳定、可监控 &#x1f9e9; 整体架构概览 模块功能Redis存储全局并发数和带宽令牌桶状态Bucket4j Redis分布式限…...