当前位置: 首页 > news >正文

【电商纯干货分享】干货速看!电商数据集数据API接口数据分析大全!

数据分析——深入探索中小企业数字化转型,专注提供各行业数据分析干货、分析技巧、工具推荐以及各类超实用分析模板,为钻研于数据分析的朋友们加油充电。


公共参数

名称类型必须描述
keyString调用key(必须以GET方式拼接在URL中)
secretString调用密钥
api_nameStringAPI接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cacheString[yes,no]默认yes,将调用缓存的数据,速度比较快
result_typeString[json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
langString[cn,en,ru]翻译语言,默认cn简体中文
versionStringAPI版本

请求参数

请求参数:num_iid=10335871600

参数说明:num_iid:JD商品ID

响应参数

Version: Date:

名称类型必须示例值描述

item

item[]0获得JD商品详情

电商数据集通常包含专有信息,因此很难在公共数据库中找到。在互联网上进行搜索以收集可公开获得的电子商务数据的列表,请享用!

1、电商产品数据集

1)Fashion-MNIST:MNIST非常适合产品分类用例,其中包含10个类别的近60,000张时尚产品的训练图像和10,000张测试图像。

https://github.com/zalandoresearch/fashion-mnist

2)来自“维多利亚的秘密”和其他杂志的内衣数据:来自流行零售网站的600,000多种内衣产品数据。它包括产品说明,价格,类别,评级等。

https://www.kaggle.com/PromptCloudHQ/innerwear-data-from-victorias-secret-and-others

3)电子产品和定价数据:此数据集包含7,000多种电子产品的列表以及10个价格信息字段。

https://data.world/datafiniti/electronic-products-and-pricing-data

4)男鞋价格:10,000张男鞋的清单以及各种售价。

https://data.world/datafiniti/mens-shoe-prices

5)女鞋价格:除了以前的数据集之外,它还包含10,000种女鞋的列表以及各种售价。

https://data.world/datafiniti/womens-shoe-prices

6)电子商务商品数据:对于推荐系统很有用,该数据集包含SKU及其来自户外服装品牌产品目录的相关产品描述。

https://www.kaggle.com/cclark/product-item-data/home

7)Amazon.com上的Fashion Products:这是通过从Amazon提取数据而创建的预抓取数据集。它由亚马逊上约22,000种时尚产品组成。

https://data.world/promptcloud/fashion-products-on-amazon-com

8)服装的电子商务标签:此零售数据集包含来自电子商务网站的图像,在衬衫,夹克,太阳镜等周围画有边框。它有907个项目,其中504个项目已手动标记。

https://dataturks.com/projects/devika.mishra/E-commerce%20Tagging%20for%20clothing

2、零售交易数据集

1)在线零售数据集(UCI机器学习存储库):此数据集包含一个总部位于英国的在线零售公司在八个月内(01/12 / 2010-09 / 12/2011)的所有交易。

https://www.kaggle.com/carrie1/ecommerce-data/home

2)巴西电子商务公共数据集:此数据集包含2016年至2018年在多个市场在Olist上做出的100,000多个巴西匿名订单(100k订单)。此外,它包括从订单状态,价格,付款和货运绩效到客户的真实书面评论的多个维度。

https://www.kaggle.com/olistbr/brazilian-ecommerce/home

3)Online Auctions数据集:零售数据集,其中包含Cartier手表,Xbox游戏机,Palm Pilot M515 PDA和Swarovski珠子上的eBay拍卖数据。

https://www.kaggle.com/onlineauctions/online-auctions-dataset/home

4)Retailrocket推荐系统数据集:此数据是在4.5个月的时间内从真实的电子商务网站收集的。此外,它还包含有关访客行为的信息,包括点击,添加到购物车和交易等事件。

https://www.kaggle.com/retailrocket/ecommerce-dataset/home

3、电子商务搜索相关性数据集

1)电子商务搜索相关性:此集合包含图像URL,页面排名,每种产品的描述,导致每种结果的搜索查询以及来自五个主要英语电子商务网站的更多信息。

https://data.world/crowdflower/ecommerce-search-relevance

2)百思买搜索查询NER数据集:零售数据集,包含在bestbuy.com上带有手动标记的搜索查询。搜索查询中的短语被标记为各种重要实体,例如品牌,型号名称,类别名称等。

https://dataturks.com/projects/Mohan/Best%20Buy%20E-commerce%20NER%20dataset

4、客户审查数据集

1)女士电子商务服装评论:另一个电子商务数据的绝佳资源,此Kaggle数据集包含23,000个真实的客户评论和评分。但是,由于其特征是真实的商业数据,因此所有信息都已匿名化。因此,在评论文本和正文中对公司的引用已被替换为“零售商”。

https://www.kaggle.com/nicapotato/womens-ecommerce-clothing-reviews/home

2)Amazon Commerce评论集:此零售数据集用于在线Writeprint中的作者身份识别,Writeprint是模式识别的新研究领域。此外,为了检查分类算法的鲁棒性,我们确定了50个最频繁发布评论的最活跃用户。

https://archive.ics.uci.edu/ml/datasets/Amazon+Commerce+reviews+set

3)多域情感分析数据集:稍旧的零售数据集,其中包含按产品类型和等级划分的产品评论数据。此外,评论包含星级(1到5颗星),可以根据需要将其转换为二进制标签。

http://www.cs.jhu.edu/~mdredze/datasets/sentiment/

4)亚马逊和百思买电子:来自50种电子产品的7,000多个在线评论列表。除了评论本身之外,数据集还包括日期,来源,等级,标题,评论者元数据等。

https://data.world/datafiniti/amazon-and-best-buy-electronics

5)语法和在线产品评论:这是Datafiniti的一个大型数据集的示例。它包含超过70,000条评论的列表,可用于许多机器学习用例。例如,您可以评估写作质量如何影响正面和负面的在线产品评论。

https://data.world/datafiniti/grammar-and-online-product-reviews

5、电子商务数据集

1)年度零售贸易调查(ARTS):此数据集提供了在美国境外持有的年度总销售,运营费用和库存的国家估计。

https://catalog.data.gov/dataset/annual-retail-trade-survey

2)经济普查:经济普查每五年对国家和地方一级的行业和社区的商业活动进行详细描述。

https://catalog.data.gov/dataset/economic-census

3)E-Stats:美国政府的该数据集报告了无论通过开放式网络(例如Internet)在线销售的商品和服务的价值。

https://catalog.data.gov/dataset/e-stats

4)欧盟对外贸易数据集:另一个政府数据集,欧盟对外贸易数据集提供有关按商品,按原产国或目的地分类的进出口,贸易顺差值的信息。

https://ec.europa.eu/eurostat/web/international-trade-in-goods/data

5)1999-2015年按商品类别划分的电子商务销售额:此数据集包含真实的普查数据,该数据显示了按商品类别划分的电子商务总销售额以及1999-2015年的复合年增长率。

https://www.census.gov/data/tables/2015/econ/e-stats/2015-e-stats.html

相关文章:

【电商纯干货分享】干货速看!电商数据集数据API接口数据分析大全!

数据分析——深入探索中小企业数字化转型,专注提供各行业数据分析干货、分析技巧、工具推荐以及各类超实用分析模板,为钻研于数据分析的朋友们加油充电。 公共参数 名称类型必须描述keyString是调用key(必须以GET方式拼接在URL中&#xff09…...

随手记录: Ubuntu NVIDIA显卡驱动安装后 屏幕亮度无法调节 无法连接外显示器等问题

背景 一句话:简单记录帮身边人装系统发现 GPU和外接显示器的无法连接,同时亮度无法调节等新问题 设备型号: 联想笔记本:ThinkBook 16p Gen2CPU:AMD Ryzen 7 5800HGPU:RTX 3060 问题描述及流程&#xff…...

Java:数组

文章目录 一、概念二、声明数组2.1 格式2.2 实例 三、初始化数组3.1 格式3.2 实例 四、处理数组4.1 for循环4.2 增强for循环 五、多维数组5.1 格式5.2 实例 一、概念 数组对于每一门编程语言来说都是重要的数据结构之一,当然不同语言对数组的实现及处理也不尽相同。…...

【代码随想录——图论——岛屿问题】

1.岛屿数量 https://kamacoder.com/problempage.php?pid1171 1.1 深度优先搜索 package mainimport "fmt"var direction [][]int{{0, 1}, {0, -1}, {1, 0}, {-1, 0}}func main() {var M, N intfmt.Scanln(&N, &M)sea : make([][]int, N)visited : make…...

异步调用 - 初识

目录 1、引入 2、同步调用 2.1、例子:支付功能 2.2、同步调用的好处 2.3、同步调用的缺点 3、异步调用 3.1、异步调用的方式 3.2、异步调用的优势 3.3、异步调用的缺点 3.4、什么场景下使用异步调用 3.5、MQ技术选型 1、引入 为什么想要异步通信呢&…...

Java 家庭物联网

家庭物联网系统的代码和说明,包括用户认证、设备控制、数据监控、通知和警报、日志记录以及WebSocket实时更新功能。 ### 项目结构 plaintext home-iot-system ├── backend │ └── src │ └── main │ └── java │ └…...

机器学习——随机森林

随机森林 1、集成学习方法 通过构造多个模型组合来解决单一的问题。它的原理是生成多个分类器/模型,各自独立的学习和做出预测。这些预测最后会结合成组合预测,因此优于任何一个单分类得到的预测。 2、什么是随机森林? 随机森林是一个包含…...

Java - JDK17语法新增特性(如果想知道Java - JDK17语法新增常见的特性的知识点,那么只看这一篇就足够了!)

前言:Java在2021年发布了最新的长期支持版本:JDK 17。这个版本引入了许多新的语法特性,提升了开发效率和代码可读性。本文将简要介绍一些常见的新特性,帮助开发者快速掌握并应用于实际开发中。 ✨✨✨这里是秋刀鱼不做梦的BLOG ✨…...

Linux-DNS

DNS域名解析服务 1.DNS介绍 DNS 是域名系统 (Domain Name System) 的缩写,是因特网的一项核心服务,它作为可以将域名和IP地址相互映射的一个分布式数据库,能够使人更方便的访问互联网,而不用去记住能够被机器直接读取的IP数串。…...

使用gitlab的CI/CD实现logseq笔记自动发布为单页应用

使用gitlab的CI/CD实现logseq笔记自动发布为单页应用 使用gitlab的CI/CD实现logseq笔记自动发布为单页应用如何实现将logseq的笔记发布成网站使用 logseq-publish-docker 实现手动发布使用gitlab的CI/CD实现自动发布过程中的问题及解决参考资料 使用gitlab的CI/CD实现logseq笔记…...

云联壹云 FinOps:赋能某车企公有云成本管理与精细化运营

背景 某车企,世界 500 强企业,使用了大量的公有云资源,分布于多家公有云,月消费在千万级别。 业务线多且分散,相关的云消耗由一个核心团队进行管理,本次案例的内容将围绕这些云成本的管理展开的。 需求 …...

C#静态类与非静态类

1、静态类 静态类有几个重要的特点: 1)无法实例化:由于静态类不能被实例化,因此它不会占用对象内存。 2)静态成员:静态类只能包含静态成员(静态方法、静态属性、静态事件等)。 3&am…...

亚信安全:《2024云安全技术发展白皮书》

标签 云计算 安全威胁 云安全技术 网络攻击 数据保护 一句话总结 《云安全技术发展白皮书》全面分析了云计算安全威胁的演进,探讨了云安全技术的发展历程、当前应用和未来趋势,强调了构建全面云安全防护体系的重要性。 摘要 云安全威胁演进&#xff…...

GuLi商城-商品服务-API-品牌管理-云存储开通与使用

这里学习下阿里云对象存储 地址:对象存储 OSS_云存储服务_企业数据管理_存储-阿里云 登录支付宝账号,找到了我以前开通的阿里云对象存储 熟悉下API 文档中心 简介_对象存储(OSS)-阿里云帮助中心 我们将用这种方式上传阿里云OSS...

git 命令行初始化并上传项目

XXXX 为项目名称 1. 初始化 cd D:\XXXX git init git remote add origin http://账号192.168.1.231:8088/r/XXXX.git 2. 拉取项目,做本地合并 git pull origin master git fetch origin git merge origin/master 3. 添加注释,上传 git add . git c…...

Spring框架Mvc(2)

1.传递数组 代码示例 结果 2.集合参数存储并进行存储类似集合类 代码示例 postman进行测试 ,测试结果 3.用Json来对其进行数据的传递 (1)Json是一个经常使用的用来表示对象的字符串 (2)Json字符串在字符串和对象…...

Python学习笔记29:进阶篇(十八)常见标准库使用之质量控制中的数据清洗

前言 本文是根据python官方教程中标准库模块的介绍,自己查询资料并整理,编写代码示例做出的学习笔记。 根据模块知识,一次讲解单个或者多个模块的内容。 教程链接:https://docs.python.org/zh-cn/3/tutorial/index.html 质量控制…...

【LLM】一、利用ollama本地部署大模型

目录 前言 一、Ollama 简介 1、什么是Ollama 2、特点: 二、Windows部署 1.下载 2.安装 3.测试安装 4.模型部署: 5.注意 三、 Docker部署 1.docker安装 2.ollama镜像拉取 3.ollama运行容器 4.模型部署: 5.注意: 总结 前言…...

Java毕业设计 基于SSM vue新生报到系统小程序 微信小程序

Java毕业设计 基于SSM vue新生报到系统小程序 微信小程序 SSM 新生报到系统小程序 功能介绍 学生 登录 注册 忘记密码 首页 学校公告 录取信息 录取详情 师资力量 教师详情 收藏 评论 用户信息修改 宿舍安排 签到信息 在线缴费 教室分配 我的收藏管理 我要发贴 我的发贴 管理…...

玩转云服务:Oracle Cloud甲骨文永久免费云服务器注册及配置指南

上一篇,带大家分享了:如何薅一台腾讯云服务器。 不过,只有一个月免费额度,到期后需要付费使用。 相对而言,海外云厂商更加慷慨一些,比如微软Azure、甲骨文、亚马逊AWS等。 甲骨文2019年9月就推出了永久免…...

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…...

后进先出(LIFO)详解

LIFO 是 Last In, First Out 的缩写,中文译为后进先出。这是一种数据结构的工作原则,类似于一摞盘子或一叠书本: 最后放进去的元素最先出来 -想象往筒状容器里放盘子: (1)你放进的最后一个盘子&#xff08…...

eNSP-Cloud(实现本地电脑与eNSP内设备之间通信)

说明: 想象一下,你正在用eNSP搭建一个虚拟的网络世界,里面有虚拟的路由器、交换机、电脑(PC)等等。这些设备都在你的电脑里面“运行”,它们之间可以互相通信,就像一个封闭的小王国。 但是&#…...

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning(提示调优) 核心思想:固定预训练模型参数,仅学习额外的连续提示向量(通常是嵌入层的一部分)。实现方式:在输入文本前添加可训练的连续向量(软提示),模型只更新这些提示参数。优势:参数量少(仅提…...

SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现,论文初版实现

摘要 本论文旨在设计并实现基于 SpringBoot 和 uniapp 的 Champion 俱乐部微信小程序,以满足俱乐部线上活动推广、会员管理、社交互动等需求。通过 SpringBoot 搭建后端服务,提供稳定高效的数据处理与业务逻辑支持;利用 uniapp 实现跨平台前…...

ServerTrust 并非唯一

NSURLAuthenticationMethodServerTrust 只是 authenticationMethod 的冰山一角 要理解 NSURLAuthenticationMethodServerTrust, 首先要明白它只是 authenticationMethod 的选项之一, 并非唯一 1 先厘清概念 点说明authenticationMethodURLAuthenticationChallenge.protectionS…...

【Web 进阶篇】优雅的接口设计:统一响应、全局异常处理与参数校验

系列回顾: 在上一篇中,我们成功地为应用集成了数据库,并使用 Spring Data JPA 实现了基本的 CRUD API。我们的应用现在能“记忆”数据了!但是,如果你仔细审视那些 API,会发现它们还很“粗糙”:有…...

【RockeMQ】第2节|RocketMQ快速实战以及核⼼概念详解(二)

升级Dledger高可用集群 一、主从架构的不足与Dledger的定位 主从架构缺陷 数据备份依赖Slave节点,但无自动故障转移能力,Master宕机后需人工切换,期间消息可能无法读取。Slave仅存储数据,无法主动升级为Master响应请求&#xff…...

AspectJ 在 Android 中的完整使用指南

一、环境配置(Gradle 7.0 适配) 1. 项目级 build.gradle // 注意:沪江插件已停更,推荐官方兼容方案 buildscript {dependencies {classpath org.aspectj:aspectjtools:1.9.9.1 // AspectJ 工具} } 2. 模块级 build.gradle plu…...

分布式增量爬虫实现方案

之前我们在讨论的是分布式爬虫如何实现增量爬取。增量爬虫的目标是只爬取新产生或发生变化的页面,避免重复抓取,以节省资源和时间。 在分布式环境下,增量爬虫的实现需要考虑多个爬虫节点之间的协调和去重。 另一种思路:将增量判…...