当前位置: 首页 > news >正文

Python数据分析-世界上最富有的1000人

一、研究背景

随着全球化的加速发展和技术的进步,财富分配问题日益成为全球关注的焦点。财富的不平等现象日益明显,少数极富有的个人掌握了全球大部分的财富资源。了解全球最富有个人的财富分布及其背后的行业和国家因素,对于分析全球经济趋势、财富积累路径及行业发展具有重要意义。

本研究基于截至 2023 年全球前 1000 名最富有的个人的数据,分析了这些亿万富翁的财富来源、财富积累的行业分布、以及财富与国家或地区的关系。通过对这些数据的分析,可以帮助我们深入了解全球财富分配的现状,探索在全球经济体系中哪些行业最有可能产生巨额财富,并了解各国经济发展对个人财富积累的影响。

此外,随着数字经济、科技行业的迅速崛起,以及传统制造业、金融业的持续发展,本研究还将探索不同经济周期和全球化进程对财富分布的影响,从而为政策制定者、经济学家和企业家提供决策参考。

二、研究意义

研究全球前 1000 名最富有个人的财富分布及其背后的因素具有以下几个重要意义:

  1. 揭示全球财富不平等的现状:通过分析这些亿万富翁的净资产及其地理分布,可以直观地反映出全球财富集中度的情况,有助于理解财富不平等的宏观背景。

  2. 行业和地区的财富积累特点:通过对这些个人主要业务行业的分析,可以揭示哪些行业在当前经济中最有可能产生巨额财富,帮助投资者、企业家及政策制定者把握经济机遇。此外,分析这些个人的国家/地区分布,有助于理解各国经济政策、产业结构与财富积累的关联性。

  3. 为政策制定提供依据:通过研究财富分布情况,政策制定者可以更好地理解当前经济体系中的优势和问题,从而制定更有效的政策以缩小财富差距,促进社会公平与包容性增长。

  4. 揭示财富积累背后的产业变迁:通过长期跟踪亿万富翁的财富积累,可以帮助学术界和行业从业者了解全球产业结构的变化,从而预测未来最有可能积累财富的行业发展趋势。

三、实证分析

该数据集提供了截至 2023 年全球前 1000 名最富有的个人的详细快照。对于任何有兴趣了解全球财富分配、培养最富有个人的行业以及他们所在的国家/地区的人来说,此数据集都是宝贵的资源。它包括有关每个人的净资产、他们的主要商业利益和他们的居住国的重要信息。Top_1000_wealthiest_people.csv

代码和数据

数据概览 该数据集由 5 个关键列组成,提供对全球亿万富翁财务状况的全面见解:

名字:此列列出了每个人的全名。它对于确定谁是最富有的 1000 人至关重要。

国家:这显示了个人居住的国家/地区或其主要业务运营所在的国家/地区。它有助于了解财富的地理分布。

工业:此列标识个人积累财富的主要行业或部门。这些信息提供了关于哪些行业最有利可图的财富的见解。

净资产(以十亿计):本专栏报告每个人的估计净资产,以数十亿美元表示。它反映了他们财富的财务规模。

公司:这将列出与每个人关联的主要公司或企业。它突出了他们积累财富的主要企业。

导入代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

读取数据

df=pd.read_csv("Top_1000_wealthiest_people.csv")
df.head()

 

查看数据形状

df.info()

 

检查一下缺失值

df.isna().sum()

# 绘制每个数值特征的直方图

绘制每个数值特征的箱形图

for feature in numeric_features:plt.figure(figsize=(10, 6))sns.boxplot(x=df[feature])plt.title(f'Box Plot of {feature}')plt.xlabel(feature)plt.show()

全球净财富top10 

top_10_richest = df.nlargest(10,"net_worth")
top_10_richest

 

绘制行业分布图 

plt.figure(figsize=(8,6))
industry_count = df['Industry'].value_counts()
sns.barplot(y=industry_count.index ,x=industry_count.values, palette='cividis')
plt.title('industry distubution')
plt.xlabel('no of people')
plt.ylabel('industry')
plt.show()

绘制国家/地区的分布 

 绘制按行业划分的平均净资产 

plt.figure(figsize=(8,6))
industry_net_worth=df.groupby('Industry')['net_worth'].mean().sort_values()
sns.barplot(y=industry_net_worth.index,x=industry_net_worth.values,palette='viridis')
plt.title('Average Net Worth by Industry')
plt.xlabel('Average Net Worth (in billions)')
plt.ylabel('Industry')
plt.show()

按国家绘制平均净资产 

plt.figure(figsize=(8,6))
country_net_worth=df.groupby('Country')['net_worth'].mean().sort_values(ascending=False)
sns.barplot(y=country_net_worth.index,x=country_net_worth.values,palette='plasma')
plt.title('Top 10 Countries by Average Net Worth')
plt.xlabel('Average Net Worth (in billions)')
plt.ylabel('Country')
plt.show()

计算混淆矩阵

按国家和行业划分的净资产箱线图

plt.figure(figsize=(15, 10))
sns.boxplot(data=df,x='Country',y='net_worth',hue='Industry')
plt.title('Net Worth Distribution by Country and Industry')
plt.xlabel('Country')
plt.ylabel('Net Worth (in billions)')
plt.legend(loc='upper right')
plt.show()

 

按国家/地区查找首富

richest_by_country=df.loc[df.groupby('Country')['net_worth'].idxmax()]
richest_by_country

 

richest_by_industry=df.loc[df.groupby('Industry')['net_worth'].idxmax()]
richest_by_industry

按行业寻找首富

绘制代表性最多的前 5 家公司

plt.figure(figsize=(12, 8))
top_companies = df['Company'].value_counts().head(5)
sns.barplot(y=top_companies.index, x=top_companies.values, palette='cubehelix')
plt.title('Top 5 Companies with the Most Representatives')
plt.xlabel('Number of Representatives')
plt.ylabel('Company')
plt.show()

 绘制代表最多的前 10 个国家

plt.figure(figsize=(12, 8))
top_countries =df['Country'].value_counts().head(10)
sns.barplot(y=top_countries.index, x=top_countries.values, palette='plasma')
plt.title('Top 10 Countries with the Most Representatives')
plt.xlabel('Number of Representatives')
plt.ylabel('Country')
plt.show()

绘制按行业划分的净资产分布 

plt.figure(figsize=(12, 8))
sns.boxplot(y='Industry', x='net_worth', data=df, palette='muted')
plt.title('Distribution of Net Worth by Industry')
plt.xlabel('Net Worth (in billions)')
plt.ylabel('Industry')
plt.show()

 绘制按国家/地区划分的净资产分布

plt.figure(figsize=(12, 8))
top_countries_net_worth = df[df['Country'].isin(df['Country'].value_counts().head(10).index)]
sns.boxplot(y='Country', x='net_worth', data=top_countries_net_worth, palette='Set3')
plt.title('Distribution of Net Worth by Country')
plt.xlabel('Net Worth (in billions)')
plt.ylabel('Country')
plt.show()

四、结论

通过对全球前 1000 名最富有个人的数据分析,本研究得出以下结论:

  1. 财富集中度极高:全球财富分配极不平衡,前 1000 名个人控制了全球极大比例的财富。财富集中于少数人手中,而这些个人往往通过特定的高利润行业获得了巨额财富。

  2. 科技和金融行业占据主导地位:从行业分布来看,科技行业和金融业是创造亿万富翁的主要来源,尤其是近年来科技公司快速崛起,带来了大量的财富积累。制造业、零售和资源行业也占据了一定比例,但总体上,现代高科技行业对财富的积累影响显著。

  3. 财富的地理分布不均衡:在地域分布上,欧美国家特别是美国和欧洲富豪的数量占据显著比例。这些地区拥有成熟的资本市场和先进的科技产业,是财富积累的核心地带。相比之下,亚洲国家,特别是中国的亿万富翁数量快速增长,反映了新兴市场的经济快速发展和全球经济重心的转移。

  4. 亿万富翁主要通过企业积累财富:数据表明,大多数亿万富翁的财富积累来源于他们在相关企业中的股权,尤其是他们创立或参与领导的大型企业。这也突显了企业创新、市场化运作在财富积累中的重要性。

本研究为理解全球财富分布及其行业和地域特点提供了宝贵的洞见,对于未来全球财富格局的变化及其背后的经济驱动因素有重要参考价值。

相关文章:

Python数据分析-世界上最富有的1000人

一、研究背景 随着全球化的加速发展和技术的进步,财富分配问题日益成为全球关注的焦点。财富的不平等现象日益明显,少数极富有的个人掌握了全球大部分的财富资源。了解全球最富有个人的财富分布及其背后的行业和国家因素,对于分析全球经济趋…...

CSS中隐藏滚动条的同时保留滚动功能

在CSS中,我们可以通过一些技巧来隐藏滚动条,同时保留滚动功能。以下是几种常用的方法和具体的实现步骤。 1. 使用 overflow 和 ::-webkit-scrollbar 这种方法适用于大多数现代浏览器。通过设置 overflow 属性启用滚动,同时利用 ::-webkit-s…...

我的标志:奇特的头像

<!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>与妖为邻</title><style>figu…...

中国空间计算产业链发展分析

2024中国空间计算产业链拆解 空间计算设备主要包括AR、VR、MR等终端设备。VR设备通常包括头戴式显示器&#xff08;VR头盔&#xff09;、手柄或追踪器等组件&#xff0c;用以完全封闭用户视野&#xff0c;营造虚拟环境体验。这些设备配备高分辨率显示屏、内置传感器和跟踪器。 …...

DAY14信息打点-JS 架构框架识别泄漏提取API 接口枚举FUZZ 爬虫插件项目

本课意义&#xff1a; 1.如何从表现中的JS提取价值信息 2.如何从地址中FUZZ提取未知的JS文件 3.如何从JS开放框架WebPack进行测试 一、JS 前端架构-识别&分析 在JS中寻找更多的URL地址&#xff0c;在JS代码逻辑&#xff08;加密算法、APIKey配置、验证逻辑&#xff09;中进…...

TS - tsconfig.json 和 tsconfig.node.json 的关系,如何在TS 中使用 JS 不报错

目录 1&#xff0c;前言2&#xff0c;二者关系2.1&#xff0c;使用 3&#xff0c;遇到的问题3.1&#xff0c;TS 中使用 JS 1&#xff0c;前言 通过 Vite 创建的 Vue3 TS 项目&#xff0c;根目录下会有 tsconfig.json 和 tsconfig.node.json 文件&#xff0c;并且存在引用关系…...

revisiting拉普拉斯模板

二维向量的二阶微分是Hessian矩阵&#xff0c;拉普拉斯算子是将两个独立的二阶微分求和&#xff0c;对二阶微分的近似。 我不认同冈萨雷斯的8邻域拉普拉斯模板。 MATLAB图像处理工具箱中fspecial函数’laplacian’参数给的拉普拉斯模板&#xff1a; 对于数字滤波器&#xff…...

深入分析计算机网络性能指标

速率带宽吞吐量时延时延带宽积往返时间RTT利用率丢包率图书推荐内容简介作者简介 速率 连接在计算机网络上的主机在数字信道上传送比特的速率&#xff0c;也称为比特率或数据率。 基本单位&#xff1a;bit/s&#xff08;b/s、bps&#xff09; 常用单位&#xff1a;kb/s&#x…...

pyflink 安装和测试

FPY Warning! 安装 apache-Flink # pip install apache-Flink -i https://pypi.tuna.tsinghua.edu.cn/simple/ Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple/ Collecting apache-FlinkDownloading https://pypi.tuna.tsinghua.edu.cn/packages/7f/a3/ad502…...

《网络故障处理案例:公司网络突然中断》

网络故障处理案例&#xff1a;公司网络突然中断 一、故障背景 某工作日上午&#xff0c;一家拥有 500 名员工的公司突然出现整个网络中断的情况。员工们无法访问互联网、内部服务器和共享文件&#xff0c;严重影响了工作效率。 二、故障现象 1. 所有员工的电脑…...

JavaSE:9、数组

1、一维数组 初始化 import com.test.*;public class Main {public static void main(String [] argv){int a[]{1,2};int b[]new int[]{1,0,2};// int b[]new int[3]{1,2,3}; ERROR 要么指定长度要么大括号里初始化数据算长度int[] c{1,2};int d[]new int[10];} }基本类型…...

【裸机装机系列】2.kali(ubuntu)-裸机安装kali并进行磁盘分区-2024.9最新

【前言】 2024年为什么弃用ubuntu,请参考我写的另一篇博文&#xff1a;为什么不用ubuntu&#xff0c;而选择基于debian的kali操作系统-2024.9最新 【镜像下载】 1、镜像下载地址 https://www.kali.org/get-kali/选择installer-image&#xff0c;进入界面下载相应的ISO文件 我…...

解决:Vue 中 debugger 不生效

目录 1&#xff0c;问题2&#xff0c;解决2.1&#xff0c;修改 webpack 配置2.2&#xff0c;修改浏览器设置 1&#xff0c;问题 在 Vue 项目中&#xff0c;可以使用 debugger 在浏览器中开启调试。但有时却不生效。 2&#xff0c;解决 2.1&#xff0c;修改 webpack 配置 通…...

Mac笔记本上查看/user/目录下的文件的几种方法

在Mac笔记本上查看/user/下的文件&#xff0c;可以通过多种方法实现。以下是一些常见的方法&#xff1a; 一、使用Finder 打开Finder&#xff1a;点击Dock栏中的Finder图标&#xff0c;或者使用快捷键Command F。 导航到用户目录&#xff1a; 在Finder的菜单栏中&#xff0…...

工程师 - ACPI和ACPICA的区别

ACPI&#xff08;高级配置和电源接口&#xff09;和 ACPICA&#xff08;ACPI 组件架构&#xff09;密切相关&#xff0c;但在系统电源管理和配置方面却有不同的作用。以下是它们的区别&#xff1a; ACPI&#xff08;高级配置和电源接口&#xff09; - 定义&#xff1a; ACPI 是…...

一文快速上手-create-vue脚手架

文章目录 初识 create-vuecreate-vue新建项目Vue.js 3 项目目录结构项目的运行和打包vite.config.js文件解析其他&#xff1a;webpack和Vite的区别 初识 create-vue create-vue类似于Vue CLI脚手架&#xff0c;可以快速创建vuejs 3项目&#xff0c;create-vue基于Vite。Vite支…...

笔记整理—内核!启动!—kernel部分(7)rcs文件和登录部分与密码解析

该文件的位置在/etc/init.d/rcs&#xff0c;前文说过这个是一个配置文件&#xff0c;最开始的地方首先就是PATH相关的用export导出相关的PATH做环境变量&#xff0c;将可执行路径导为PATH执行时就不用写全路径了&#xff0c;该位置的PATH路径导出了/bin、/sbin、/usr/bin、/usr…...

朴素贝叶斯 (Naive Bayes)

朴素贝叶斯 (Naive Bayes) 通俗易懂算法 朴素贝叶斯&#xff08;Naive Bayes&#xff09;是一种基于概率统计的分类算法。它的核心思想是通过特征的条件独立性假设来简化计算复杂度&#xff0c;将复杂的联合概率分布分解为特征的独立概率分布之积。 基本思想 朴素贝叶斯基于…...

高德2.0 多边形覆盖物无法选中编辑

多边形覆盖物无法选中编辑。先检查一下数据的类型得是<number[]>,里面是字符串的虽然显示没问题&#xff0c;但是不能选中编辑。 &#xff08;在项目中排查了加载时机&#xff0c;事件监听…等等种种原因&#xff0c;就是没发现问题。突然想到可能是数据就有问题&#xf…...

时序最佳入门代码|基于pytorch的LSTM天气预测及数据分析

前言 在本篇文章&#xff0c;我们基于pytorch框架&#xff0c;构造了LSTM模型进行天气预测&#xff0c;并对数据进行了可视化分析&#xff0c;非常值得入门学习。该数据集提供了2013年1月1日至2017年4月24日在印度德里市的数据。其中包含的4个参数是平均温度&#xff08;meant…...

使用VSCode开发Django指南

使用VSCode开发Django指南 一、概述 Django 是一个高级 Python 框架&#xff0c;专为快速、安全和可扩展的 Web 开发而设计。Django 包含对 URL 路由、页面模板和数据处理的丰富支持。 本文将创建一个简单的 Django 应用&#xff0c;其中包含三个使用通用基本模板的页面。在此…...

java 实现excel文件转pdf | 无水印 | 无限制

文章目录 目录 文章目录 前言 1.项目远程仓库配置 2.pom文件引入相关依赖 3.代码破解 二、Excel转PDF 1.代码实现 2.Aspose.License.xml 授权文件 总结 前言 java处理excel转pdf一直没找到什么好用的免费jar包工具,自己手写的难度,恐怕高级程序员花费一年的事件,也…...

反射获取方法和属性

Java反射获取方法 在Java中&#xff0c;反射&#xff08;Reflection&#xff09;是一种强大的机制&#xff0c;允许程序在运行时访问和操作类的内部属性和方法。通过反射&#xff0c;可以动态地创建对象、调用方法、改变属性值&#xff0c;这在很多Java框架中如Spring和Hiberna…...

【配置 YOLOX 用于按目录分类的图片数据集】

现在的图标点选越来越多&#xff0c;如何一步解决&#xff0c;采用 YOLOX 目标检测模式则可以轻松解决 要在 YOLOX 中使用按目录分类的图片数据集&#xff08;每个目录代表一个类别&#xff0c;目录下是该类别的所有图片&#xff09;&#xff0c;你需要进行以下配置步骤&#x…...

css3笔记 (1) 自用

outline: none 用于移除元素获得焦点时默认的轮廓线 broder:0 用于移除边框 font-size&#xff1a;0 用于设置字体不显示 list-style: none 消除<li> 标签默认样式 margin: xx auto 版心居中 width:100% 通栏 vertical-align 作用于行内元素 / 表格单元格&#xff…...

vue3+vite项目中使用.env文件环境变量方法

vue3vite项目中使用.env文件环境变量方法 .env文件作用命名规则常用的配置项示例使用方法注意事项在vite.config.js文件中读取环境变量方法 .env文件作用 .env 文件用于定义环境变量&#xff0c;这些变量可以在项目中通过 import.meta.env 进行访问。Vite 会自动加载这些环境变…...

均衡后的SNRSINR

本文主要摘自参考文献中的前两篇&#xff0c;相关文献中经常会出现MIMO检测后的SINR不过一直没有找到相关数学推到过程&#xff0c;其中文献[1]中给出了相关原理在此仅做记录。 1. 系统模型 复信道模型 n t n_t nt​ 根发送天线&#xff0c; n r n_r nr​ 根接收天线的 MIMO 系…...

Java线上CPU飙高问题排查全指南

一、引言 在Java应用的线上运行环境中&#xff0c;CPU飙高是一个常见且棘手的性能问题。当系统出现CPU飙高时&#xff0c;通常会导致应用响应缓慢&#xff0c;甚至服务不可用&#xff0c;严重影响用户体验和业务运行。因此&#xff0c;掌握一套科学有效的CPU飙高问题排查方法&…...

Python ROS2【机器人中间件框架】 简介

销量过万TEEIS德国护膝夏天用薄款 优惠券冠生园 百花蜂蜜428g 挤压瓶纯蜂蜜巨奇严选 鞋子除臭剂360ml 多芬身体磨砂膏280g健70%-75%酒精消毒棉片湿巾1418cm 80片/袋3袋大包清洁食品用消毒 优惠券AIMORNY52朵红玫瑰永生香皂花同城配送非鲜花七夕情人节生日礼物送女友 热卖妙洁棉…...

让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比

在机器学习的回归分析中&#xff0c;损失函数的选择对模型性能具有决定性影响。均方误差&#xff08;MSE&#xff09;作为经典的损失函数&#xff0c;在处理干净数据时表现优异&#xff0c;但在面对包含异常值的噪声数据时&#xff0c;其对大误差的二次惩罚机制往往导致模型参数…...