当前位置: 首页 > news >正文

Python数据分析-世界上最富有的1000人

一、研究背景

随着全球化的加速发展和技术的进步,财富分配问题日益成为全球关注的焦点。财富的不平等现象日益明显,少数极富有的个人掌握了全球大部分的财富资源。了解全球最富有个人的财富分布及其背后的行业和国家因素,对于分析全球经济趋势、财富积累路径及行业发展具有重要意义。

本研究基于截至 2023 年全球前 1000 名最富有的个人的数据,分析了这些亿万富翁的财富来源、财富积累的行业分布、以及财富与国家或地区的关系。通过对这些数据的分析,可以帮助我们深入了解全球财富分配的现状,探索在全球经济体系中哪些行业最有可能产生巨额财富,并了解各国经济发展对个人财富积累的影响。

此外,随着数字经济、科技行业的迅速崛起,以及传统制造业、金融业的持续发展,本研究还将探索不同经济周期和全球化进程对财富分布的影响,从而为政策制定者、经济学家和企业家提供决策参考。

二、研究意义

研究全球前 1000 名最富有个人的财富分布及其背后的因素具有以下几个重要意义:

  1. 揭示全球财富不平等的现状:通过分析这些亿万富翁的净资产及其地理分布,可以直观地反映出全球财富集中度的情况,有助于理解财富不平等的宏观背景。

  2. 行业和地区的财富积累特点:通过对这些个人主要业务行业的分析,可以揭示哪些行业在当前经济中最有可能产生巨额财富,帮助投资者、企业家及政策制定者把握经济机遇。此外,分析这些个人的国家/地区分布,有助于理解各国经济政策、产业结构与财富积累的关联性。

  3. 为政策制定提供依据:通过研究财富分布情况,政策制定者可以更好地理解当前经济体系中的优势和问题,从而制定更有效的政策以缩小财富差距,促进社会公平与包容性增长。

  4. 揭示财富积累背后的产业变迁:通过长期跟踪亿万富翁的财富积累,可以帮助学术界和行业从业者了解全球产业结构的变化,从而预测未来最有可能积累财富的行业发展趋势。

三、实证分析

该数据集提供了截至 2023 年全球前 1000 名最富有的个人的详细快照。对于任何有兴趣了解全球财富分配、培养最富有个人的行业以及他们所在的国家/地区的人来说,此数据集都是宝贵的资源。它包括有关每个人的净资产、他们的主要商业利益和他们的居住国的重要信息。Top_1000_wealthiest_people.csv

代码和数据

数据概览 该数据集由 5 个关键列组成,提供对全球亿万富翁财务状况的全面见解:

名字:此列列出了每个人的全名。它对于确定谁是最富有的 1000 人至关重要。

国家:这显示了个人居住的国家/地区或其主要业务运营所在的国家/地区。它有助于了解财富的地理分布。

工业:此列标识个人积累财富的主要行业或部门。这些信息提供了关于哪些行业最有利可图的财富的见解。

净资产(以十亿计):本专栏报告每个人的估计净资产,以数十亿美元表示。它反映了他们财富的财务规模。

公司:这将列出与每个人关联的主要公司或企业。它突出了他们积累财富的主要企业。

导入代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

读取数据

df=pd.read_csv("Top_1000_wealthiest_people.csv")
df.head()

 

查看数据形状

df.info()

 

检查一下缺失值

df.isna().sum()

# 绘制每个数值特征的直方图

绘制每个数值特征的箱形图

for feature in numeric_features:plt.figure(figsize=(10, 6))sns.boxplot(x=df[feature])plt.title(f'Box Plot of {feature}')plt.xlabel(feature)plt.show()

全球净财富top10 

top_10_richest = df.nlargest(10,"net_worth")
top_10_richest

 

绘制行业分布图 

plt.figure(figsize=(8,6))
industry_count = df['Industry'].value_counts()
sns.barplot(y=industry_count.index ,x=industry_count.values, palette='cividis')
plt.title('industry distubution')
plt.xlabel('no of people')
plt.ylabel('industry')
plt.show()

绘制国家/地区的分布 

 绘制按行业划分的平均净资产 

plt.figure(figsize=(8,6))
industry_net_worth=df.groupby('Industry')['net_worth'].mean().sort_values()
sns.barplot(y=industry_net_worth.index,x=industry_net_worth.values,palette='viridis')
plt.title('Average Net Worth by Industry')
plt.xlabel('Average Net Worth (in billions)')
plt.ylabel('Industry')
plt.show()

按国家绘制平均净资产 

plt.figure(figsize=(8,6))
country_net_worth=df.groupby('Country')['net_worth'].mean().sort_values(ascending=False)
sns.barplot(y=country_net_worth.index,x=country_net_worth.values,palette='plasma')
plt.title('Top 10 Countries by Average Net Worth')
plt.xlabel('Average Net Worth (in billions)')
plt.ylabel('Country')
plt.show()

计算混淆矩阵

按国家和行业划分的净资产箱线图

plt.figure(figsize=(15, 10))
sns.boxplot(data=df,x='Country',y='net_worth',hue='Industry')
plt.title('Net Worth Distribution by Country and Industry')
plt.xlabel('Country')
plt.ylabel('Net Worth (in billions)')
plt.legend(loc='upper right')
plt.show()

 

按国家/地区查找首富

richest_by_country=df.loc[df.groupby('Country')['net_worth'].idxmax()]
richest_by_country

 

richest_by_industry=df.loc[df.groupby('Industry')['net_worth'].idxmax()]
richest_by_industry

按行业寻找首富

绘制代表性最多的前 5 家公司

plt.figure(figsize=(12, 8))
top_companies = df['Company'].value_counts().head(5)
sns.barplot(y=top_companies.index, x=top_companies.values, palette='cubehelix')
plt.title('Top 5 Companies with the Most Representatives')
plt.xlabel('Number of Representatives')
plt.ylabel('Company')
plt.show()

 绘制代表最多的前 10 个国家

plt.figure(figsize=(12, 8))
top_countries =df['Country'].value_counts().head(10)
sns.barplot(y=top_countries.index, x=top_countries.values, palette='plasma')
plt.title('Top 10 Countries with the Most Representatives')
plt.xlabel('Number of Representatives')
plt.ylabel('Country')
plt.show()

绘制按行业划分的净资产分布 

plt.figure(figsize=(12, 8))
sns.boxplot(y='Industry', x='net_worth', data=df, palette='muted')
plt.title('Distribution of Net Worth by Industry')
plt.xlabel('Net Worth (in billions)')
plt.ylabel('Industry')
plt.show()

 绘制按国家/地区划分的净资产分布

plt.figure(figsize=(12, 8))
top_countries_net_worth = df[df['Country'].isin(df['Country'].value_counts().head(10).index)]
sns.boxplot(y='Country', x='net_worth', data=top_countries_net_worth, palette='Set3')
plt.title('Distribution of Net Worth by Country')
plt.xlabel('Net Worth (in billions)')
plt.ylabel('Country')
plt.show()

四、结论

通过对全球前 1000 名最富有个人的数据分析,本研究得出以下结论:

  1. 财富集中度极高:全球财富分配极不平衡,前 1000 名个人控制了全球极大比例的财富。财富集中于少数人手中,而这些个人往往通过特定的高利润行业获得了巨额财富。

  2. 科技和金融行业占据主导地位:从行业分布来看,科技行业和金融业是创造亿万富翁的主要来源,尤其是近年来科技公司快速崛起,带来了大量的财富积累。制造业、零售和资源行业也占据了一定比例,但总体上,现代高科技行业对财富的积累影响显著。

  3. 财富的地理分布不均衡:在地域分布上,欧美国家特别是美国和欧洲富豪的数量占据显著比例。这些地区拥有成熟的资本市场和先进的科技产业,是财富积累的核心地带。相比之下,亚洲国家,特别是中国的亿万富翁数量快速增长,反映了新兴市场的经济快速发展和全球经济重心的转移。

  4. 亿万富翁主要通过企业积累财富:数据表明,大多数亿万富翁的财富积累来源于他们在相关企业中的股权,尤其是他们创立或参与领导的大型企业。这也突显了企业创新、市场化运作在财富积累中的重要性。

本研究为理解全球财富分布及其行业和地域特点提供了宝贵的洞见,对于未来全球财富格局的变化及其背后的经济驱动因素有重要参考价值。

相关文章:

Python数据分析-世界上最富有的1000人

一、研究背景 随着全球化的加速发展和技术的进步,财富分配问题日益成为全球关注的焦点。财富的不平等现象日益明显,少数极富有的个人掌握了全球大部分的财富资源。了解全球最富有个人的财富分布及其背后的行业和国家因素,对于分析全球经济趋…...

CSS中隐藏滚动条的同时保留滚动功能

在CSS中,我们可以通过一些技巧来隐藏滚动条,同时保留滚动功能。以下是几种常用的方法和具体的实现步骤。 1. 使用 overflow 和 ::-webkit-scrollbar 这种方法适用于大多数现代浏览器。通过设置 overflow 属性启用滚动,同时利用 ::-webkit-s…...

我的标志:奇特的头像

<!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>与妖为邻</title><style>figu…...

中国空间计算产业链发展分析

2024中国空间计算产业链拆解 空间计算设备主要包括AR、VR、MR等终端设备。VR设备通常包括头戴式显示器&#xff08;VR头盔&#xff09;、手柄或追踪器等组件&#xff0c;用以完全封闭用户视野&#xff0c;营造虚拟环境体验。这些设备配备高分辨率显示屏、内置传感器和跟踪器。 …...

DAY14信息打点-JS 架构框架识别泄漏提取API 接口枚举FUZZ 爬虫插件项目

本课意义&#xff1a; 1.如何从表现中的JS提取价值信息 2.如何从地址中FUZZ提取未知的JS文件 3.如何从JS开放框架WebPack进行测试 一、JS 前端架构-识别&分析 在JS中寻找更多的URL地址&#xff0c;在JS代码逻辑&#xff08;加密算法、APIKey配置、验证逻辑&#xff09;中进…...

TS - tsconfig.json 和 tsconfig.node.json 的关系,如何在TS 中使用 JS 不报错

目录 1&#xff0c;前言2&#xff0c;二者关系2.1&#xff0c;使用 3&#xff0c;遇到的问题3.1&#xff0c;TS 中使用 JS 1&#xff0c;前言 通过 Vite 创建的 Vue3 TS 项目&#xff0c;根目录下会有 tsconfig.json 和 tsconfig.node.json 文件&#xff0c;并且存在引用关系…...

revisiting拉普拉斯模板

二维向量的二阶微分是Hessian矩阵&#xff0c;拉普拉斯算子是将两个独立的二阶微分求和&#xff0c;对二阶微分的近似。 我不认同冈萨雷斯的8邻域拉普拉斯模板。 MATLAB图像处理工具箱中fspecial函数’laplacian’参数给的拉普拉斯模板&#xff1a; 对于数字滤波器&#xff…...

深入分析计算机网络性能指标

速率带宽吞吐量时延时延带宽积往返时间RTT利用率丢包率图书推荐内容简介作者简介 速率 连接在计算机网络上的主机在数字信道上传送比特的速率&#xff0c;也称为比特率或数据率。 基本单位&#xff1a;bit/s&#xff08;b/s、bps&#xff09; 常用单位&#xff1a;kb/s&#x…...

pyflink 安装和测试

FPY Warning! 安装 apache-Flink # pip install apache-Flink -i https://pypi.tuna.tsinghua.edu.cn/simple/ Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple/ Collecting apache-FlinkDownloading https://pypi.tuna.tsinghua.edu.cn/packages/7f/a3/ad502…...

《网络故障处理案例:公司网络突然中断》

网络故障处理案例&#xff1a;公司网络突然中断 一、故障背景 某工作日上午&#xff0c;一家拥有 500 名员工的公司突然出现整个网络中断的情况。员工们无法访问互联网、内部服务器和共享文件&#xff0c;严重影响了工作效率。 二、故障现象 1. 所有员工的电脑…...

JavaSE:9、数组

1、一维数组 初始化 import com.test.*;public class Main {public static void main(String [] argv){int a[]{1,2};int b[]new int[]{1,0,2};// int b[]new int[3]{1,2,3}; ERROR 要么指定长度要么大括号里初始化数据算长度int[] c{1,2};int d[]new int[10];} }基本类型…...

【裸机装机系列】2.kali(ubuntu)-裸机安装kali并进行磁盘分区-2024.9最新

【前言】 2024年为什么弃用ubuntu,请参考我写的另一篇博文&#xff1a;为什么不用ubuntu&#xff0c;而选择基于debian的kali操作系统-2024.9最新 【镜像下载】 1、镜像下载地址 https://www.kali.org/get-kali/选择installer-image&#xff0c;进入界面下载相应的ISO文件 我…...

解决:Vue 中 debugger 不生效

目录 1&#xff0c;问题2&#xff0c;解决2.1&#xff0c;修改 webpack 配置2.2&#xff0c;修改浏览器设置 1&#xff0c;问题 在 Vue 项目中&#xff0c;可以使用 debugger 在浏览器中开启调试。但有时却不生效。 2&#xff0c;解决 2.1&#xff0c;修改 webpack 配置 通…...

Mac笔记本上查看/user/目录下的文件的几种方法

在Mac笔记本上查看/user/下的文件&#xff0c;可以通过多种方法实现。以下是一些常见的方法&#xff1a; 一、使用Finder 打开Finder&#xff1a;点击Dock栏中的Finder图标&#xff0c;或者使用快捷键Command F。 导航到用户目录&#xff1a; 在Finder的菜单栏中&#xff0…...

工程师 - ACPI和ACPICA的区别

ACPI&#xff08;高级配置和电源接口&#xff09;和 ACPICA&#xff08;ACPI 组件架构&#xff09;密切相关&#xff0c;但在系统电源管理和配置方面却有不同的作用。以下是它们的区别&#xff1a; ACPI&#xff08;高级配置和电源接口&#xff09; - 定义&#xff1a; ACPI 是…...

一文快速上手-create-vue脚手架

文章目录 初识 create-vuecreate-vue新建项目Vue.js 3 项目目录结构项目的运行和打包vite.config.js文件解析其他&#xff1a;webpack和Vite的区别 初识 create-vue create-vue类似于Vue CLI脚手架&#xff0c;可以快速创建vuejs 3项目&#xff0c;create-vue基于Vite。Vite支…...

笔记整理—内核!启动!—kernel部分(7)rcs文件和登录部分与密码解析

该文件的位置在/etc/init.d/rcs&#xff0c;前文说过这个是一个配置文件&#xff0c;最开始的地方首先就是PATH相关的用export导出相关的PATH做环境变量&#xff0c;将可执行路径导为PATH执行时就不用写全路径了&#xff0c;该位置的PATH路径导出了/bin、/sbin、/usr/bin、/usr…...

朴素贝叶斯 (Naive Bayes)

朴素贝叶斯 (Naive Bayes) 通俗易懂算法 朴素贝叶斯&#xff08;Naive Bayes&#xff09;是一种基于概率统计的分类算法。它的核心思想是通过特征的条件独立性假设来简化计算复杂度&#xff0c;将复杂的联合概率分布分解为特征的独立概率分布之积。 基本思想 朴素贝叶斯基于…...

高德2.0 多边形覆盖物无法选中编辑

多边形覆盖物无法选中编辑。先检查一下数据的类型得是<number[]>,里面是字符串的虽然显示没问题&#xff0c;但是不能选中编辑。 &#xff08;在项目中排查了加载时机&#xff0c;事件监听…等等种种原因&#xff0c;就是没发现问题。突然想到可能是数据就有问题&#xf…...

时序最佳入门代码|基于pytorch的LSTM天气预测及数据分析

前言 在本篇文章&#xff0c;我们基于pytorch框架&#xff0c;构造了LSTM模型进行天气预测&#xff0c;并对数据进行了可视化分析&#xff0c;非常值得入门学习。该数据集提供了2013年1月1日至2017年4月24日在印度德里市的数据。其中包含的4个参数是平均温度&#xff08;meant…...

后进先出(LIFO)详解

LIFO 是 Last In, First Out 的缩写&#xff0c;中文译为后进先出。这是一种数据结构的工作原则&#xff0c;类似于一摞盘子或一叠书本&#xff1a; 最后放进去的元素最先出来 -想象往筒状容器里放盘子&#xff1a; &#xff08;1&#xff09;你放进的最后一个盘子&#xff08…...

Admin.Net中的消息通信SignalR解释

定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...

STM32标准库-DMA直接存储器存取

文章目录 一、DMA1.1简介1.2存储器映像1.3DMA框图1.4DMA基本结构1.5DMA请求1.6数据宽度与对齐1.7数据转运DMA1.8ADC扫描模式DMA 二、数据转运DMA2.1接线图2.2代码2.3相关API 一、DMA 1.1简介 DMA&#xff08;Direct Memory Access&#xff09;直接存储器存取 DMA可以提供外设…...

376. Wiggle Subsequence

376. Wiggle Subsequence 代码 class Solution { public:int wiggleMaxLength(vector<int>& nums) {int n nums.size();int res 1;int prediff 0;int curdiff 0;for(int i 0;i < n-1;i){curdiff nums[i1] - nums[i];if( (prediff > 0 && curdif…...

如何理解 IP 数据报中的 TTL?

目录 前言理解 前言 面试灵魂一问&#xff1a;说说对 IP 数据报中 TTL 的理解&#xff1f;我们都知道&#xff0c;IP 数据报由首部和数据两部分组成&#xff0c;首部又分为两部分&#xff1a;固定部分和可变部分&#xff0c;共占 20 字节&#xff0c;而即将讨论的 TTL 就位于首…...

python报错No module named ‘tensorflow.keras‘

是由于不同版本的tensorflow下的keras所在的路径不同&#xff0c;结合所安装的tensorflow的目录结构修改from语句即可。 原语句&#xff1a; from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后&#xff1a; from tensorflow.python.keras.lay…...

NXP S32K146 T-Box 携手 SD NAND(贴片式TF卡):驱动汽车智能革新的黄金组合

在汽车智能化的汹涌浪潮中&#xff0c;车辆不再仅仅是传统的交通工具&#xff0c;而是逐步演变为高度智能的移动终端。这一转变的核心支撑&#xff0c;来自于车内关键技术的深度融合与协同创新。车载远程信息处理盒&#xff08;T-Box&#xff09;方案&#xff1a;NXP S32K146 与…...

视觉slam十四讲实践部分记录——ch2、ch3

ch2 一、使用g++编译.cpp为可执行文件并运行(P30) g++ helloSLAM.cpp ./a.out运行 二、使用cmake编译 mkdir build cd build cmake .. makeCMakeCache.txt 文件仍然指向旧的目录。这表明在源代码目录中可能还存在旧的 CMakeCache.txt 文件,或者在构建过程中仍然引用了旧的路…...

破解路内监管盲区:免布线低位视频桩重塑停车管理新标准

城市路内停车管理常因行道树遮挡、高位设备盲区等问题&#xff0c;导致车牌识别率低、逃费率高&#xff0c;传统模式在复杂路段束手无策。免布线低位视频桩凭借超低视角部署与智能算法&#xff0c;正成为破局关键。该设备安装于车位侧方0.5-0.7米高度&#xff0c;直接规避树枝遮…...

LangFlow技术架构分析

&#x1f527; LangFlow 的可视化技术栈 前端节点编辑器 底层框架&#xff1a;基于 &#xff08;一个现代化的 React 节点绘图库&#xff09; 功能&#xff1a; 拖拽式构建 LangGraph 状态机 实时连线定义节点依赖关系 可视化调试循环和分支逻辑 与 LangGraph 的深…...