Python数据分析-世界上最富有的1000人
一、研究背景
随着全球化的加速发展和技术的进步,财富分配问题日益成为全球关注的焦点。财富的不平等现象日益明显,少数极富有的个人掌握了全球大部分的财富资源。了解全球最富有个人的财富分布及其背后的行业和国家因素,对于分析全球经济趋势、财富积累路径及行业发展具有重要意义。
本研究基于截至 2023 年全球前 1000 名最富有的个人的数据,分析了这些亿万富翁的财富来源、财富积累的行业分布、以及财富与国家或地区的关系。通过对这些数据的分析,可以帮助我们深入了解全球财富分配的现状,探索在全球经济体系中哪些行业最有可能产生巨额财富,并了解各国经济发展对个人财富积累的影响。
此外,随着数字经济、科技行业的迅速崛起,以及传统制造业、金融业的持续发展,本研究还将探索不同经济周期和全球化进程对财富分布的影响,从而为政策制定者、经济学家和企业家提供决策参考。
二、研究意义
研究全球前 1000 名最富有个人的财富分布及其背后的因素具有以下几个重要意义:
-
揭示全球财富不平等的现状:通过分析这些亿万富翁的净资产及其地理分布,可以直观地反映出全球财富集中度的情况,有助于理解财富不平等的宏观背景。
-
行业和地区的财富积累特点:通过对这些个人主要业务行业的分析,可以揭示哪些行业在当前经济中最有可能产生巨额财富,帮助投资者、企业家及政策制定者把握经济机遇。此外,分析这些个人的国家/地区分布,有助于理解各国经济政策、产业结构与财富积累的关联性。
-
为政策制定提供依据:通过研究财富分布情况,政策制定者可以更好地理解当前经济体系中的优势和问题,从而制定更有效的政策以缩小财富差距,促进社会公平与包容性增长。
-
揭示财富积累背后的产业变迁:通过长期跟踪亿万富翁的财富积累,可以帮助学术界和行业从业者了解全球产业结构的变化,从而预测未来最有可能积累财富的行业发展趋势。
三、实证分析
该数据集提供了截至 2023 年全球前 1000 名最富有的个人的详细快照。对于任何有兴趣了解全球财富分配、培养最富有个人的行业以及他们所在的国家/地区的人来说,此数据集都是宝贵的资源。它包括有关每个人的净资产、他们的主要商业利益和他们的居住国的重要信息。Top_1000_wealthiest_people.csv
代码和数据
数据概览 该数据集由 5 个关键列组成,提供对全球亿万富翁财务状况的全面见解:
名字:此列列出了每个人的全名。它对于确定谁是最富有的 1000 人至关重要。
国家:这显示了个人居住的国家/地区或其主要业务运营所在的国家/地区。它有助于了解财富的地理分布。
工业:此列标识个人积累财富的主要行业或部门。这些信息提供了关于哪些行业最有利可图的财富的见解。
净资产(以十亿计):本专栏报告每个人的估计净资产,以数十亿美元表示。它反映了他们财富的财务规模。
公司:这将列出与每个人关联的主要公司或企业。它突出了他们积累财富的主要企业。
导入代码
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
读取数据
df=pd.read_csv("Top_1000_wealthiest_people.csv")
df.head()
查看数据形状
df.info()
检查一下缺失值
df.isna().sum()
# 绘制每个数值特征的直方图
绘制每个数值特征的箱形图
for feature in numeric_features:plt.figure(figsize=(10, 6))sns.boxplot(x=df[feature])plt.title(f'Box Plot of {feature}')plt.xlabel(feature)plt.show()
全球净财富top10
top_10_richest = df.nlargest(10,"net_worth")
top_10_richest
绘制行业分布图
plt.figure(figsize=(8,6))
industry_count = df['Industry'].value_counts()
sns.barplot(y=industry_count.index ,x=industry_count.values, palette='cividis')
plt.title('industry distubution')
plt.xlabel('no of people')
plt.ylabel('industry')
plt.show()
绘制国家/地区的分布
绘制按行业划分的平均净资产
plt.figure(figsize=(8,6))
industry_net_worth=df.groupby('Industry')['net_worth'].mean().sort_values()
sns.barplot(y=industry_net_worth.index,x=industry_net_worth.values,palette='viridis')
plt.title('Average Net Worth by Industry')
plt.xlabel('Average Net Worth (in billions)')
plt.ylabel('Industry')
plt.show()
按国家绘制平均净资产
plt.figure(figsize=(8,6))
country_net_worth=df.groupby('Country')['net_worth'].mean().sort_values(ascending=False)
sns.barplot(y=country_net_worth.index,x=country_net_worth.values,palette='plasma')
plt.title('Top 10 Countries by Average Net Worth')
plt.xlabel('Average Net Worth (in billions)')
plt.ylabel('Country')
plt.show()
计算混淆矩阵
按国家和行业划分的净资产箱线图
plt.figure(figsize=(15, 10))
sns.boxplot(data=df,x='Country',y='net_worth',hue='Industry')
plt.title('Net Worth Distribution by Country and Industry')
plt.xlabel('Country')
plt.ylabel('Net Worth (in billions)')
plt.legend(loc='upper right')
plt.show()
按国家/地区查找首富
richest_by_country=df.loc[df.groupby('Country')['net_worth'].idxmax()]
richest_by_country
richest_by_industry=df.loc[df.groupby('Industry')['net_worth'].idxmax()]
richest_by_industry
按行业寻找首富
绘制代表性最多的前 5 家公司
plt.figure(figsize=(12, 8))
top_companies = df['Company'].value_counts().head(5)
sns.barplot(y=top_companies.index, x=top_companies.values, palette='cubehelix')
plt.title('Top 5 Companies with the Most Representatives')
plt.xlabel('Number of Representatives')
plt.ylabel('Company')
plt.show()
绘制代表最多的前 10 个国家
plt.figure(figsize=(12, 8))
top_countries =df['Country'].value_counts().head(10)
sns.barplot(y=top_countries.index, x=top_countries.values, palette='plasma')
plt.title('Top 10 Countries with the Most Representatives')
plt.xlabel('Number of Representatives')
plt.ylabel('Country')
plt.show()
绘制按行业划分的净资产分布
plt.figure(figsize=(12, 8))
sns.boxplot(y='Industry', x='net_worth', data=df, palette='muted')
plt.title('Distribution of Net Worth by Industry')
plt.xlabel('Net Worth (in billions)')
plt.ylabel('Industry')
plt.show()
绘制按国家/地区划分的净资产分布
plt.figure(figsize=(12, 8))
top_countries_net_worth = df[df['Country'].isin(df['Country'].value_counts().head(10).index)]
sns.boxplot(y='Country', x='net_worth', data=top_countries_net_worth, palette='Set3')
plt.title('Distribution of Net Worth by Country')
plt.xlabel('Net Worth (in billions)')
plt.ylabel('Country')
plt.show()
四、结论
通过对全球前 1000 名最富有个人的数据分析,本研究得出以下结论:
-
财富集中度极高:全球财富分配极不平衡,前 1000 名个人控制了全球极大比例的财富。财富集中于少数人手中,而这些个人往往通过特定的高利润行业获得了巨额财富。
-
科技和金融行业占据主导地位:从行业分布来看,科技行业和金融业是创造亿万富翁的主要来源,尤其是近年来科技公司快速崛起,带来了大量的财富积累。制造业、零售和资源行业也占据了一定比例,但总体上,现代高科技行业对财富的积累影响显著。
-
财富的地理分布不均衡:在地域分布上,欧美国家特别是美国和欧洲富豪的数量占据显著比例。这些地区拥有成熟的资本市场和先进的科技产业,是财富积累的核心地带。相比之下,亚洲国家,特别是中国的亿万富翁数量快速增长,反映了新兴市场的经济快速发展和全球经济重心的转移。
-
亿万富翁主要通过企业积累财富:数据表明,大多数亿万富翁的财富积累来源于他们在相关企业中的股权,尤其是他们创立或参与领导的大型企业。这也突显了企业创新、市场化运作在财富积累中的重要性。
本研究为理解全球财富分布及其行业和地域特点提供了宝贵的洞见,对于未来全球财富格局的变化及其背后的经济驱动因素有重要参考价值。
相关文章:

Python数据分析-世界上最富有的1000人
一、研究背景 随着全球化的加速发展和技术的进步,财富分配问题日益成为全球关注的焦点。财富的不平等现象日益明显,少数极富有的个人掌握了全球大部分的财富资源。了解全球最富有个人的财富分布及其背后的行业和国家因素,对于分析全球经济趋…...
CSS中隐藏滚动条的同时保留滚动功能
在CSS中,我们可以通过一些技巧来隐藏滚动条,同时保留滚动功能。以下是几种常用的方法和具体的实现步骤。 1. 使用 overflow 和 ::-webkit-scrollbar 这种方法适用于大多数现代浏览器。通过设置 overflow 属性启用滚动,同时利用 ::-webkit-s…...

我的标志:奇特的头像
<!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>与妖为邻</title><style>figu…...

中国空间计算产业链发展分析
2024中国空间计算产业链拆解 空间计算设备主要包括AR、VR、MR等终端设备。VR设备通常包括头戴式显示器(VR头盔)、手柄或追踪器等组件,用以完全封闭用户视野,营造虚拟环境体验。这些设备配备高分辨率显示屏、内置传感器和跟踪器。 …...

DAY14信息打点-JS 架构框架识别泄漏提取API 接口枚举FUZZ 爬虫插件项目
本课意义: 1.如何从表现中的JS提取价值信息 2.如何从地址中FUZZ提取未知的JS文件 3.如何从JS开放框架WebPack进行测试 一、JS 前端架构-识别&分析 在JS中寻找更多的URL地址,在JS代码逻辑(加密算法、APIKey配置、验证逻辑)中进…...

TS - tsconfig.json 和 tsconfig.node.json 的关系,如何在TS 中使用 JS 不报错
目录 1,前言2,二者关系2.1,使用 3,遇到的问题3.1,TS 中使用 JS 1,前言 通过 Vite 创建的 Vue3 TS 项目,根目录下会有 tsconfig.json 和 tsconfig.node.json 文件,并且存在引用关系…...

revisiting拉普拉斯模板
二维向量的二阶微分是Hessian矩阵,拉普拉斯算子是将两个独立的二阶微分求和,对二阶微分的近似。 我不认同冈萨雷斯的8邻域拉普拉斯模板。 MATLAB图像处理工具箱中fspecial函数’laplacian’参数给的拉普拉斯模板: 对于数字滤波器ÿ…...

深入分析计算机网络性能指标
速率带宽吞吐量时延时延带宽积往返时间RTT利用率丢包率图书推荐内容简介作者简介 速率 连接在计算机网络上的主机在数字信道上传送比特的速率,也称为比特率或数据率。 基本单位:bit/s(b/s、bps) 常用单位:kb/s&#x…...

pyflink 安装和测试
FPY Warning! 安装 apache-Flink # pip install apache-Flink -i https://pypi.tuna.tsinghua.edu.cn/simple/ Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple/ Collecting apache-FlinkDownloading https://pypi.tuna.tsinghua.edu.cn/packages/7f/a3/ad502…...
《网络故障处理案例:公司网络突然中断》
网络故障处理案例:公司网络突然中断 一、故障背景 某工作日上午,一家拥有 500 名员工的公司突然出现整个网络中断的情况。员工们无法访问互联网、内部服务器和共享文件,严重影响了工作效率。 二、故障现象 1. 所有员工的电脑…...
JavaSE:9、数组
1、一维数组 初始化 import com.test.*;public class Main {public static void main(String [] argv){int a[]{1,2};int b[]new int[]{1,0,2};// int b[]new int[3]{1,2,3}; ERROR 要么指定长度要么大括号里初始化数据算长度int[] c{1,2};int d[]new int[10];} }基本类型…...

【裸机装机系列】2.kali(ubuntu)-裸机安装kali并进行磁盘分区-2024.9最新
【前言】 2024年为什么弃用ubuntu,请参考我写的另一篇博文:为什么不用ubuntu,而选择基于debian的kali操作系统-2024.9最新 【镜像下载】 1、镜像下载地址 https://www.kali.org/get-kali/选择installer-image,进入界面下载相应的ISO文件 我…...

解决:Vue 中 debugger 不生效
目录 1,问题2,解决2.1,修改 webpack 配置2.2,修改浏览器设置 1,问题 在 Vue 项目中,可以使用 debugger 在浏览器中开启调试。但有时却不生效。 2,解决 2.1,修改 webpack 配置 通…...

Mac笔记本上查看/user/目录下的文件的几种方法
在Mac笔记本上查看/user/下的文件,可以通过多种方法实现。以下是一些常见的方法: 一、使用Finder 打开Finder:点击Dock栏中的Finder图标,或者使用快捷键Command F。 导航到用户目录: 在Finder的菜单栏中࿰…...
工程师 - ACPI和ACPICA的区别
ACPI(高级配置和电源接口)和 ACPICA(ACPI 组件架构)密切相关,但在系统电源管理和配置方面却有不同的作用。以下是它们的区别: ACPI(高级配置和电源接口) - 定义: ACPI 是…...
一文快速上手-create-vue脚手架
文章目录 初识 create-vuecreate-vue新建项目Vue.js 3 项目目录结构项目的运行和打包vite.config.js文件解析其他:webpack和Vite的区别 初识 create-vue create-vue类似于Vue CLI脚手架,可以快速创建vuejs 3项目,create-vue基于Vite。Vite支…...
笔记整理—内核!启动!—kernel部分(7)rcs文件和登录部分与密码解析
该文件的位置在/etc/init.d/rcs,前文说过这个是一个配置文件,最开始的地方首先就是PATH相关的用export导出相关的PATH做环境变量,将可执行路径导为PATH执行时就不用写全路径了,该位置的PATH路径导出了/bin、/sbin、/usr/bin、/usr…...
朴素贝叶斯 (Naive Bayes)
朴素贝叶斯 (Naive Bayes) 通俗易懂算法 朴素贝叶斯(Naive Bayes)是一种基于概率统计的分类算法。它的核心思想是通过特征的条件独立性假设来简化计算复杂度,将复杂的联合概率分布分解为特征的独立概率分布之积。 基本思想 朴素贝叶斯基于…...

高德2.0 多边形覆盖物无法选中编辑
多边形覆盖物无法选中编辑。先检查一下数据的类型得是<number[]>,里面是字符串的虽然显示没问题,但是不能选中编辑。 (在项目中排查了加载时机,事件监听…等等种种原因,就是没发现问题。突然想到可能是数据就有问题…...

时序最佳入门代码|基于pytorch的LSTM天气预测及数据分析
前言 在本篇文章,我们基于pytorch框架,构造了LSTM模型进行天气预测,并对数据进行了可视化分析,非常值得入门学习。该数据集提供了2013年1月1日至2017年4月24日在印度德里市的数据。其中包含的4个参数是平均温度(meant…...
数学建模期末速成 多目标规划
内容整理自2-6-2 运筹优化类-多目标规划模型Python版讲解_哔哩哔哩_bilibili 求有效解的几种常用方法 线性加权法√ 根据目标的重要性确定一个权重,以目标函数的加权平均值为评价函数,使其达到最优。ɛ约束法 根据决策者的偏好,选择一个主要…...
Oracle数据库事务学习
目录 一、什么是事务,事务的作用是什么 二、事务的四大特性(ACID) 1. 原子性(Atomicity) 2. 一致性(Consistency) 3. 隔离性(Isolation) 4. 持久性(Durability) 三、关于锁的概念——表锁、行锁、死锁、乐观/悲观锁、 1.行锁 2.表锁 3.死锁 4.乐观锁 5.…...

Jmeter逻辑控制器、定时器
目录 一、Jmeter逻辑控制器 ①IF(如果)控制器 作用: 位置: 参数介绍: 步骤: ②循环控制器 作用: 位置: 步骤: 线程组属性VS循环控制器 ③ForEach控制器 作用: 位置&am…...
IP Search Performance Tests dat/db/xdb/mmdb 结构性能差异对比
IP Search Performance Tests qqzeng-ip by 2025-06-01 测试环境: BenchmarkDotNet v0.15.0 macOS Sequoia 15.5 (24F74) [Darwin 24.5.0] Apple M4 Max, 1 CPU, 14 logical and 14 physical cores .NET SDK 10.0.100-preview.4.25258.110 [Host]: .NET…...

【nssctf第三题】[NSSCTF 2022 Spring Recruit]easy C
这是题目,下载附件打开是个C文件 #include <stdio.h> #include <string.h>int main(){char a[]"wwwwwww";char b[]"dvxbQd";//try to find out the flagprintf("please input flag:");scanf(" %s",&a);if…...

【计算机网络】第3章:传输层—面向连接的传输:TCP
目录 一、PPT 二、总结 TCP(传输控制协议)详解 1. 概述 核心特性: 2. TCP报文段结构 关键字段说明: 3. TCP连接管理 3.1 三次握手(建立连接) 3.2 四次挥手(终止连接) 4. 可…...
贪心算法求解汽车加油问题
一、问题描述 一辆汽车加满油后可以行驶 n km。在前往目的地的途中,有多个加油站。我们的目标是设计一个有效的算法,确定汽车应该在哪些加油站停靠加油,以使得沿途的加油次数最少。 二、输入输出形式 算法的输入包括两部分:第一…...

C++学习-入门到精通【12】文件处理
C学习-入门到精通【12】文件处理 目录 C学习-入门到精通【12】文件处理一、文件和流二、创建顺序文件三、从顺序文件读取数据文件定位指针对之前的程序进行修改:贷款查询程序 四、更新顺序文件五、随机存取文件1.创建随机存取文件2.修改程序:贷款处理程序…...
[git每日一句]Your branch is up to date with ‘origin/master‘
这句话是 Git 版本控制系统的提示信息,意思是: "你当前所在的分支已经与远程仓库(origin)的 master 分支同步,没有需要推送的提交。" 详细解释: Your branch - 指你当前所在的本地分支 is up …...

秋招Day12 - 计算机网络 - 基础
说一下计算机网络体系结构 OSI七层模型,TCP/IP四层模型和五层体系结构 说说OSI七层模型? 应用层:最靠近用户的层,用于处理特定应用程序的细节,提供了应用程序和网络服务之间的接口。表示层:确保从一个系…...