当前位置: 首页 > news >正文

打造出ChatGPT的,是怎样一群人?

震惊世界的ChatGPT,要多少人才能开发出来?几百,还是几千?

答案是:87个人。

老实说,刚看到这个数字真是惊到我了,印象里,之前看媒体报道各大巨头人工智能人才储备时,动辄都是几百上千人。

国内像百度,人工智能领域有上千人的规模,国外谷歌、Facebook也都差不多。但掀起这一轮AI浪潮的,却不是这些巨头,而是OpenAI,2015年才成立,刚开始只有十来个人,直到今年初也才只有300人左右。

这让我对这支团队极感兴趣——是什么原因,让这样一个不大的团队,引爆了这次AI革命?他们是怎样的一群人?

01 顶尖人才的力量

物理学家朗道说过这样一句话:一个一流的物理学家,水平是二流物理学家的10倍。

回顾科技史,我们必须要承认的一点是:在探索未知世界的道路上,最关键的突破往往由少数顶尖人才完成,人工智能领域同样如此。

这家公司虽然不大,却是大神云集——这是我看完一份关于OpenAI员工的报告后最大的感触。

来看下OpenAI的核心人员。

首先是CEO Sam Altman。

这哥们儿年纪不大,1985年出生于芝加哥,是个传奇人物:8岁会编程,高中就开始创建公司,斯坦福大学辍学后连续创业,27岁把自己的公司卖了4300万美元。

2015年的时候,Altman举办了一场关于人工智能的晚宴,讨论AI领域的现状、距离人类级的AI还有多远等话题,对AI一向很感兴趣的马斯克也受邀参加了。

Altman和马斯克一样,都是那种有着理想主义色彩的人,对于AI技术,俩人的想法和初衷是一致的:构建安全的人工智能以造福人类。

那次晚宴后不久,OpenAI应运而生。为了确保AI研究的”有益性“,几个创始人都认为:第一,它必须是非营利组织,以免有利益冲突影响AI使命;第二,必须保持在研究的最前沿。

可以说,Sam Altman 是OpenAI 这家公司从0到1的关键,正是这位老兄拉起了一支队伍,聚集起了一批志同道合的人才,给OpenAI的发展方向和战略定了基调。

不过,Sam Altman的工作重点在管理层面,如果从技术层面看的话,开发ChatGPT的核心人物是另一位技术大神——Ilya Sutskever,OpenAI的首席科学家,他也是公司联合创始人之一。

Ilya Sutskever 1985年出生于俄罗斯,当时苏联还没有解体,他们一家人居住在圣彼得堡。在苏联解体后的动荡岁月里,他们全家移民到了以色列,之后又到了加拿大多伦多。

Sutskever 从小对计算机和数学兴趣浓厚,后来在多伦多大学读计算机专业,大学期间他参加了多项国际机器学习竞赛。也是在那时候,他结识了好友Alex Krizhevsky(看名字就知道也是俄罗斯人),人工智能领域的另一个牛人。

读完博士后,Sutskever去了谷歌工作,参与了著名的“谷歌大脑”项目,开发了驱动 谷歌翻译的神经机器系统。他还获得过“麻省理工科技评论”评选的35岁以下科技精英,是人工智能领域的当红炸子鸡。

这样的大神显然是不会甘心一辈子给人打工的。

2015年,他与 Sam Altman、Greg Brockman等共同创立了 OpenAI。当时只有10来名员工,按照我们的标准,是一家名副其实的“小微公司”。

OpenAI 其他几位创始人曾这样评价Ilya Sutskever:

“Ilya 是技术基础的源泉,他是一位头脑清晰的技术专家,知识广博,视野开阔,并且总是能够深入到系统局限性和功能的具体细节。”

第三位,介绍一下OpenAI现在的首席技术官(CTO),Mira Murati。

这是位非常年轻的女性,1988年的,在人工智能圈子里还是比较罕见的。

和Ilya Sutskever 一样,Mira Murati 也不是土生土长的美国人。

她出生于阿尔巴尼亚(就是那个好莱坞电影中,经常产出犯罪集团的东欧国家),16岁时移民到加拿大,后来读大学考到了美国常春藤之一的达特茅斯学院,在那里读机械工程专业。

Mira Murati曾在特斯拉工作过三年,之后加入OpenAI,并很快做到了首席技术官的位置。她负责了监督ChatGPT的开发,尽管她并不是计算机专业出身,看来也是个能力极强的厉害角色。

核心管理层中,还有一位联合创始人Greg Brockman,也是个从大学时代就热衷创业的家伙。他原本不是AI领域的专家,但跟Sam Altman气味相投,被拉进创始团队中。

看起来,他们俩在OpenAI中的角色差不多,主要在组织管理层面,负责招兵买马扩大队伍、制定公司战略、企业文化之类。

这四个人,大概就是OpenAI几个最关键的灵魂人物了,他们从组织文化和技术两个层面,奠定了OpenAI成功的基础。

看下来,美帝不愧被调侃为“灯塔国”,目前在吸引顶级人才方面依然遥遥领先,这几个关键角色,两个是来自其他国家的新移民。

这里顺便提下俄罗斯。

俄罗斯人在数学和计算机领域颇有天赋,涌现出不少天才人物,但苏联解体后好多跑到了美国,为建设美帝添砖加瓦,像谷歌创始人之一谢尔盖·布林就是俄罗斯移民,任正非老爷子也常常让华为跑到俄罗斯抢人。

另外也说下华裔,ChatGPT中华裔比例占了10%左右,他们基本都毕业于斯坦福、清北、华科、香港大学等顶级名校。

02 年轻人的力量

OpenAI团队另外让我印象深刻的一点是:年轻。

平均年龄只有32岁,就连包括CEO在内的几个核心管理层也都是80后。开发ChatGPT的团队,30岁以下的有28人,40岁以下占了绝大多数。

我们传统印象里,一项重大科技突破,往往是“院士牵头,国家专项支持,多部门协调”等等,很难想象一群30出头的毛头小子能搞出什么改变世界的大动作。

这有点让我想起20世纪上半叶的物理大爆发时代,爱因斯坦26岁提出相对论,居里夫人30岁发现钋和镭,杨振宁35岁获得诺贝尔物理学奖……改变物理世界大厦的,其实是一群年轻人。

在工程领域,这样的例子也并不鲜见。比如特斯拉公司,最早是几个斯坦福大学生在车库里忽发奇想,能不能把几千节锂电池串联起来驱动一辆汽车。他们自己动手组装样车、测试,一步步带来了特斯拉的诞生。

实际上,这几年在网络上也看到过这方面的讨论:一个人创造性最强、思维最活跃的年龄其实也就是30-40岁这样,但可惜的是,现实中手握发言权的,却往往是一群早已确立了江湖地位的前辈。

像OpenAI这样的理想之地,即便是在硅谷,也往往可遇而不可求。

03价值观与使命感

企业文化与价值观,听起来是个很虚的东西,尤其在咱们这个“讲奉献境界越讲越高,比待遇越比越窄的地方”,大家一听到老板讲企业文化就头疼。

但价值观又真的是个无形而有力的东西。

OpenAI的几个主要创始人,都是年纪轻轻便已实现财务自由的大神,他们决定致力于人工智能开发,最开始的初衷也真的是开发出造福人类的AI技术,同时警惕AI给人类带来灾难,商业化和赚钱并不是出发点。

相比之下,看到百度在发布“文心一言”后,李彦宏对记者兴高采烈地宣称“8万家客户在排队等着与百度合作”,未免格局有点低了。

前期OpenAI一直定位于做一家非营利组织,被诸多有志于AI事业的年轻人视为技术天堂。在这里,他们可以直接参与最前沿、最具创造力的 AI 项目, 心无旁骛地投身到技术创新中。

有人说,OpenAI的胜利是一群技术理想主义者的胜利,这话是很有道理的。或许正因如此,ChatGPT没有首先诞生在谷歌、微软、Meta这样的巨头,而是来自一支更“纯粹”的小团队。

不过硅谷巨头们倒确实是培养人才的黄埔军校。OpenAI的员工来源,排在前三位的便是谷歌、Meta和苹果。

03 人口与人才

说实话,仅仅几年前,我还对中美在人工智能领域差距的缩小感到乐观。

毕竟,中国的人口基数摆在那里,每年培养的理工科人才是美国的几倍,用户规模也远大于美国——要人才有人才,要数据有数据,要钱更不用说,怎么看都是万事俱备。

但现在看起来,人口与人才,并不一定是强关联。

我们确实培养了大量的理工科人才,有着让很多国家羡慕的所谓“工程师红利”,然而在前沿科技领域,最困难的突破,可能最需要的就是那么一两个顶尖人才。

没有乔布斯,就不会有今天的苹果帝国;没有马斯克,就不会有特斯拉和SpaceX。

这几年比较火热的AI话题,不管是第一次战胜人类的AlphaGo、无人驾驶还是ChatGPT,总是美国人先引爆,然后我们快速跟进。但一味在别人屁股后边跟进,恐怕永远也无法实现赶超。

这就又回到了著名的“钱学森之问”:“为什么我们总是培养不出领军式的杰出人才?”

相关文章:

打造出ChatGPT的,是怎样一群人?

震惊世界的ChatGPT,要多少人才能开发出来?几百,还是几千? 答案是:87个人。 老实说,刚看到这个数字真是惊到我了,印象里,之前看媒体报道各大巨头人工智能人才储备时,动辄…...

数据结构——栈与队列相关题目

数据结构——栈与队列相关题目232. 用栈实现队列思路225. 用队列实现栈1.两个队列实现栈2.一个队列实现栈20. 有效的括号思路1047. 删除字符串中的所有相邻重复项思路155. 最小栈150. 逆波兰表达式求值思路239. 滑动窗口最大值单调队列347. 前 K 个高频元素思路232. 用栈实现队…...

Redhat6.7离线安装rabbitmq

一、下载资源文件(.rpm文件) 链接: https://pan.baidu.com/s/1j2Ze_Jjm0oMrP-r95PPCtA?pwdv3is 提取码: v3is 复制这段内容后打开百度网盘手机App,操作更方便哦 创建rabbit文件夹Mkdir rabbit 三、通过ftp上传文件 四、安装erlang环境 …...

EasyCVR平台基于GB28181协议的语音对讲配置操作教程

EasyCVR基于云边端协同,具有强大的数据接入、处理及分发能力,平台可支持海量视频的轻量化接入与汇聚管理,可提供视频监控直播、视频轮播、视频录像、云存储、回放与检索、智能告警、服务器集群、语音对讲、云台控制、电子地图、平台级联等功能…...

谷歌发布Self-Debug方法,让大模型学会自己修bug,一次性生成正确代码

文 | 智商掉了一地你有没有想过,让一台计算机诊断和修复自己生成的错误代码?一篇最新的研究论文介绍了一种名为 Self-Debugging 的技术,通过在生成的代码中添加自解释的信息,让计算机像一个可以自己修复代码的程序员一样调试自己的…...

行为型模式-模板方法

行为型模式-模板方法 模板方法(Template Method)解决算法框架问题描述适用环境优点:缺点:违反原则:代码实现模板方法(Template Method) 解决算法框架问题 描述 定义了一个算法的骨架,并将某些步骤延迟到子类中进行实现,从而使得算法的具体实现能够在子类中自由变化…...

正则表达式识别日期

正则表达式识别日期 正则表达式识别各种格式的日期 import redef extract_dates(text):# 正则表达式&#xff0c;用于识别常见的日期格式date_pattern r"""(?P<date>(?P<year_only>\d{4}(?![\d年]))| # …...

如何设计一个秒杀架构设计?

文章目录 1. 秒杀业务的特点2. 总体思路2.1 削峰限流安全保护页面优化,动静分离异步处理热点分离2.2 Nginx的设计细节2.3 页面优化细节降低交互的压力安全控制2.4 Redis集群的应用分布式悲观锁(参考redis悲观锁的代码)异步处理订单2.5 消息队列限流2.6 数据库设计2.7 答题验…...

Elasticsearch:配置选项

Elasticsearch 带有大量的设置和配置&#xff0c;甚至可能让专家工程师感到困惑。 尽管它使用约定优于配置范例并且大部分时间使用默认值&#xff0c;但在将应用程序投入生产之前自定义配置是必不可少的。 在这里&#xff0c;我们将介绍属于不同类别的一些属性&#xff0c;并讨…...

消息中间件Kafka分布式数据处理平台+ZooKeeper

目录 一.消息队列基本介绍 1.为什么需要消息队列&#xff08;MQ&#xff09; 2.使用消息队列的好处 2.1 解耦 2.2 可恢复性 2.3 缓冲 2.4 灵活性 & 峰值处理能力 2.5 异步通信 3.消息队列的两种模式 3.1 点对点模式 3.2 发布/订阅模式 二.Kafka基本介绍 1.Kaf…...

Linux 用户文件磁盘网络进程指令

用户相关指令 useradd 用户名添加用户useradd -g 组名 用户名 向组添加用户passwd 用户名 设置密码id 用户名 查看用户名的具体信息cat /etc/passwd 查看创建了哪些用户su 用户名 切换用户名&#xff08;不能获得环境变量&#xff09;su - 用户名获得环境变量以及执行权…...

如何使用Socks5代理IP提高网络安全性

随着网络的快速发展&#xff0c;网络安全问题变得越来越重要。为了保障网络安全&#xff0c;人们普遍使用代理IP&#xff0c;其中Socks5代理IP是一种常用的选择。本文将介绍什么是Socks5代理IP&#xff0c;以及如何使用它提高网络安全性。 一、什么是Socks5代理IP Socks5代…...

《Java8实战》第3章 Lambda 表达式

利用行为参数化来传递代码有助于应对不断变化的需求。它允许你定义一段代码块来表示一个行为&#xff0c;然后传递它。采用匿名类来表示多种行为并不令人满意&#xff1a;代码十分啰唆&#xff0c;这会影响程序员在实践中使用行为参数化的积极性。 3.1 Lambda 管中窥豹 可以…...

开放式耳机的颠覆之作!南卡OE Pro新皇降临!佩戴和音质双重突破

千呼万唤的南卡OE Pro终于要在最近正式官宣上线&#xff0c;此消息一经放出&#xff0c;蓝牙耳机市场就已经沸腾。NANK南卡品牌作为国内的音频大牌&#xff0c;发展和潜力一直备受业内关注&#xff0c;这次要上线的南卡OE Pro更是南卡十余年来积累的声学技术结晶之一。 据透露…...

生成器设计模式(Builder Design Pattern)[论点:概念、图示、示例、框架中的应用、场景]

文章目录概念相关图示代码示例框架中的应用场景多个生成器&#xff08;Concrete Builder&#xff09;&#xff1a;单个生成器概念 生成器设计模式&#xff08;Builder Design Pattern&#xff09;是一种创建型设计模式&#xff0c;用于处理具有多个属性和复杂构造过程的对象。生…...

JUC并发工具

JUC并发工具 一、CountDownLatch应用&源码分析 1.1 CountDownLatch介绍 CountDownLatch就是JUC包下的一个工具,整个工具最核心的功能就是计数器。 如果有三个业务需要并行处理,并且需要知道三个业务全部都处理完毕了。 需要一个并发安全的计数器来操作。 CountDown…...

java面试题-基础问题-如何理解Java中的多态?

如何理解Java中的多态&#xff1f;如何理解Java中的多态&#xff1f;典型回答扩展知识方法的重载与重写重载和重写的区别如何理解Java中的多态&#xff1f; 典型回答 多态的概念比较简单&#xff0c;就是同一操作作用于不同的对象&#xff0c;可以有不同的解释&#xff0c;产…...

03.vue3的计算属性

文章目录1.计算属性1.get()和set()2.computed的简写3.computed和methods对比2.相关demo1.全选和反选2.todos列表1.计算属性 模板内的表达式非常便利&#xff0c;但是设计它们的初衷是用于简单运算的。在模板中放入太多的逻辑会让模板过重且难以维护。所以&#xff0c;对于任何…...

Ceph性能调优

1. 最佳实践 1.1 基本 监控节点对于集群的正确运行非常重要&#xff0c;应当为其分配独立的硬件资源。如果跨数据中心部署&#xff0c;监控节点应该分散在不同数据中心或者可用性区域日志可能会让集群的吞吐量减半。理想情况下&#xff0c;应该在不同磁盘上运行操作系统、OSD…...

机器学习-问答题准备(英文)-更新中

第一章 入门 How would you define Machine Learning? Machine Learning is about building systems that can learn from data. Learning means getting better at some task, given some performance measure. Can you name four types of problems where it shines? To r…...

Gartner《2025 年软件工程规划指南》报告学习心得

一、引言 软件工程领域正面临着前所未有的变革与挑战。随着生成式人工智能(GenAI)等新兴技术的涌现、市场环境的剧烈动荡以及企业对软件工程效能的更高追求,软件工程师们必须不断适应和拥抱变化,以提升自身竞争力并推动业务发展。Gartner 公司发布的《2025 年软件工程规划…...

canvas 实现全屏倾斜重复水印

​ 参考&#xff1a; html、js、canvas实现水印_html页面使用canvas绘制重复水印-CSDN博客 效果 ​​​​ 不求水印显示完全。 实现代码 <template><div class"watermark" ref"waterMark"></div></template><script lang&q…...

【HW系列】—溯源与定位—Linux入侵排查

文章目录 一、Linux入侵排查1.账户安全2.特权用户排查&#xff08;UID0&#xff09;3.查看历史命令4.异常端口与进程端口排查进程排查 二、溯源分析1. 威胁情报&#xff08;Threat Intelligence&#xff09;2. IP定位&#xff08;IP Geolocation&#xff09;3. 端口扫描&#x…...

Namespace 命名空间的使用

名字空间&#xff1a;划分更多的逻辑空间&#xff0c;有效避免名字冲突的问题 1.什么是命名空间 名字命名空间 namespace 名字空间名 {...} // 名字空间 n1 域 namespace n1 {// 全局变量int g_money 0;void save(int money){g_money money;}void pay(int money){g_money - m…...

GRCh38版本染色体位置转换GRCh37(hg19)

目录 方法 1&#xff1a;使用 Ensembl REST API&#xff08;推荐&#xff0c;适用于少量位点查询&#xff09;方法 2&#xff1a;使用 UCSC API方法 3&#xff1a;使用 NCBI API 并转换坐标&#xff08;需要额外步骤&#xff09;方法 4&#xff1a;使用本地数据库&#xff08;最…...

ASP.NET Core SignalR的基本使用

文章目录 前言一、SignalR是什么&#xff1f;在 ASP.NET Core 中的关键特性&#xff1a;SignalR 工作原理简图&#xff1a; 二、使用步骤1.创建ASP.NET Core web Api 项目2.添加 SignalR 包3.创建 SignalR Hub4.配置服务与中间件5.创建控制器(模拟服务器向客户端发送消息)6.创建…...

Maven工程演示

软件&#xff1a;idea 一、项目创建 操作截图file -> New -> Projectnextnext -> Name:工程名称&#xff1b;Location:项目路径&#xff1b;项目创建完成;文件夹基本样例&#xff1a;&#xff08;如果不完整自己创建即可&#xff09;MANIFEST.MF内容 二、导入依赖 …...

将git最后一次提交把涉及到的文件按原来目录结构提取出来

文章目录 前言一、将git最后一次提交把涉及到的文件按原来目录结构提取出来 前言 将git最后一次的提交提取出来&#xff0c;涉及到的目录结构以及文件等&#xff0c;按原本的目录结构复制输出。并输出相关的补丁。 一、将git最后一次提交把涉及到的文件按原来目录结构提取出来…...

vue3 导出excel

需求&#xff1a;导出自带格式的excel表格 1.自定义二维数组格式 导出 全部代码&#xff1a; <el-button click"exportExcel">导出</el-button> const exportExcel () > {const data [[商品, 单价, 数量, 总价],[A, 100, 1.55, { t: n, f: B2*C2…...

MediaMtx开源项目学习

这个博客主要记录MediaMtx开源项目学习记录,主要包括下载、推流(摄像头,MP4)、MediaMtx如何使用api去添加推流,最后自定义播放器,播放推流后的视频流,自定义Video播放器博客地址 1 下载 MediaMTX MediaMTX 提供了预编译的二进制文件,您可以从其 GitHub 页面下载: Gi…...