当前位置: 首页 > news >正文

ChatGPT一周年,一图总结2023生成式AI里程碑大事件时间线

带你探索AI的无限可能!AI一日,人间一年,这句话绝非空谈!

AI技术在不断地发展,让我们一起期待它未来更多的可能性吧!

2022 年 11 月 30 日,OpenAI 宣布正式推出 ChatGPT。365 天过去,斗转星移,我们一起见证了生成式 AI 的寒武纪大爆发。

Generated by DALL·E3

这一年来,国内外的生成式 AI 、大模型和产品以令人眼花缭乱的速度更新迭代,新的创业浪潮风起云涌,大家登记 waitlist 的速度都快赶不上产品推陈出新的频率。国内更是开始了百模大战,不少国产大模型陆续宣布性能赶超 GPT3.5。大浪淘沙后,也有不少企业宣告解散,知名大模型项目「套壳」开源项目屡见不鲜。

回顾 ChatGPT 发布的这一年,都有哪些大事件,你会用哪些关键词总结?

00 整理了2023 年生成式 AI 领域的重大事件时间线,分为头条、产品(文本/图片/视频/代码/开源/其他)、模型、算力、政策五大部分,都集中在一张地图中,方便查阅。

生成式AI应用简史

注:因个人能力、精力有限,难免挂一漏万,本次绘制的地图只提供一个概览,是一个历史切片,各种疏漏敬请谅解。若需要高清版的历程图请私信博主!

01 生成式文本

Generated by Stable Diffusion

ChatGPT 自 2022 年 11 月 30 日上线以来,一直引领着生成式 AI 的发展。

2023 年 1 月底 2 月初,ChatGPT 成为互联网史上最快获得 1 亿用户的产品。

2 月,ChatGPT plus 版本上线。

3 月 15 日,GPT4 炸裂发布,正式宣告生成式 AI 大爆发的开始,无数人开始研究如何能注册和使用上这个用数十亿美元打造出来的大杀器。

4 月,ChatGPT 开放了插件,原本简单的基于历史数据的对话,一下有了全新的能力和可能性,开发者多少对如此简单的接入感到兴奋和害怕。

OpenAI 还在 5 月和 8 月分别推出了 ChatGPT 的 iOS 和 Android 应用,并在 11 月向所有用户开放移动应用的语音对话能力。

7 月,OpenAI 开放了 GPT4 API 、强大的代码解释器,并允许用户自定义指令

8 月,ChatGPT 企业版上线,3.5 turbo 模型支持微调

9 月,ChatGPT 集成新的语音和图像能力,联网浏览功能也恢复了,多模态能力进一步增强

10 月,继续是多模态能力,沉寂已久的 DALL·E 更新到第三代,GPT4V 接口也发布了

11 月,OpenAI 高层戏剧化政变,Sam Altman 几进几出,全球观众不眠不休追剧

除了 ChatGPT, 对话式 AI 产品也诞生了几个实力强大的竞争者。

关系微妙的好基友 Bing Chat 紧随 ChatGPT,在 2 月就占得先机,原本几乎没有什么市场份额的 Bing 搜索引擎重获新生。在「普惠」这件事情上,没有人比微软做得更快更好,不但云服务全线铺开,而且 Copilot 在 11 月已经深度集成到 Windows 生态中。

另一方面,挑战者 Anthropic 的 Claude 在 3 月紧随 GPT4 上线,并率先在 5 月份支持长达 100k 的上下文。7 月 Claude2 发布,到 11 月,Claude2.1 已经支持 200k 的上下文,并开放了数据调用能力。

Google 在生成式 AI 的浪潮中,多少给人一种「起了个大早,赶了个晚集」的感觉。最早提出 transformer 架构,在大模型技术储备上让人望其项背,但因为搜索引擎牵一发动全身,Google 在 3 月仓促推出 Bard,一时差评如潮。

随着 PaLM 和新版搜索引擎的改进,以及 Duet AI 、新一代 Gemini 模型的推出,Google 在几个月内完成了生成式 AI 生态的完整布局,不得不让人感叹家底雄厚。

在其他应用领域,产品和创新就更加不胜枚举了。现在回头看 Poe 套壳应用的巨大成功,不知道 OpenAI 董事会的 Quora(孵化了Poe) 创始人 Adam D’Angelo 到底扮演了什么角色,这让故事蒙上了阴谋论的迷雾。Notion AI 也是最早集成 AI 能力的产品之一,在场景化的应用中树立了标杆。

最后(也是最重要的)一件事,是 4 月 LLaMA 的史诗级泄露,大模型进化树全新开源分支一骑绝尘。GPT 和 LLaMA 这一对 iOS 和 Android,联手开启了生成式 AI 的寒武纪大爆发的开关。

02 生成式图像

Generated by Stable Diffusion

文生图领域同样迎来了突飞猛进的一年。生成式图像的生态可以划分为三大阵营:

开源工具

以 Stable Diffusion 为代表,这一类好比安卓系统,生态丰富而且活跃,既有完全开源的Stable Diffusion,也包括很多基于 SD 做了二次封装的文生图工具比如 Dreamstudio、leonardo.ai、dreamlike.art、playground ai 等等。

Stable Diffusion 2.0 并不成功,4 月 SDXL beta 版本发布,让大家重新对文生图能力充满了期待,7 月 SDXL 正式上线,目前还处在降低算力要求的推广融合阶段。随着 civitai(C站)和 WebUI 、ComfyUI 的普及,还有 Meta 在基础模型和算法方面的持续贡献,开源工具会继续推动生成式图像生态的繁荣和创新。

闭源工具

以 Midjourney 为代表,可以类比苹果手机,生态封闭但用户体验较好,还包括 DALL·E3、Bing Image Creator、文心一格等。

Midjourney 在 2023 年成为“小团队-大产品”的代言人。3 月 V5 版本上线, 5 月 5.1 版本,6 月 5.2 版本,每一个版本都让人惊叹 Midjourney 的画质如此出色,甚至怀疑跟 Stable Diffusion 还是不是同源技术。

设计工具2.0

以 Adobe Firefly 为代表,是在原有的设计工具中集成 AI 辅助的功能,还包括 Canva AI、Microsoft Designer、Framer AI 等等。

Firefly 可以说是成也专业,败也专业。直接集成在 Adobe Creative 尤其是 Photoshop 中,能完败绝大多数的文生图应用,但是也会相对局限在专业设计师和创意人群中。

11 月,图像 AI 生成领域迎来了实时绘制的浪潮,KREA 和 Clipdrop 相继上线实时绘制功能,相信这对设计工具 2.0 会是一次重大突破,专业画手被冲击的部分又有了新的价值展现!

03 生成式视频

2023 年是 Generative video 的元年。在大家还在摸索文生图的时候,文本生成视频的快速进化让人眼花缭乱。

进入下半年,由 Runway ML 引领的生成式视频领域车速猛增,先是 Gen-2 上线,生成式视频开启卷王模式,Pika,LumaAI,Morph Studio,Moonvalley,PlaiDay,Mootion 等一众文生视频应用百花齐放。

Generated by Stable Video Diffusion

11 月,竞争进入白热化阶段,Gen-2 受 Pika 等刺激完成了大更新,视频质量有了跃迁。Pika 1.0 在可控性方面又有了极大提升。

文生视频也迎来更大的开源玩家:Meta 发布 Emu,Stability AI 发布 Stable video diffusion,学术界同时在争相发布降低生成成本的研究。明年,生成式视频一定会迎来大爆发,图像创意工作者的创作流程将会被改变。

04 生成式代码

生成式代码是高端玩家的竞技场。主要也有三股力量:

代码平台:以 Github Copilot 为代表,还包括模型社区 Hugging Face 发布的 StarCoder。因为坐拥海量的源代码和模型,解放生产力是优先的场景。

大模型和开源生态:很多综合大模型都会有专门的代码生成模块,这也许会成为评估模型能力的重要指标。Meta 2023 年一头扎进开源搞建设,大有成为 AI 安卓之势(不是)。

商业养蛊:Salefore 和幻方发布了自己的代码生成模型,CodeGen2 在 5 月发布,DeepSeek 11 月上线。有钱人往往也有远见,先用资源垒出壁垒,让别人在日后难以竞争,是为商业养蛊~

对了,请不要忽略 5 月份新的 AI/ML 编程语言 Mojo 的发布,期待明年会有更精彩的生态演绎。

05 开源应用

2023 年什么最火?ChatGPT。

2023 年哪里最热闹?GitHub 😄 (抱抱脸和 X.com 稍微不服气)

2 月,文生图领域拯救 Stable Diffusion 的 ControlNet 在 上线,作者还开发了 Fooocus(取代难用的 A1111 WebUI,不是)

3 月,2022 年已经发布的的 Langchain 一下踩中了风口,成为生成式 AI 第一开源股(不是)。半年后逐渐取代 SD WebUI 的 ComfyUI 悄悄 init 了

4 月,AutoGPT 大红大紫,带动了 Agent 概念极速发展

6 月,DragGan 引发了可控文生图的热潮

7 月,AnimateDiff 开始推动文生视频的发展

11 月,LCM 带来低显存福音,1 秒出图不是梦,3060 生成视频不是梦

Generated by Stable Diffusion

Github 的热闹,还是得每天刷新热门项目的 star 数才能感受到,请大家移步本地图的 Github 地址,star 一下支持原创。

英文版地图:https://github.com/kidult00/genai-2023-map

中文版地图:https://github.com/kidult00/genai-2023-map/blob/main/zh_version.md

06 模型

大模型这一块,相信各种商业分析、创业社区、大中小厂官网,已经日常轰炸大家许久。这里就不念 PPT 了,大家可以在月历中查阅。

Generated by Stable Diffusion

07 算力

算力领域的故事比较单薄,英伟达强者恒强,宣扬 AI 的「iPhone 时刻」到来并表示 all in 生成式 AI。11 月,英伟达发布 H200 芯片,地球最强没跑了,尤其在训练场景,试图进一步拉大产品性能及产业链上下游的优势。

位于第二梯队的 Google 研发出为机器学习定制的专用芯片 TPU,5 月已经发布第五代。追赶者 AMD 也在 6 月推出了 MI300X AI 芯片,反响一般。深感算力不够用的大厂纷纷开始准备自研芯片,包括微软、 Meta、亚马逊、华为等。

Generated by Stable Diffusion

08 政策

关于监管,关于数据安全,关于版权,关于隐私,关于 AGI,可以说 gov 都是慢半拍。7 月份公布的《生成式人工智能服务管理暂行办法》备受关注。欧盟受在大模型竞争中全面落后,不过发布了全球第一部人工智能法案。

2023 年绝对是历史性的一年,人类走出 COVID-19 的阴霾,迎来了生产力的革新。

对从业者来说,这是一惊一乍的一年。对创业者来说,这是不眠不休的一年。对创作者来说,这是眼界大开的一年。对普通人来说,这是历史车轮加速向前的一年。

想一想又有点不对,AI 一天,人间已一年。

 Generated by Stable Diffusion

        近年来,AI技术突飞猛进,在各个领域都展现出了惊人的实力。AI一日,人间一年,这句话用来形容AI技术的飞速发展,再恰当不过。在医疗领域,AI技术能够帮助医生更精确地诊断病情,提高疾病的治愈率。在交通领域,AI技术能够让自动驾驶汽车成为现实,减少交通事故的发生。在金融领域,AI技术能够实现智能风控,提高金融安全性。在教育领域,AI技术能够实现个性化教育,让每个学生都能够得到更好的教育资源。在科技领域,AI技术更是能够帮助我们解决许多难题,推动人类社会的进步。虽然AI技术在某些方面还存在着不足之处,但是随着技术的不断进步,相信未来会越来越好。

最后,祝愿大家在 2024 年少一点疲于奔命,多一些笃定,多一分创作。AI技术在不断地发展,让我们一起期待它未来更多的可能性吧!

相关文章:

ChatGPT一周年,一图总结2023生成式AI里程碑大事件时间线

带你探索AI的无限可能!AI一日,人间一年,这句话绝非空谈! AI技术在不断地发展,让我们一起期待它未来更多的可能性吧! 2022 年 11 月 30 日,OpenAI 宣布正式推出 ChatGPT。365 天过去,…...

Python 接口测试response返回数据对比的方法

背景:之前写的接口测试一直没有支持无限嵌套对比key,上次testerhome逛论坛,有人分享了他的框架,看了一下,有些地方不合适我这边自己修改了一下,部署在jenkins上跑完效果还不错,拿出来分享一下。…...

LainChain 原理解析:结合 RAG 技术提升大型语言模型能力

摘要:本文将详细介绍 LainChain 的工作原理,以及如何通过结合 RAG(Retrieval-Aggregated Generation)技术来增强大型语言模型(如 GPT 和 ChatGPT 等)的性能。我们将探讨 COT、TOT、RAG 以及 LangChain 的概…...

6-6 堆排序 分数 10

typedef int Datatype; typedef struct {Datatype* elem; int Length; }SqList; typedef SqList HeapType; void swap(int* a, int* b) {int tmp *a;*a *b;*b tmp; } //建大堆 //m: 结点个数 s: 待下调父结点下标 void HeapAdjust(HeapType H, int s, int m) {int child …...

高翔《自动驾驶与机器人中的SLAM技术》第九、十章载入静态地图完成点云匹配重定位

修改mapping.yaml文件中bag_path: 完成之后会产生一系列的点云文件以及Keyframe.txt文件: ./bin/run_frontend --config_yaml ./config/mapping 生成拼接的点云地图map.pcd文件 : ./bin/dump_map --pose_sourcelidar 。、 完成第一次优…...

英语六级翻译

1. 青海是中国西北部的一个省份,平均海拔 3000 以上,大部分地区为高山和高原。青海省得名全国最大的咸水湖青海湖。青海湖被誉为“中国最美的湖泊”,是最受欢迎的旅游景点之一,也是摄影师和艺术家的天堂。 青海山川壮丽,地大物博。石油和天然气储量丰富,省内许多城市的…...

VMware配置Ubuntu虚拟机

目录标题 1. 相关问题 1. 相关问题 Ubuntu虚拟机与主机能ping通,但是xftp无法连接 解决:Ubuntu安装 OpenSSH 服务器:sudo apt install openssh-server...

Backtrader 文档学习-Platform Concepts

Backtrader 文档学习-Platform Concepts 1.开始之前 导入backtrader ,以及backtrader 的指示器、数据反馈的模块 。 import backtrader as bt import backtrader.indicators as btind import backtrader.feeds as btfeeds看看btind模块下有什么方法和属性&#x…...

策略模式(常用)

策略模式的简介 在软件开发中,设计模式是为了解决常见问题而提供的一套可重用的解决方案。策略模式(Strategy Pattern)是其中一种常见的设计模式,它属于行为型模式。该模式的核心思想是将不同的算法封装成独立的策略类&#xff0c…...

Express中使用Swagger

Swagger Swagger 是一种规范,用于描述 API 的结构,功能和参数。使用 Swagger 可以提供清晰的可视化 API 文档,可用于 API 交互的文档驱动开发,以及 API 的自动化测试和集成。 使用 npm 或 yarn 下载。 npm install swagger-jsdo…...

【C++】单一职责模式

目录 一、简介1. 含义2. 特点 二、实现1. 将类拆分成多个类2. 使用命名空间(Namespace)3. 使用组合而不是继承 三、总结如果这篇文章对你有所帮助,渴望获得你的一个点赞! 一、简介 1. 含义 在面向对象设计中,单一职责…...

GPT4-隐者地址

网址 https://evo.ninja/测试是否是GPT4 https://blog.csdn.net/fyfugoyfa/article/details/130254735...

教师考编需要什么条件

教师考编,了解考编需要什么条件是非常重要的。接下来,我来介绍几点教师考编的条件。 需要具备相应的学历背景。一般来说,考编需要具备本科或以上学历,并且所学专业与所报考的岗位相关。在某些特殊情况下,如报考幼儿园教…...

刘家窑中医医院鲁卫星主任:冬季守护心脑血管,为社区居民送去健康关爱

随着冬季的来临,气温逐渐降低,心脑血管疾病的风险也随之增加。为了提高公众对心脑血管疾病的认知和预防意识,北京刘家窑中医医院于近日成功举办了冬季守护心脑血管公益义诊活动。 本次义诊活动主要针对社区居民中的中老年人,特别是…...

专家级定位咨询:打造不可复制的市场地位

在这个快速变化的商业环境中,每个品牌都渴望在市场中占据一个独一无二的位置。但是,真正实现这一点并非易事。这就是为什么专家级定位咨询如此重要:它不仅帮助品牌发现其独特之处,还能指导它们如何有效地利用这一优势来在市场中脱…...

为什么说代码注释是程序员必备的技能?

代码注释是对代码中的特定部分或整体功能的解释和说明。注释添加在代码中,是给程序员看的,当系统运行程序,读取注释时会越过不执行。随着技术的发展,现在具有百万行代码的程序已经很常见了,在这样一个大型的代码中&…...

日期——年月日星期时间封装和年月日时间封装

年月日星期时间 function nowDate(time) {var getTime new Date().getTime(); //获取到当前时间戳var time new Date(getTime); //创建一个日期对象var year time.getFullYear(); // 年let wk new Date().getDay()var month (time.getMonth() 1).toString().padStart(2, …...

RK3568全国产化多网口板卡带poe供电,支持鸿蒙麒麟系统

信迈XM-3568-01主板采用瑞芯微RK3568四核Cortex-A55 处理器,主频最高可达2.0GHz,效能有大幅提升最高可配8GB内存容量,频率高达1600MHz;支持全链路ECC,让数据更安全可靠配置双千兆自适应RJ45以太网口,并扩展…...

UI卡顿问题

1、 监测卡顿的方式 a、Xcode 层级关系是否有异常 b、 instruments 的Animation Hitch工具检测:碰到问题,录制完了无数据(用iphone7录制有数据的,iphne14录制无数据?) 2、可能导致的卡顿的原因 a、 直播广…...

Linux操作系统的ECS云服务器上搭建WordPress网站教程

WordPress是使用PHP语言开发的博客平台,在支持PHP和MySQL数据库的服务器上,您可以用WordPress架设自己的网站,也可以用作内容管理系统(CMS)。本教程介绍如何在Linux操作系统的ECS实例上搭建WordPress网站。 前提条件 已创建Linux操作系统的ECS实例,并且手动部署LNMP环境…...

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码 思路 进入页面发现是一个登录框,很难让人不联想到SQL注入,但提示都说了不是SQL注入,所以就不往这方面想了 ​ 先查看一下网页源码,发现一段JavaScript代码,有一个关键类ctfs…...

1688商品列表API与其他数据源的对接思路

将1688商品列表API与其他数据源对接时,需结合业务场景设计数据流转链路,重点关注数据格式兼容性、接口调用频率控制及数据一致性维护。以下是具体对接思路及关键技术点: 一、核心对接场景与目标 商品数据同步 场景:将1688商品信息…...

在Ubuntu中设置开机自动运行(sudo)指令的指南

在Ubuntu系统中,有时需要在系统启动时自动执行某些命令,特别是需要 sudo权限的指令。为了实现这一功能,可以使用多种方法,包括编写Systemd服务、配置 rc.local文件或使用 cron任务计划。本文将详细介绍这些方法,并提供…...

ElasticSearch搜索引擎之倒排索引及其底层算法

文章目录 一、搜索引擎1、什么是搜索引擎?2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长,文件大。2.其次,树深,IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...

在WSL2的Ubuntu镜像中安装Docker

Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包: for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...

Springboot社区养老保险系统小程序

一、前言 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱,社区养老保险系统小程序被用户普遍使用,为方…...

R语言速释制剂QBD解决方案之三

本文是《Quality by Design for ANDAs: An Example for Immediate-Release Dosage Forms》第一个处方的R语言解决方案。 第一个处方研究评估原料药粒径分布、MCC/Lactose比例、崩解剂用量对制剂CQAs的影响。 第二处方研究用于理解颗粒外加硬脂酸镁和滑石粉对片剂质量和可生产…...

Selenium常用函数介绍

目录 一,元素定位 1.1 cssSeector 1.2 xpath 二,操作测试对象 三,窗口 3.1 案例 3.2 窗口切换 3.3 窗口大小 3.4 屏幕截图 3.5 关闭窗口 四,弹窗 五,等待 六,导航 七,文件上传 …...

MacOS下Homebrew国内镜像加速指南(2025最新国内镜像加速)

macos brew国内镜像加速方法 brew install 加速formula.jws.json下载慢加速 🍺 最新版brew安装慢到怀疑人生?别怕,教你轻松起飞! 最近Homebrew更新至最新版,每次执行 brew 命令时都会自动从官方地址 https://formulae.…...

Pydantic + Function Calling的结合

1、Pydantic Pydantic 是一个 Python 库,用于数据验证和设置管理,通过 Python 类型注解强制执行数据类型。它广泛用于 API 开发(如 FastAPI)、配置管理和数据解析,核心功能包括: 数据验证:通过…...