当前位置: 首页 > news >正文

ChatGPT的前世今生,到如今AI领域的竞争格局,本文带你一路回看!

 

73年前,“机器思维”的概念第一次被计算机科学之父艾伦·图灵(Alan Turing)提出,从此,通过图灵测试成为了人类在AI领域为之奋斗的里程碑目标。

73年后的今天,在AI历经了数十年的不断进化、迭代后,目前为止仍旧没有任何一款AI从真正意义上的通过图灵测试。

而ChatGPT的诞生,成为了人类距离这个里程碑最近的一次。

01

梳理ChatGPT的前世今生

属于OpenAI的时代终于到来

提及ChatGPT的诞生,就不得不提及它背后的开发团队OpenAI。

OpenAI成立之初,是一个非营利性的研究组织,致力于推动人工智能的发展,以确保该技术能够安全地造福全人类。但随着时间的推移,组织逐渐意识到人工智能对社会和商业的潜在影响,决定开始向商业领域拓展。

在2019年,OpenAI获得了微软的投资,重组成为一个营利性的公司,并向私人投资者开放,为其长期发展提供更大的资金支持。重组后,公司将重点放在了商业化人工智能技术的发展和营销上,以实现更快速的增长和更多的商业机会,但仍旧保留了一部分非营利性质。

自那以后,有了稳定资金来源的OpenAI开启了GPT模型的全力开发,经过几年时间的技术沉淀,终于迎来了属于OpenAI的时代。

ChatGPT的前世今生

2018 年 6 月

OpenAI发布GPT-1模型,1.1亿参数。

2018 年 11 月

OpenAI发布GPT-2模型,15亿参数,但由于担心滥用,不向公众开放模型的全部代码及数据。

2019 年 2 月

OpenAI开放了GPT-2模型的部分代码和数据,但仍然限制了访问。

2019 年 6 月 10 日

OpenAI发布GPT-3模型,1750亿参数,并向部分合作伙伴提供了访问权限。

2019 年 9 月

OpenAI开放了GPT-2的全部代码和数据,并发布了更大版本。

2020 年 5 月

OpenAI宣布推出GPT-3模型的beta版本,该模型拥有1750亿个参数,是迄今为止最大的自然语言处理模型。

2022 年 3 月

OpenAI发布InstructGPT,用到 Instruction Tuning

2022 年 11 月 30 日

OpenAI通过GPT-3.5系列大型语音模型微调而成的,全新对话式AI模型ChatGPT正式发布。

2022 年 12 月 15 日

ChatGPT 第一次更新,提升了总体性能,增加了保存和查看历史对话记录的新功能。

2023 年 1 月 9 日

ChatGPT 第二次更新,改善了回答的真实性,增加了“停止生成”新功能。

2023 年 1 月 21 日

OpenAI发布限于部分用户使用的付费版ChatGPT Professional。

2023 年 1 月 30 日

ChatGPT第三次更新,在此提升了答案真实性的同时,还提升了数学能力。

2023 年 2 月 2 日

OpenAI正式推出ChatGPT收费版订阅服务,新版本对比免费版响应速度更快,运行更为稳定。

2023 年 3 月 15 日

OpenAI震撼推出了大型多模态模型GPT-4,不仅能够阅读文字,还能识别图像,并生成文本结果,现已接入ChatGPT 向Plus用户开放。

以GPT-3.5为技术基础的ChatGPT已经展现出了优秀的语言生成能力,而在新一轮的训练迭代后,GPT-4已经跨越了单领域、多模型的限制,能够实现多模态任务的执行,使得AI的生成效率再一次实现了跨越。

而对于AI而言,“多模态”的下一步又会是什么呢?

02

国外生成式AI大规模爆发

AI大战呈“一超多强”局势

硅谷的AI大战呈“一超多强”局势,竞争视野主要聚焦于OpenAI和谷歌。

事实上,与现在看似GPT大获全胜的的情况截然相反的是,几年前在OpenAI创立之后虽一直在推出技术上的新产品,但所呈现的成绩远远无法和当时在AI领域强劲的谷歌相比。

那时的谷歌谷歌收购了DeepMind,准备开发AGI,如果DeepMind开发成功,谷歌将彻底居于垄断地位,而Sam Altman成立OpenAI的原因之一就是为了避免谷歌在AI领域的垄断。

2016年,OpenAI成立后持续推出了Gym、Universe等技术产品,但这一切在多次战胜了国际围棋冠军的AlphaGo面前都显得黯然失色。而谷歌在这一阶段又趁热打铁的收购了十几家AI公司,在AI领域的投入了巨大资源。

在谷歌一路领跑的阶段中,OpenAI推出了GPT系列模型,在一次次的快速迭代中开拓了商业之路,成功制衡了谷歌。

国外生成式AI大规模爆发

2022 年 11 月 30 日

OpenAI通过GPT-3.5系列大型语音模型微调而成的,全新对话式AI模型ChatGPT正式发布。

2022 年 12 月 6 日

谷歌公司 Alphabet 旗下的英国前沿AI研究机构 DeepMind公司发布 AI 剧本协作工具 Dramatron。

2022 年 12 月 24 日

美国新兴搜索引擎 http://You.com 宣布正式上线对话式 AI 模型 youChat 测试版,在 http://You.com 首页即可试用新聊天功能。

2023 年 1 月 7 日

外媒爆料,微软构想了将OpenAI的AI模型引入 Word、PowerPoint、Excel、Outlook等软件。

2023 年 1 月 17 日

此前曾是GPT-3研发团队出身的程序员自创AI企业Anthropic,其聊天机器人Claude已进入测试阶段。

2023 年 2 月 1 日

微软官宣Microsoft Teams Premium,为Teams的高级付费版本,由ChatGPT提供技术支持,可提供自动生成会议纪要、生成会议模板等功能。

2023 年 2 月 1 日

OpenAI推出AI文本分类器,以测试文本是否为AI生成,但准确率目前较低。

2023 年 2 月 3 日

微软短暂上线了由ChatGPT提供支持的新版Bing

2023 年 2 月 8 日

微软正式上线了由ChatGPT提供支持的新版Bing搜索引擎和Edge浏览器,让用户搜索效率提升。

2023 年 2 月 9 日

谷歌Bard发布会试演翻车,回答内容出现错误,当日市值暴跌1000亿美元。

2023 年 2 月 24 日

Meta官宣SOTA大语言模型LLaMA,对非商用的研究用例开源。

2023 年 3 月 2 日

ChatGPT官宣开放API,第三方可以通过 API 将对话模型 ChatGPT 和语音转文本模型 Whisper 集成到自己的应用程序和服务中。

2023 年 3 月 6 日

谷歌推出对标Whisper的语音模型USM,支持100多个语种,20亿参数。

2023 年 3 月 8 日

微软宣布以公共预览形式 推出AI计算机视觉模型Florence。

2023 年 3 月 8 日

谷歌发布史上最大多模态具身视觉语言模型——PaLM-E,可理解图像、生成语言。

2023 年 3 月 14 日

斯坦福发布了一个由LLaMA 7B微调的模型Alpaca,训练3小时,性能比肩GPT-3.5。

2023 年 3 月 16 日

谷歌宣布AI工具整合进Workspace

2023 年 3 月 17 日

微软公布Microsoff 365 Copilot,将GPT-4全面接入微软Office全家桶。

从现阶段的竞争结果来说,OpenAI和谷歌在语言模型的技术方面优势各不相同。谷歌的1.6万亿Transfotmer模型从规模上赢得了比赛,但就商业化角度出发,效率决定了迭代速度和成本,OpenAI的GPT迭代的效率让其在商业领域获得了更大的胜利。

模型规模:谷歌>OpenAI

模型效率:OpenAI>谷歌

模型应用领域:OpenAI>谷歌

03

国内AI大厂均有布局

AI大佬创业热潮赶来

据艾瑞咨询预计,2022年我国AI产业规模达到1958亿元,2023年随着生成式AI的的爆发,AI产品形态和应用边界将持续不断地拓宽。

国内互联网大厂AI基础技术布局

国内互联网大厂AIGC技术研发对比

国内互联网大厂AI商业化进展

而2023年Q1季度还未结束,AI大模型赛道就已挤满了国内外的各路“选手”,美团联合创始人王慧文、出门问问创始人李志飞、亚马逊李沐和Alex Smola、前京东AI掌门人周伯文、快手前AI核心人物李岩......企业巨头、大佬、海归、大厂高管、教授,可谓八仙过海各显神通。

整体来看,大部分高调宣布冲入赛道的,均为此前就在AI领域有着较高知名度和专业能力的专业人士。

纵观近五年的AI技术商业落地发展,大佬的加持,我国的AI产品及服务提供商将继续围绕技术深耕、场景创新、商业价值创造、精细化服务不断努力;需求侧企业也在从单点试验、数据积累到战略改革的发展路线上与AI技术逐渐深度绑定。

04

学术界持谨慎态度

教育与AI深度融合的时代即将到来

从ChatGPT诞生以来,学术界一直对其保持着谨慎的态度。

目前“保守派”的许多学校已经禁用了ChatGPT的使用,例如美国的布朗大学、威斯康辛大学、麦迪逊分校和加拿大的多伦多大学等等。

但仍有一些学校选择顺应时代变化,已公开支持使用ChatGPT,例如国内的香港科技大学、美国的加州大学圣地亚哥分校、洛杉矶分校,英国的牛津大学和剑桥大学也表示正在考虑使用ChatGPT进行教学。

科研领域对ChatGPT的反应

2022 年 12 月 6 日

2022年12月6日,知名开发者问答网站Stack Overflow发布一项临时政策:禁用ChatGPT生成内容来回答Stack Overflow上的问题。

2022 年 12 月 9 日

DeepMind的AI编程模型AlphaCode登上Science封面。

2022 年 12 月 20 日

医学类预印本平台medRxiv上的一篇论文将ChatGPT列入作者栏。

2022 年 12 月 21 日

ChatGPT以共同作者的身份与英矽智能创始人兼CEO Alex Zhavoronkov博士共同撰写的探讨雷帕霉素抗衰老应用的论文,发表于Oncoscience肿瘤科学期刊上。

2023 年 1 月 3 日

国际机器学习会议(ICML)宣布禁止包含从大型语言模型(如ChatGPT)生成的文本的论文,除非这些生成的文本作为论文实验分析的一部分呈现。

2023 年 1 月 17 日

一篇题为《ChatGPT会获得沃顿商学院MBA学位吗?》的论文发表,宾夕法尼亚大学教授Christian Terwiesch让ChatGPT参加了沃顿商学院MBA课程的期末考试,结果发现它在考试中的得分介乎于B-到B之间。

2023 年 1 月 24 日

Nature公布两项原则:(1)不接受任何大型语言模型工具成为论文作者;(2)如在论文创作中使用此类工具,研究人员应在方法或致谢部分有明确说明。

2023 年 1 月 28 日

在线学习平台http://Study.com向1000名18岁以上学生发起的一项调查显示,超过89%的学生承认使用ChatGPT来完成家庭作业。

2023 年 1 月 31 日

全球最大预印本发布平台arXiv宣布新政策:不允许ChatGPT等生成式AI工具被列为作者。

2023 年 2 月 4 日

斯坦福大学学者发表的论文证明原本被认为是人类独具的特质心智理论(ToM,Theory of Mind)已展现在ChatGPT背后的AI模型上,根据研究结果,GPT-3之后的AI模型同理心能力可能跟9岁小孩相当。

2023 年 2 月 9 日

《科学公共图书馆·数字健康》上发表的一篇研究论文显示,ChatGPT在美国执业医师资格考试中取得了合格或接近合格的成绩,并且未经人类的帮助。研究作者认为这是AI在临床领域走向成熟的一个显著里程碑。

2023 年 2 月 10 日

《暨南学报(哲学社会科学版)》发布关于使用AI写作工具的说明,提到:暂不接受任何大型语言模型工具(如ChatGPT)单独或联合署名的文章;如在论文创作中使用过相关工具,需详细解释如何使用以及论证作者自身的创作性;如对于引用AI写作工具的文章作为参考文献的,需提供详细的引用论证。

2023 年 2 月 11 日

《天津师范大学学报(基础教育版)》发布相关说明,建议作者在参考文献、致谢等文字中对使用AI写作工具的情况予以说明。

2023 年 2 月 11 日

清华大学新闻与传播学教授、博士生导师沈阳发微博求组队抵御ChatGPT带给中国的压力。

2023 年 2 月 19 日

香港大学明文禁止师生将ChatGPT用于教学用途,违规使用将被判为抄袭。

2023 年 3 月 13 日

香港科技大学有课程已率先鼓励学生使用ChatGPT,列明在下周提交的期中报告中,学生若使用ChatGPT可获额外加分。

生成式AI的火爆,与现有的教育模式和理念产生了冲突,宏观的教育体系和具体高校师生都还没做好应对新变革的准备,需要时间去研讨、评估这一工具的使用限度,以及如何正确使用才能提高教学效率与质量。

如何利用AI给教育带来的新机会,让ChatGPT作为一种教学辅助工具,缓解教师压力,提升学生创造力,并开始习惯与AI并存的教学理念,是全体教育界目前最关心也持续讨论的问题。

任何一项新技术的诞生都将经历一段从抵触到慢慢被人们所接受的适应阶段,最后终会推广开来。一味的回避并无法阻挡科技浪潮的迸发,或许教育与AI的深度融合时代已经到来。

05

AI大模型赛道狂欢,

资本竞争暗潮涌动

AI资本赛道的狂欢

2022 年 12 月 16日

据外媒援引知情人士消息,OpenAI预计2023年收入将达到2亿美元,到2024年将达到10亿美元。

2023 年 1 月 6 日

外媒援引知情人士消息称OpenAI正洽谈以要约收购的方式出售现有股票,其估值约为290亿美元,是估值最高的美国创企之一。

2023 年 1 月 9 日

第一阶段:外媒爆料称微软正商谈向OpenAI投资100亿美元,交易目标在2022年完成。微软将获得OpenAI 75%的利润直到其收回最初的投资。

2023 年 1 月

第二阶段:当OpenAI的利润达到920亿美元后,微软获得OpenAI利润的比例降至49%。与此同时,其他风险投资者和OpenAI的员工将有权获得该公司49%的利润。

2023 年 1 月 23 日

第三阶段:微软宣布向OpenAI追投10亿美元,在OpenAI的利润达到1500亿美元后,微软和其他风险投资者在OpenAI的股份将归还给OpenAI的非营利基金会。

2023 年 1 月 30 日

同花顺概念板块新增“ChatGPT概念”。ChatGPT随即成为二级市场热词,相关概念股人气狂飙掀起涨停潮。

2023 年 2 月 8 日

上交所和深交所分别针对股票交易异常波动发函,几只ChatGPT发公告称公司未与OpenAI展开合作、ChatGPT产品及服务未给公司带来业务收入。连涨多日的ChatGPT概念股开始有些回落。

2023年初,一级市场已经在慢慢升温了,ChatGPT的爆火,不仅带火了AIGC赛道,也使得AI赛道再次焕发生机。投资机构纷纷看好ChatGPT和AIGC赛道的商业前景,未来预计能够产生数万亿美元的经济价值。

二级市场,同样看好AI的发展前景。ChatGPT的优秀表现不仅让投资者积极参与,券商密切关注,更给整个科技领域带来了新的机遇。

相关文章:

ChatGPT的前世今生,到如今AI领域的竞争格局,本文带你一路回看!

73年前,“机器思维”的概念第一次被计算机科学之父艾伦图灵(Alan Turing)提出,从此,通过图灵测试成为了人类在AI领域为之奋斗的里程碑目标。 73年后的今天,在AI历经了数十年的不断进化、迭代后&#xff0c…...

如何在JavaScript中获取当前时间yyyymmddhhmmss? (六种实现方式)

## 介绍 在编写JavaScript代码时,我们经常需要获取当前日期和时间。在本文中,我们将介绍几种获取当前时间并将其格式化为 yyyymmddhhmmss 的字符串的方法。 方法一:使用Date对象 在JavaScript中,我们可以使用 Date 对象来获取当…...

一、走进easyUI的世界

1.什么是easyUI? jQuery EasyUI是一组基于jQuery的UI插件集合体,而jQuery EasyUI的目标就是帮助web开发者更轻松的打造出功能丰富并且美观的UI界面。开发者不需要编写复杂的javascript,也不需要对css样式有深入的了解,开发者需要…...

2023 上半年软件设计师知识点复习总纲

前言:全国计算机技术与软件专业技术资格(水平)考试(以下简称IT职业资格考试)是由中华人民共和国人事部主管,国家计算机网络与信息安全管理中心主办的一项国家级、权威性的计算机职业技能水平认证考试。主要…...

深入理解Java虚拟机:JVM高级特性与最佳实践-总结-3

深入理解Java虚拟机:JVM高级特性与最佳实践-总结-3 垃圾收集器与内存分配策略垃圾收集算法标记-清除算法标记-复制算法标记-整理算法 垃圾收集器与内存分配策略 垃圾收集算法 标记-清除算法 最基础的垃圾收集算法是“标记-清除”(Mark-Sweep&#xff…...

vue3 cesium datav 可视化大屏

目录 0. 预览效果 1. 代码库包 2. 技术点 3. 一些注意事项(配置参数) 4. 相关代码详情 0. 预览效果 包含的功能: ① 地球按照一定速度自转 ② 修改加载的geojson面样式 ③ 添加 文字 标注! 1. 代码库包 直接采用vue-cli5 创建…...

python内置函数,推导式

abs:取绝对值 data abs(-10) pow:次方 data pow(2,5) sum:求和 num_list p[1,2,10,20] res sum(num_list) divmod取商和余数: v1,v2 divmod&…...

【Flink】DataStream API使用之Flink支持的数据类型

Flink的使用过程中,我们的数据都是定义好的 UserBehavior 类型,那还有没有其他更灵活的类型可以用呢?Flink 支持的数据类型到底有哪些? 1. Flink 的类型系统 Flink 作为一个分布式处理框架,处理的是以数据对象作为元…...

QT实现固高运动控制卡示波器

目录 一、固高示波器 二、基于QCustomPlot实现示波器 三、完整源码 一、固高示波器 固高运动控制卡自带的软件有一个示波器功能,可以实时显示速度的波形,可辅助分析电机的运行状态。但是我们基于sdk开发了自己的软件,无法再使用该功能&…...

洛谷P1157详解(两种解法,一看就会)

一、问题引出 组合的输出 题目描述 排列与组合是常用的数学方法,其中组合就是从 n n n 个元素中抽出 r r r 个元素(不分顺序且 r ≤ n r \le n r≤n),我们可以简单地将 n n n 个元素理解为自然数 1 , 2 , … , n 1,2,\dot…...

JavaScript异步编程和回调

目录 1、编程语言中的异步 2、JavaScript 3、回调 3.1在回调中处理错误 3.2回调的问题 3.2回调的替代方案 1、编程语言中的异步 默认情况下,JavaScript是同步的,并且是单线程…...

Qt开发笔记(Qt5.9.9下载安装环境搭建win10)

#1 Qt下载网站(国内、国外镜像) #2 Qt5.9.9安装选项 #3 配置系统环境变量 #4 创建测试项目 #1 Qt下载网站(国内、国外镜像) 官方下载地址(慢):http://download.qt.io/ 国内镜像网站 这里给大家…...

使用Plist编辑器——简单入门指南

本指南将介绍如何使用Plist编辑器。您将学习如何打开、编辑和保存plist文件,并了解plist文件的基本结构和用途。跟随这个简单的入门指南,您将掌握如何使用Plist编辑器轻松管理您的plist文件。 plist文件是一种常见的配置文件格式,用于存储应…...

Python常用的开发工具合集

​ Python是一种功能强大且易于学习的编程语言,被广泛应用于数据科学、机器学习、Web开发等领域。随着Python在各个领域的应用越来越广泛,越来越多的Python开发工具也涌现出来。但是,对于新手来说,选择一款合适的Python开发工具可…...

机器学习之线性回归

往期目录 python在线性规划中的应用 文章目录 一、线性回归算法概述1.1 什么是线性回归?1.2 线性回归算法原理1.3 线性回归的应用场景 二、线性回归算法Python实现2.1 导入必要的库2.2 随机生成数据集2.3 拟合模型2.4 预测结果2.5 结果可视化 三、完整代码 线性回归…...

中国系统正式发声!所有用户永久免费,网友:再见了,CentOS!

点关注公众号,回复“1024”获取2TB学习资源! 如果说:没有操作系统会怎么样? 对于个PC来说,无论是台式机、笔记本、平板等等,一切都变的一无是处,这些硬件对我们来说,和一堆废铁没什么…...

Oracle数据库坏块类故障

正常的数据块有其特有的固定格式,如果某数据块内部出现了混乱而导致Oracle无法读取,则可称其为坏块。数据库坏块的影响范围可大可小,严重时会导致数据库无法打开。当数据库出现坏块时,一般出现ORA-01578错误、ORA-10632错误或者OR…...

andorid之摄像头驱动流程--MTK平台

camera成像原理: 景物通过镜头生产光学图像投射到sensor表面上,然后转为模拟电信号,经过数模变成数字图像信号,在经过DSP加工出来,然后在通过IO接口传输到CPU处理。 由于摄像头满足总线、驱动、设备模型,…...

Android9.0 iptables用INetd实现屏蔽ip黑名单的实现

1.前言 在9.0的系统rom定制化开发中,在system中netd网络这块的产品需要中,会要求设置屏蔽ip地址之内的功能,liunx中iptables命令也是比较重要的,接下来就来在INetd这块实现屏蔽ip黑名单的的相关功能,就是在app中只能屏蔽某个网址,就是除了这个网址,其他的都能上网,最后…...

介绍一下json

目录 介绍一下json Elasticsearch7.6学习指南 介绍一下json JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它以易于阅读和编写的文本形式表示结构化数据。JSON最初是由Douglas Crockford在2001年提出的,它在we…...

开疆智能Ethernet/IP转Modbus网关连接斯巴拓压力传感器配置案例

本案例是将ModbusRTU协议的压力传感器数据上传到欧姆龙PLC,由于PLC采用的是Ethernet/IP通讯协议,两者无法直接进行数据采集。故使用开疆智能研发的Ethernet转Modbus网关进行数据转换。 配置过程 首先我们开始配置Ethernet/IP主站(如罗克韦尔…...

Steam爬取相关游戏评测

## 因为是第一次爬取Steam。所以作为一次记录发出;有所错误欢迎指出。 无时间指定爬取 import requests import time import csv import osappid "553850" # 这里你也可以改成 #appid int(input()) max_reviews 10000 # 想爬多少条 # max_reviews…...

个人电脑部署本地大模型+UI

在这个AI飞速进步的时代,越来越多的大模型出现在市面上 本地大模型也越来越火爆! 它完全免费,随时可以访问,数据仅存在本地,还可以自己微调,训练! 今天我来教大家,如何在一台普通…...

Three.js + Vue3 加载GLB模型项目代码详解

本说明结合 src/App.vue 代码,详细解释如何在 Vue3 项目中用 three.js 加载并显示 glb 模型。 1. 依赖与插件导入 import {onMounted, onUnmounted } from vue import * as THREE from three import Stats from stats.js import {OrbitControls } from three/examples/jsm/co…...

如何通过外网访问内网服务器?怎么让互联网上连接本地局域网的网址

服务器作为一个数据终端,是很多企事业单位不可获缺的重要设备,多数公司本地都会有部署服务器供测试或部署一些网络项目使用。有人说服务器就是计算机,其实这种说法不是很准确。准确的说服务器算是计算机的一种,它的作用是管理计算…...

Appium+python自动化(八)- 认识Appium- 下章

1、界面认识 在之前安装appium的时候说过我们有两种方法安装,也就有两种结果,一种是有界面的(客户端安装),一种是没有界面的(终端安装),首先我们先讲一下有界面的,以及界…...

6.8 note

paxos算法_初步感知 Paxos算法保证一致性主要通过以下几个关键步骤和机制: 准备阶段 - 提议者向所有接受者发送准备请求,请求中包含一个唯一的编号。 - 接受者收到请求后,会检查编号,如果编号比它之前见过的都大,就会承…...

JSON解析崩溃原因及解决方案

问题记录: /************************************************| * 描述: 将ID124执行NFC操作-JSON解析为结构体* 函数名: cJSON_ID124_to_struct* 参数[ I]: *json_string 待解析的指针* 参数[II]: *wireless_rxd 结构体指针* 返回: 成功返回0 失…...

leetcode_66.加一

题目链接 这道题归类在力扣的数学类中,应该算是一道思维的简单题吧 题是这样的,根据题目我们不难理解,这个题就是在最后一位加 1 然后返回,正如示例所说的那样,当然这很符合我们人的思维,写这种算法题最重要…...

Python 训练营打卡 Day 46

通道注意力 一、什么是注意力 注意力机制是一种让模型学会「选择性关注重要信息」的特征提取器,就像人类视觉会自动忽略背景,聚焦于图片中的主体(如猫、汽车)。 transformer中的叫做自注意力机制,他是一种自己学习自…...