科技云报道:从“奇点”到“大爆炸”,生成式AI开启“十年周期”
科技云报道原创。
世界是复杂的,没有人知道未来会怎样,但如果单纯从技术的角度,我们总是能够沿着技术发展的路径,找到一些主导未来趋势的脉络。
从Sora到Suno,从OpenAI到Copilot、Blackwell,这些热词在大众眼里或许还分不清楚,但很多人已经用上各种“ChatGPT”,或聊天或创作。不知不觉间,我们已经卷入新一轮AI浪潮中。
这轮人工智能浪潮,自ChatGPT这类生成式AI工具问世,被迅速引爆。AI大模型从研究走向应用,复用成本大幅降低,各种应用得以更快渗透进各行各业。
IDC发布报告称,2027年全球人工智能IT总投资规模有望从2022年的1324.9亿美元增至2027年的5124.2亿美元,年复合增长率(CAGR)为31.1%。
聚焦生成式AI,IDC预测,全球生成式AI市场年复合增长率将达85.7%,到2027年全球生成式AI市场规模将接近1500亿美元。
英伟达CEO黄仁勋表示,生成式AI已经开启了全新的投资周期,已经进入了“十年周期”(技术从出现、传播到大规模应用所需的时间)的第一年。
当生成式AI从一个“奇点”到迎来“大爆炸”时刻,其将在现实世界发生哪些改变?又将激发怎样的潜力?
生成式AI迎来“三个转变”
过生成式AI技术可分为四个层次,即面向消费者应用;大语言模型(LLM)等基础技术;支持服务的云基础设施;以及对于开发和运营至关重要的半导体。
从技术发展看,今年生成式AI将从纯理论探讨阶段,全面进入到业务应用阶段。过去一年,大部分企业和机构并没有真正打造出生成式AI系统;而今年,生成式AI系统将全面进入到生产当中,企业将真正地开始使用生成式AI工具。
对于生成式AI本身,即将迎来三个方面的转变。
首先,要把生成式AI投入到企业以及业务用例的过程中,就要从构建训练基础架构转向构建推理基础架构。
到目前为止,大部分企业往往是通过对开源基础模型进行调优、优化或者是互联,来实现自己的某些功能和需求。
对于各个企业、各个垂直行业领域的企业来说,无论是GenAI还是GPT4,大语言模型的训练成本是高昂的。特别是对于垂直行业的企业用户,不会在业务推进过程中直接采用这些模型。
如果未来需要将AI能力赋予企业的业务,那么企业就需要进一步开发已有的模型,从而让这些模型在部署到垂直行业的生产中时,可以真正地转化为生产力。
而这种转变也对企业提出了更加明确的要求:如何更好地设计出这种推理基础架构?该把它们放在哪里?如何确保其安全?
其次,是企业的关注点将越来越多地将从宽泛的实验转向自上而下的战略推进,即挑选出少数几个真正具有变革意义的生成式AI应用项目。
去年,很多企业都在考虑采用生成式AI技术。但如今,企业已经认识到,要应用生成式AI技术,每个项目都非常庞大,需要占用大量人力、物力、财力,才能构建和实施一个能够投入生产的生成式AI系统。
到了今年,一方面,生成式AI领域将会有成百上千乃至上万的潜在用例,但另一方面,由于每一个企业的资源有限,因此只能选择其中几个重点实施。
对于企业的CIO和领导者,必然会面临一个问题:就是从几百个AI项目中,优先选择几个进行实施。这其中的风险在于:一旦选对了,这些项目将对业务产生正向影响;而万一选错,可能就会造成大量的资源浪费。
要想做出一个正确的选择,各个企业必须要充分理解GenAI价值,以及生成式AI最有可能从哪些方面能够为企业提升生产力而赋能。
第三,是用户对于AI投入的成本考量,从对“训练成本”的计算转向对“运营成本”的衡量。
在理论研究和训练阶段,生成式AI的成本取决于构建模型的复杂程度,以及架构开发和维护人员的规模,除此之外再无其他成本可言。
但当企业用户开始实施部署和应用生成式AI工具时,现实的运营成本就会成为企业用户面临的最大经济考量。
以戴尔科技为例,其最初开始建立自己的生成式AI系统时,基本上会在三个月的时间里用到20台服务器,此刻其整体运营成本是未知的。
但当这套系统开始被戴尔科技内部的工程师应用时,6000名工程师每个月就需要大约5000万次处理量,因此该系统最大的成本不是建立一个模型的成本,而是基于大规模处理而产生的巨额运营成本。
这对企业用户而言,从训练成本到运营成本的考虑,将是未来必将面对的一个相当现实的问题。
从本质上说,生成式AI的转变其实是技术从研发到应用的商用化过程中必然要经历的过程。
只是由于AI自身业务形态的改变,也将带来更多行业的改变,其中的一个影响就是会带动一批相关技术和应用,成为未来的热点和趋势。
如何激发生成式AI更大潜力
仅仅一年,随着各大资本和巨头入场,AI从底层大模型,到基础设施,到机器学习操作(MLOps),再到消费端应用,生成式AI的生态已经初步建立。
随着今年生成式AI的进一步训练和稳定,行业发展将加速向下游移动,生成式AI将进一步改变人们的生活,乃至改变整个世界,其为企业提供了无限的想象空间,使产品和服务的研发过程更加高效、有趣。
面对生成式AI市场的巨大潜力,亚马逊、谷歌、微软、Meta等科技巨头不甘示弱。去年12月,谷歌多模态大模型Gemini发布,包含三个版本:Nano、Pro和Ultra。
Pro对标GPT-3.5,Ultra对标GPT-4,可以处理文本之外的信息,包括图像、视频和音频。同时,谷歌上线文生图模型Imagen 2、视频生成模型VideoPoet,推出医疗人工智能大模型MedLM,将大模型与医疗保健行业紧密结合。
去年11月,微软将集成了GPT的Bing Chat更名为Copilot,可以免费使用GPT-4、DALL·E 3功能,并且拥有了独立网站,Copilot将嵌入所有微软旗下应用中。微软还推出Copilot Studio,使用者可以自定义GPT、创建新插件、自定义工作流。
Meta则接连发布了650亿参数的开源大模型 LLaMA和700亿参数的LLaMA2。近日,Meta推出全新开源大模型Code Llama 70B,其准确率达到了53%,超过了GPT-3.5的48.1%,是目前评分最高的开源大模型。
2023年以来,看似默默无闻的亚马逊频频出击。去年9月,亚马逊宣布将向人工智能初创公司Anthropic投资40亿美元,近日,其再次宣布追加投资27.5亿美元,完成了对Anthropic40亿美元的投资,决心可见一斑。窗体顶端
更为重要的是,亚马逊云科技提出了基于生成式AI的三层技术栈。
第一层是高性能基础设施,过去五年,亚马逊云科技持续加大在自研芯片方面的投入,比如Amazon Trainium和Amazon Inferentia芯片,可以提供在云上训练模型和运行推理的最低成本。
除此之外,在GPU方面,NVIDIA多款先进算力均率先在亚马逊云科技落地。
第二层是最广泛的基础模型选择。亚马逊云科技认为“没有一个模型可以适用于所有业务场景”,因此推出Amazon Bedrock,企业可以灵活选择适合自己的模型,更容易地构建应用,并在保证数据安全和隐私基础上,进行定制化模型的开发,还无需大量的标注数据。
Amazon Bedrock提供各种领先的基础模型供客户选择:既有知名的开源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有如Anthropic Claude 3、AI21labs Jurassic、Cohere Command、Amazon Titan等非开源模型。
基于Amazon Bedrock云托管服务,企业可以通过API访问从文本到图像的一系列强大的基础模型。
值得一提的是,亚马逊和Anthropic在生成式AI领域有着广泛的合作,Anthropic在Amazon Bedrock上提供的Claude 3系列模型是全球最领先的大模型之一,共包含三个模型:Haiku、Sonnet、Opus,从模型尺寸来看,可以理解为模型的中杯、大杯、超大杯。
客户可以根据自己的商业需求,从中选择最合适的智能、速度和价格组合。
· Haiku:是响应速度最快的模型,也是成本最低的选项,在大多数纯文本任务上的表现仍然相当出色,也同时包含多模态能力(比如视觉)。
· Sonnet:适用于需要平衡性能和成本的场景,它在纯文本任务上的表现与后面的Opus相当,但在成本上更为经济,适合于那些需要性能稍微好点,但预算有限的企业和个人用户。
· Opus:具有强大的推理、数学和编码能力,接近人类的理解能力,适用于需要高度智能和复杂任务处理的场景,如企业自动化、复杂金融预测、研究和开发等。
对于Claude 3,更有行业人士认为其终结了GPT-4时代。Claude 3有两大亮点,一个是长文本,二是多模态能力。
长文本是Claude 3的一个显著优势,体现为在读论文、小说等字数更多的文本时,Claude 3更擅长理解和回答用户的相关问题。
此次Claude 3大大提升了上下文对话窗口,达到200k,可以理解为单次和模型对话能够输入的文本。
具体而言,Claude 3 200k的对话长度,相当于能够单次处理超过15万英文单词,而GPT-4 Turbo的上下文窗口为128k,大约是9.6万个英文单词。同时,Claude 3也第一次允许图像和文档上传。
和ChatGPT一样,Claude 3能够“认”出来图里的是什么东西,直接描述,回答用户的问题。更令人印象深刻的是,Claude 3在分析一些复杂问题时,已经能够和人一样,先拆解问题,并且交由子模型来进行调度。
第三层就是应用生成式AI技术的开箱即用的云服务,进一步降低使用门槛。目前已经推出Amazon Q这一AI助手,可以根据客户业务进行定制,专用于办公场景需要。
还与像Amazon QuickSight,包括智能客服的产品Amazon Connect,面向编程开发人员的平台Amazon CodeWhisperer,都实现了非常有效的结合。
可以看到,从底层基础设施到上层应用拓展,今年亚马逊云科技在生成式AI领域不断发力。不同的客户可以根据需求选择不同层级的产品,通过这三层来支持他们的业务创新。
此外,对于如何帮助企业快速具备生成式AI能力,亚马逊云科技拥有丰富的专业技术支持资源,包括SA、产品专家、人工智能实验室、数据实验室、快速原型团队、专业服务团队,帮客户打通应用生成式AI的“最后三公里”工程化挑战。
对于作为扮演“底层架构师”角色的亚马逊云科技而言,大模型固然重要,但关键技术能力的集合才是提升企业生产力的根本动力。
亚马逊云科技大中华区产品部总经理陈晓建表示,“尽管大模型非常重要,但仅靠大模型对企业的生产是远远不够的。从模型能力到真正的运营生产之间,企业还需要增加很多辅助能力。企业需要一系列周边的能力来正确、合理、安全、高效地使用大模型,这就是亚马逊云科技一系列产品所提供的价值所在。”
生成式AI领域接下来发展的最关键一步是什么?陈晓建表示,首先,从最底层来看,芯片性能仍然落后于需求。虽然半导体芯片的发展已经非常快,但模型本身参数规模的扩大实际上远超芯片的能力。
“以前一个几百万参数的模型,就觉得已经很大了,但现在动辄达到数百亿的规模。基础服务商仍需关注如何将底层能力、业务复杂度和大模型复杂度相匹配,使硬件发展赶上软件发展规模。”
其次,他认为大模型能力本身还有很多发展空间,今天看到的模型可能代表了一个博士生水平,但是能不能做得更好?比如达到教授或者院士水平?
包括亚马逊云科技在内的诸多生成式AI供应商需要在未来持之以恒地去做模型能力方面的工作。
在最上层与各行各业务相结合方面,陈晓建表示,相关的SaaS解决方案非常多。
从这点上看,将生成式AI能力与垂直场景的解决方案结合需要做巨大的工作。“我们需要思考大模型如何为人类社会各行各业中的应用提供更好的模型能力、更易用的方式和更低的成本。”
无论如何,人们对未来的期许总是充满希望。对于科技未来的走向,以AI为代表的技术进化,正在成为一场考验人类想象力的比赛。
科技企业能做的,就是通过技术普惠,降低AI参与门槛,先把大模型打造成像电、水一样随取随用的公共资源,再将生成式AI技术应用于各行各业,变成真正能够推动人类发展的生产力。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。
相关文章:

科技云报道:从“奇点”到“大爆炸”,生成式AI开启“十年周期”
科技云报道原创。 世界是复杂的,没有人知道未来会怎样,但如果单纯从技术的角度,我们总是能够沿着技术发展的路径,找到一些主导未来趋势的脉络。 从Sora到Suno,从OpenAI到Copilot、Blackwell,这些热词在大…...

【用户案例】太美医疗基于Apache DolphinScheduler的应用实践
大家好,我叫杨佳豪,来自于太美医疗。今天我为大家分享的是Apache DolphinScheduler在太美医疗的应用实践。今天的分享主要分为四个部分: 使用历程及选择理由稳定性的改造功能定制与自动化部署运维巡检与优化 使用历程及选择理由 公司介绍 …...

权限管理系统【BUG】
1.1.简介 忙里偷闲,学点Java知识。越发觉得世界语言千千万,最核心的还是思想,一味死记硬背只会让人觉得很死板不灵活,嗯~要灵活~ 1.2.问题 permission.js:37 [Vue warn]: Error in render: "TypeError: Cannot read prope…...

【CPA考试】2024注册会计师报名照片尺寸要求解读及手机拍照方法
随着2024年注册会计师考试的临近,众多会计专业人士和学生都开始准备报名参加这一行业的重要考试,报名时间为4月8日至4月30日。报名过程中,一张符合要求的证件照是必不可少的。本文将为您详细解读2024年注册会计师考试报名照片的尺寸要求&…...

高并发环境下的实现与优化策略
在现代互联网应用中,高并发处理能力是衡量系统性能和稳定性的关键指标之一。尤其对于电商、社交、在线支付等业务场景,面对瞬间涌入的大规模用户请求,如何保证系统的稳定性和响应速度,对技术架构设计与优化提出了极高要求。本文将…...

华为海思校园招聘-芯片-数字 IC 方向 题目分享——第二套
华为海思校园招聘-芯片-数字 IC 方向 题目分享(共9套,有答案和解析,答案非官方,未仔细校正,仅供参考)——第二套(共九套,每套四十个选择题) 部分题目分享,完整版获取&am…...

UML2.0在系统设计中的实际使用情况
目前我在系统分析设计过程中主要使用UML2.0来表达,使用StarUML软件做实际设计,操作起来基本很顺手,下面整理一下自己的使用情况。 1. UML2.0之十三张图 UML2.0一共13张图,可以分为两大类:结构图-静态图,行…...

django celery 异步任务 异步存储
环境:win11、python 3.9.2、django 4.2.11、celery 4.4.7、MySQL 8.1、redis 3.0 背景:基于django框架的大量任务实现,并且需要保存数据库 时间:20240409 说明:异步爬取小说,并将其保存到数据库 1、创建…...

apex0.1版本安装踩坑指南
踩了无数坑,发现只需要三行命令就可以成功安装apex0.1. 由于pip命令下只能找到0.9的版本,所以需要git clone的方式安装。 1. git clone https://www.github.com/nvidia/apex 这个命令的意思是下载apex到本地。注意,这里需要稳定的环境…...

HTML — 弹性布局(2)
弹性布局的其他属性 1. order 决定弹性项目(flex item)的排列顺序,使用较少,默认为0 。 order 的值可以为任意整数(正整数或负整数均可,也可为0),数值越小越排在前面。 2. align-s…...

MYSQL 8.0版本修改用户密码(知道登录密码)和Sqlyog错误码2058一案
今天准备使用sqlyog连接一下我Linux上面的mysql数据库,然后就报如下错误 有一个简单的办法就是修改密码为password就完事!然后我就开始查找如何修改密码! 如果是需要解决Sqlyog错误码2058的话,执行以下命令,但是注意root对应host是不是loca…...

Linux中磁盘管理
一.磁盘管理的概括和简要说明 磁盘空间的管理,使用硬盘三步: (1)分区: (2)安装文件系统格式化 (3)挂载: 硬盘的分类: (1&#x…...

tailwindcss在manoca在线编辑智能感知
推荐一下monaco-tailwindcss库,它实现在monaco-editor网页在线编辑器中对tailwindcss的智能感知提示,在利用tailwindcss实现html效果布局。非常的方便。 生成CSS...

通过本机调试远端路由器非直连路由
实验目的:如图拓扑,通过本机电脑发,telnet调试远程AR4设备。 重点1:通过ospf路由协议配置拓扑网络,知识点:ospf配置路由器协议语法格式,area区域的定义,区域内网络的配置࿰…...

React路由快速入门:Class组件和函数式组件的使用
1. 介绍 在开始学习React路由之前,先了解一下什么是React路由。React Router是一个为React应用程序提供声明式路由的库。它可以帮助您在应用程序中管理不同的URL,并在这些URL上呈现相应的组件。 2. 安装 要在React应用程序中使用React路由,…...

Pytorch数据结构:GPU加速
文章目录 一、GPU加速1. 检查GPU可用性:2. GPU不可用需要具体查看问题3. 指定设备4.将张量和模型转移到GPU5.执行计算:6.将结果转移回CPU 二、转移原理1. 数据和模型的存储2. 数据传输3. 计算执行4. 设备管理5.小结 三、to方法的参数类型 一、GPU加速 .…...

OpenHarmony开发-连接开发板调试应用
在 OpenHarmony 开发过程中,连接开发板进行应用调试是一个关键步骤,只有在真实的硬件环境下,我们才能测试出应用更多的潜在问题,以便后续我们进行优化。本文详细介绍了连接开发板调试 OpenHarmony 应用的操作步骤。 首先…...

RabbitMQ如何保证消息的幂等性???
在RabbitMQ中,保证消费者的幂等性主要依赖于业务设计和实现,而非RabbitMQ本身提供的一种直接功能。 在基于Spring Boot整合RabbitMQ的场景下,要保证消费者的幂等性,通常需要结合业务逻辑设计以及额外的技术手段来实现。以下是一个…...

【QT】Qt Charts的实际使用中的一些小细节完善如:resetZoom、fitInView
在Qt中, 使用 Qt Charts来创建和操作图表,重置图表缩放状态的功能可以通过调整图表视图的缩放比例来实现。Qt Charts中的QChartView提供了相关的方法来控制图表的缩放和平移。 示例代码,以及如何对此功能进行扩展: #include <…...

上位机图像处理和嵌入式模块部署(qmacvisual缺失的颜色检测)
【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 在图像处理当中,对颜色的处理是非常重要的。当然,这要建立在拍摄图片是彩色图片的基础之上。工业上面,虽然是黑…...

macOS制作C/C++ app
C/C制作macOS .app 一、 .app APP其实是一个文件夹结构,只不过mac的界面中让它看起来像一个单独的文件。 在shell终端或者右键查看包结构即可看到APP的目录结构。 通常的app目录结构如下: _CodeSignature, CodeResources 一般为Mac APP Store上架程序…...

学习笔记——C语言基本概念链表——(12)
在介绍链表之前先介绍一下数据结构的分类: 线性结构:数组,链表,栈,队列 顺序结构:数组 链式结构:链表 非线性结构:树,二叉树 1、链表 特点:利用碎片化空…...

开发环境解决跨域问题
跨域 为什么? 浏览器的同源策略(协议,域名,端口必须相等) http://localhost:9528/ (前端页面) ---------------------》后端接口(https://heimahr.itheima.net/api) 后端没有开启CORS 在后端没有开启CO…...

物理服务器与云服务器的租用对比
物理服务器:每个基于 Web 的应用程序都依赖于一个服务器,该服务器提供网络中的数据存储,并可根据请求提供给客户端。例如,用户使用浏览器访问 Web 应用程序。服务器可确保托管客户端可以使用该硬件组件。与其他托管可能性相比&…...

Ubuntu Desktop Server - Resource temporarily unavailable
Ubuntu Desktop Server - Resource temporarily unavailable 1. 问题2. 解决方案References 1. 问题 foreverstrongubuntu:~$ sudo apt-get install libatlas-base-dev [sudo] password for foreverstrong: E: Could not get lock /var/lib/dpkg/lock - open (11: Resource t…...

用Wireshark工具对gRPC接口进行本地抓包
前言: 本人一名敲代码的程序员,突然领导安排研究gRPC接口,并且抓包分析, 抓包工具试了Charles、mitmproxy都不行,浪费很多时间,最后使用Wireshark工具对本地启动的gRPC接口成功抓包,关于安装W…...

科技动态人工智能应用太空探索生物科技
根据最新的科技资讯,以下是一些值得关注的科技动态: 人工智能领域 智能体热潮 :随着大模型的研发热潮,AI智能体的发展迅速,它们被用作认知核心,具备强大的学习和迁移能力。智能体的架构和交互方式也在不断进…...

如何让MacOS「终端」走代理
在 MacOS 操作系统中,默认情况下,终端命令行不会通过代理进行网络连接。这导致在应用软件研发过程中,许多需要通过命令行下载安装的软件或依赖包无法成功安装。经常出现Failed to connect to xxx port 443 after 75329 ms: Couldnt connect t…...

数码相框-显示JPG图片
LCD控制器会将LCD上的屏幕数据映射在相应的显存位置上。 通过libjpeg把jpg图片解压出来RGB原始数据。 libjpeg是使用c语言实现的读写jpeg文件的库。 使用libjpeg的应用程序是以"scanline"为单位进行图像处理的。 libjpeg解压图片的步骤: libjpeg的使…...

PHP自带的密码加密函数Password_verify 和password_hash
Password_verify 和password_hash 这两个函数都是PHP自带的密码加密函数,通过底层实现,无法查看源代码 password_hash函数用于对用户输入的密码进行加密 Password_verify验证用户输入的密码是否正确 Tips:看到密码验证用的Password_verify&a…...