当前位置: 首页 > news >正文

解决生成式AI落地之困,亚马逊云科技提供完整解决方案

生成式AI技术无疑是当前最大的时代想象力之一。

 资本、创业者、普通人都在涌入生成式AI里去一探究竟:“百模大战”连夜打响,融资规模连创新高,各种消费类产品概念不断涌现……根据Bloomberg Intelligence 的报告,2022年生成式AI 市场规模仅为400 亿美元,预计到2032年这一数字将突破1.3 万亿美元,未来10 年的年均复合增速高达42%。

 然而,表面上看着热闹非凡,但生成式AI技术的普及和转化真的有我们想象的那么高吗?

 在经历了爆发式增长之后,6月以来,生成式AI聊天产品访问量几乎都出现了不同程度的下降。最新用户调查显示,有80%-90%以上的受访者表示未来六个月都完全不会使用ChatGPT、Bard等聊天工具。从消费端看,大家目前似乎更多地把生成式AI产品当成了一种追赶时尚潮流的玩具,而非持续使用的工具。

 而在企业端,这样的现象就更为明显。一旦人们切换到工作模式时,生成式AI工具便很少出现在大家的工作流程中,甚至还被很多大型公司等明令禁止或限制性使用。

 

 对于一个比较成熟技术的商业转化来说,6个多月的时间并不算短。但目前,关于生成式AI的狂想焦点似乎仍然还停留在大模型和产品概念上,人们预期所想看到的繁荣生态和对经济社会所产生的变革性影响还尚未到来。

 那么,究竟是什么桎梏着它的发展?

 生成式AI的落地之困:如何打破基础模型和开发者之间的“墙”?

 所有人都不想错过生成式AI浪潮。但当前生成式AI的超高进入门槛,把大部分玩家挡在了门外。

 过去这些年来,通过“深度学习+大算力”进行模型训练是实现人工智能最主流的技术途径。但大模型的商业化落地,必须得先回到成本核算上。

 首先,大模型对算力的需求极大,是一个巨型“吞金兽”。GPT-3.5模型的训练一次的成本约在300万到460万美元之间,一些更大的语言模型训练成本甚至高达1200 万美元。自研大模型是一个“无底洞”,不具备雄厚资金实力的创业公司根本无法承担。

 此外,通用模型并不能解决所有问题,能帮企业完成的事情非常有限。大模型的训练都是基于互联网上的公开数据完成,很多产品也相对孤立没有形成一个连贯的、整体的工作流,不具备定制化能力。意味着开发人员需要结合私有数据做大量个性化调试,开发训练门槛极高。

 而由于前期的巨额投入,就算大模型开始商业化之后,要实现盈利也往往需要长时间的积累。因此,要想生成式AI技术真正落地到各行各业中发挥效力,当前急需一种可负担、高效率、低门槛的解决方案,让更多人参与到入生成式AI的开发中来。

 那么,如何才能弥合从基础模型到终端应用之间的鸿沟?目前来看,提供一站式AI专业托管服务的云平台或许是当前的最佳解决路径。

 云平台拥有充足、灵活的算力资源,中小型企业不必自行购买和维护昂贵的硬件设备,即可满足个性化的开发需求。用户可以通过 API和SDK,便捷地调用云平台上的第三方资源和大包服务,将他们的应用和服务与云平台无缝衔接,最大化简化开发流程。

 此外,云平台还能够帮助解决数据的隐私安全问题。过去几个月来,包括苹果、三星、台积电、美国银行等很多大型企业都相继出台相关政策明令禁止员工使用ChatGP,纷纷开始自研大模型。而对于那些不具备自研实力的中小型企业来说,选择能够提供包括数据加密、身份验证、合规性工具等安全措施的云平台则是一个很好的低成本选项。

 针对当前的生成式AI浪潮,云平台是否已经具备大模型开发的相当能力,能够提供生成式AI的全流程服务呢?

 在刚刚落幕的亚马逊云科技纽约峰会上,我们看到了一份基于云的生成式AI完整解决方案。

 亚马逊云科技,创建生成式AI普惠新范式

 此次,亚马逊云科技延续了过去一贯的“务实”风格,瞄准当前生成式AI应用转化所面临的痛点问题,上新了一系列全新的功能和服务。从硬件到软件,从开发端到应用端,试图打造一个功能最全、能力最强的生成式AI服务平台。

  • Amazon Bedrock服务:搭建生成式AI开发的“快速通道”

 针对开发层面基础模型训练成本昂贵、环境部署复杂的问题,今年4月,亚马逊云科技首次宣布推出Amazon Bedrock服务,允许用户通过可扩展、可靠且安全的亚马逊云科技托管服务,用API来便捷地访问来自不同供应商的基础模型,并利用它们来构建生成式AI应用程序。

 当时,除了自家的Titan大模型之外,首发第三方合作商及基础模型还包括AI21 Labs的Jurassic-2,Anthropic的Claude,以及Stability AI的Stable Diffusion。在这次的纽约峰会上,亚马逊宣布再次增加前生成式AI领域的最大独角兽之一的Cohere作为供应商,也新增了包括Anthropic最新的语言模型 Claude 2,和Stability AI最新版文生图模型套件 Stable Diffusion XL 1.0等基础模型。

 亚马逊云科技认为,未来一定不会是一个模型统管一切,Amazon Bedrock通过不断集成业界最领先的基础模型,用户将可以根据自身需求来便捷地调用最合适的模型。

 但基础模型有了之后,还有一个棘手的问题没有解决——如何使用这些模型进行个性化的应用开发?云平台还要进一步解决私有数据学习、系统集成和调试以及任务自动执行的问题。

 举一个我们在日常生活中经常会遇到的电商退换货的例子。你在电商平台买了双鞋子不太满意想要找客服换一个颜色,如果此时客服是ChatGPT等通用聊天机器人,他会怎么回答你?——“抱歉,我的训练数据截止日期是2021年9月,没有这双鞋的相关信息。”

 要想让大模型真正发挥作用,首先要做的就是提前把公司内部跟这双鞋所有有关的信息都“喂”给模型,包括鞋的型号颜色、平台的退换货政策、库存信息等等,模型才能准确地给出反馈。在给出信息的同时,还需要AI一边聊天一边能在后台有序、安全地执行有关换货的所有操作。

 在过去这对于开发者来说是一个庞大的工程,但现在,亚马逊新推出了一项名为Amazon Bedrock Agents服务,让这一切变得触手可及。

 最新的Amazon Bedrock Agents服务能够在基础模型的基础上,把对话的定义、模型外部信息获取和解析、API调用、任务执行等打包成为一个全托管式的服务,从而能够及时、有针对性的输出结果。

 如此一来,开发者不必重巨资从头开发自己的基础模型,也不要花费大量的时间和人力去进行模型的个性化部署和调试,从而能让开发者把更多的精力放在AI应用的构建和运营上,让不具备雄厚资金和技术实力的中小型开发者都可以加入到生成式AI浪潮中来。

  • “向量数据+硬件算力”双护航,铸造应用开发的最强大脑+最强底座

 进行模型的定制开发,除了需要如Amazon Bedrock这样的专业托管服务,也需要计算、存储、安全等其他相关能力,来保证模型的持续可用、和迭代升级。

 毋庸置疑,数据是人工智能出现和发展的基底。生成式AI为了学习和理解人类语言的复杂性,需要大量的训练数据,而这些训练数据通常是以“向量”的形式存在,也就是把自然语言转化为计算机可以理解和处理的数字。

 那么,什么是向量数据,为什么它对生成式AI的发展至关重要呢?

 假设你正在使用一个音乐推荐软件,我们可以把每首歌分别按照节奏、歌词、旋律等三个特征进行量化标记,比如第一首歌是(120,60,80),第二首歌是(100,80,70),当你告诉系统你喜欢第一首歌的节奏时,系统便会找到这首歌的节奏向量数据“120”,在数据库中查找与这个向量相似的其他向量,接着再把有相似特征的歌曲推荐给你。

 当然,不止是三维,一个数据还可以被标注成更多纬度。在自然语言处理中,使用词嵌入技术表示的“词向量”通常是几百维的,而在图像处理中,使用像素值表示的图像向量可能有数千到数百万的维度。被“向量化”之后的数据将被存储在向量数据库之中,在高维空间中去高效地检索和生成最相关或最相似的数据。

 然而,要将数据进行向量化处理和储存并不是一件容易的事,往往要耗费大量的人力和时间。针对这一问题,亚马逊云科技此次推出了适用于 Amazon OpenSearch Serverless 的向量引擎,该向量引擎能够支持简单的 API 调用,可用于存储和查询数十亿个 Embeddings(将高维度的数据映射到低维度空间的过程)。亚马逊云科技还表示,未来所有亚马逊云科技的数据库都将具有向量功能,在AI数据层面成为开发者的“最强大脑”。

 

 除了向量引擎的支持,在算力层面,亚马逊云科技也一直致力于构建低成本、低延迟的云上基础设施。

 亚马逊云科技和英伟达合作已超过12年,为人工智能、机器学习、图形、游戏和高性能计算等各种应用提供了大规模、低成本的 GPU 解决方案,在交付基于 GPU 的实例方面拥有无比丰富的经验。此次,亚马逊云科技展示了最新基于英伟达 H100 Tensor Core GPU 提供支持的P5实例,能够实现更低的延迟和高效的横向扩展性能。

 P5 实例将是第一个利用亚马逊云科技第二代 Amazon Elastic Fabric Adapter(EFA)网络技术的 GPU 实例。与上一代相比,P5实例的训练时间最多可缩短6倍,从几天缩短到几小时,这一性能提升将帮助客户降低高达40%的训练成本。借助第二代 Amazon EFA,用户能够将其 P5 实例扩展到超过 2 万个英伟达 H100 GPU,为包括初创公司、大企业在内的所有规模客户提供所需的超级计算能力。

  • 降低生成式AI门槛,用产品最大化赋能用户

 除了面向生成式AI开发的工具和平台之外,在企业的日常运营之中需要一些能够拿来即用的生成式AI产品,来帮助提升工作和管理效率。关于这一点,亚马逊云科技也陆续推出了一些在工作场景中直接可以使用的产品,这些产品既覆盖底层开发人员也关注到了企业中大量的非技术人员。

 比如在代码开发领域,自从亚马逊云科技在去年6月首次推出AI编程助手Amazon CodeWhisperer之后,现在该功能已经成为了很多开发者日常必备工具之一。

 Amazon CodeWhisperer基于几十亿行开源代码训练,可以根据代码注释和现有代码实时生成代码建议,另外还能进行安全漏洞扫描。目前支持包括 Python、Java 和 JavaScript 15 种编程语言和包括 VS Code、IntelliJ IDEA、JupyterLab 和 Amazon SageMaker Studio等集成开发环境。

 为了进一步提高开发效率,在纽约峰会上,亚马逊云科技正式宣布 Amazon Glue Studio Notebooks 也能支持 Amazon CodeWhisperer。通过 Amazon Glue Studio Notebooks,开发人员可以用自然语言编写特定任务,接着Amazon CodeWhisperer 可以直接在 Notebooks 中推荐一个或多个可完成此任务的代码片段,供开发人员直接使用和编辑。

Amazon CodeWhisperer支持语言和环境,图片来自亚马逊云科技官网

 而对于非开发类工作场景,通过将 Amazon Bedrock的大语言模型能力与支持自然语言问答的 Amazon QuickSight Q 相结合,为用户提供了基于生成式AI的商业智能新服务。

 比如你是一个财务分析师,你可以像跟ChatGPT聊天一样用自然语言下达命令,在几秒钟内Amazon QuickSight Q就能完成搜索关键财务信息或创建公司财务可视化图表的操作,同时还能帮你总结出趋势特点并提出建议。

 类似拿来即用的产品还有帮助企业打破内部信息孤岛、加快数据驱动决策的Amazon Entity Resolution,以及能够帮助医疗软件供应商便捷地构建基于生成式AI的临床应用程序的Amazon HealthScribe等等,在各行各业扩大着生成式AI产品的使用场景。

 释放AI时代的“云力量”

 生成式AI的发展需要云,更需要大量基于云的工具和服务。

 大模型之后,下一阶段生成式AI技术一定会朝着多样性和个性化方向发展,我们既可以看到比较通用的生产力工具,也会看到各种瞄准特定场景的AI产品。而在这个过程中,云平台会起到越来越关键的作用。

 一方面,云平台会大大降低AI应用开发的门槛。在平台的算力和基础模型支持下,开发者们基本无需关心硬件和基础设施的问题,从而把更多的时间和精力放在业务和运营上。另一方面,云平台能够持续加快AI应用的开发和运营效率。用户可以通过直接调用API的方式进行应用的开发和管理,并安全、便捷地在团队或组织之间共享。

 在云平台的助力之下,未来的生成式AI将不再只是一场巨头才能玩的“烧钱游戏”,更多普通人也将可以坐上牌桌。

 作为云服务领域的行业领导者之一,亚马逊云科技提供了200多种服务,涵盖了计算、存储、数据库、网络、开发者工具、安全、分析、物联网、企业应用等广泛领域,云基础设施覆盖全球。同时,亚马逊云科技还是人工智能和机器学习领域的领先者,多年来持续提供和更新着一系列端到端的AI相关服务,让开发者可以灵活、便捷、低成本的开发和部署生成式AI应用。

 此次,亚马逊云科技发布生成式AI工具“全家桶”,其核心目的就是要进一步降低生成式AI开发的门槛,让更多不懂大模型、不懂人工智能的普通人也能快速加入生成式AI的开发和应用之中。

 生成式AI的重要性不在于模型有多大能力有多强,更重要的还是如何能够从基础模型演变成各个领域中的具体应用,从而赋能整个经济社会的发展。

 现在,亚马逊云科技正在成为那个桥梁。

相关文章:

解决生成式AI落地之困,亚马逊云科技提供完整解决方案

生成式AI技术无疑是当前最大的时代想象力之一。 资本、创业者、普通人都在涌入生成式AI里去一探究竟:“百模大战”连夜打响,融资规模连创新高,各种消费类产品概念不断涌现……根据Bloomberg Intelligence 的报告,2022年生成式AI 市…...

【5款登录验证校验】基于jquery实现的5款登录验证码组件(附完整源码)

文章目录 写在前面涉及知识点1、随机字母验证码1.1 效果1.2 实现源码 2、数字运算验证码2.1 效果2.2 实现源码 3、滑块验证码3.1 效果3.2 实现源码 4、图片补全验证码4.1 效果4.2 实现源码 5、顺序点选验证码5.1 效果5.2 实现源码 6、源码分享6.1 百度网盘6.2 123网盘6.3 邮箱留…...

数据结构的树存储结构

数据结构的树存储结构 之前介绍的所有的数据结构都是线性存储结构。本章所介绍的树结构是一种非线性存储结构,存储的是具有“一对多”关系的数据元素的集合。 (A) (B) 图 1 树的示例 图 …...

linux--epoll

epoll 参考文献 https://www.cnblogs.com/lojunren/p/3856290.html https://www.51cto.com/article/717096.html linux下的I/O复用epoll详解 要深刻理解epoll,首先得了解epoll的三大关键要素:mmap、红黑树、链表。 IO多路复用 首先需要了解什么是IO多…...

async和await

一,基本使用 其实就是之前学过的异步函数,异步编程在函数前写一个ansyc,就转化为异步函数,返回的是一个promise对象,于是就可以使用await关键字,可以把异步函数写成同步函数的形式,极大地提高代…...

如何从cpu改为gpu,pytorch,cuda

1.cmd输入nvcc -V 2.得到 cuda版本后,去pytorch官网 3.根据自己的cuda进行选择 4.复制上述链接,进入cmd 5.cmd中输入activate XXX,这里的"XXX"指代自己在工程中用到的环境 6.进入后,将刚才链接粘贴,回车等待下载结束 …...

JavaScript简介--语句--变量

目录 JavaScript简介 为什么学习 JavaScript JavaScript与ECMAScript的关系 JavaScript版本 JavaScript语句、标识符 语句 标识符 JavaScript保留关键字 变量 变量的命名规则 数据类型 变量的重新赋值 变量提升 运算符 条件语句 循环语句 JavaScript简介 JavaScri…...

Windows CMD 关闭,启动程序

Windows CMD 关闭,启动程序 1. Windows 通过 CMD 命令行关闭程序 示例:通过 taskkill 命令关闭 QQ 管家,但是这里有个问题,使用命令行关闭 QQ 管家时,会提示“错误: 无法终止 PID 1400 (属于 PID 22116 子进程)的进程…...

统计XML标注文件中各标注类别的标签数量

目标检测任务重,担心数据集中各标签类别不均衡,想统计XML标注文件中各标注类别的标签数量,可以使用以下脚本: import os import glob import xml.etree.ElementTree as etdef count_labels(source_dir):file_list glob.glob(os.…...

一百六十、Kettle——Linux上安装的Kettle9.2.0连接Hive3.1.2

一、目标 Kettle9.2.0在Linux上安装好后,需要与Hive3.1.2数据库建立连接 之前已经在本地上用kettle9.2.0连上Hive3.1.2 二、各工具版本 (一)kettle9.2.0 kettle9.2.0安装包网盘链接 链接:https://pan.baidu.com/s/15Zq9w…...

C++新经典03--共用体、枚举类型与typedef

共用体 共用体,也叫联合,有时候需要把几种不同类型的变量存放到同一段内存单元,例如,把一个整型变量、一个字符型变量、一个字符数组放在同一个地址开始的内存单元中。这三个变量在内存中占的字节数不同,但它们都从同…...

HCIP-OpenStack组件介绍

openstack把这些组件服务都集成到httpd服务中了,目的是为了提升性能。登入不了openstack在控制节点查下httpd服务,systemctl status httpd Horizon:提供webUI图形化界面的 Keystone:提供身份认证服务、授权、endpoint端点&#xf…...

2682. 找出转圈游戏输家

题目描述&#xff1a; n 个朋友在玩游戏。这些朋友坐成一个圈&#xff0c;按 顺时针方向 从 1 到 n 编号。从第 i 个朋友的位置开始顺时针移动 1 步会到达第 (i 1) 个朋友的位置&#xff08;1 < i < n&#xff09;&#xff0c;而从第 n 个朋友的位置开始顺时针移动 1 步…...

RESTAPI简介与DRF使用

RESTAPI 以资源为url&#xff0c;通过不同的请求方式实现不同的行为。 以资源名作为url POST:增 …/student/ GET&#xff1a;查所有 …/student/ GET&#xff1a;查单个 …/student/<pk>/ 获取idpk的学生 DELETE&#xff1a;删 …/student/<pk>/ PUT&#…...

深度学习笔记(kaggle课程《Intro to Deep Learning》)

一、什么是深度学习&#xff1f; 深度学习是一种机器学习方法&#xff0c;通过构建和训练深层神经网络来处理和理解数据。它模仿人脑神经系统的工作方式&#xff0c;通过多层次的神经网络结构来学习和提取数据的特征。深度学习在图像识别、语音识别、自然语言处理等领域取得了…...

windows下载任意版本php

zz​​​​​​​windows.php.net - /downloads/releases/archives/ windows下载php&#xff0c;记录一下...

Linux命令

操作系统管理硬件设备&#xff0c;并为用户和应用程序提供一个简单的接口&#xff0c;以便于使用。&#xff08;作为中间人&#xff0c;连接软件和硬件&#xff09;不同应用领域的主流操作系统 桌面操作系统 Windows系列:&#xff1a;用户群体大 macOS&#xff1a;适合于开发人…...

TDD(测试驱动开发)?

01、前言 很早之前&#xff0c;曾在网络上见到过 TDD 这 3 个大写的英文字母&#xff0c;它是 Test Driven Development 这三个单词的缩写&#xff0c;也就是“测试驱动开发”的意思——听起来很不错的一种理念。 其理念主要是确保两件事&#xff1a; 确保所有的需求都能被照…...

C/C++

const 作用 修饰变量&#xff0c;说明该变量不可以被改变&#xff1b;修饰指针&#xff0c;分为指向常量的指针&#xff08;pointer to const&#xff09;和自身是常量的指针&#xff08;常量指针&#xff0c;const pointer&#xff09;&#xff1b;修饰引用&#xff0c;指向…...

CCF C³ 走进百度:大模型与可持续生态发展

2023年8月10日&#xff0c;由CCF CTO Club发起的第22期C活动在百度北京总部进行&#xff0c;以“AI大语言模型技术与生态发展”主题&#xff0c;50余位企业界、学界专家、研究人员就此进行深入探讨。 CCF C走进百度 本次活动&#xff0c;CCF秘书长唐卫清与百度集团副总裁、深…...

Vue使用html2canvas将DOM节点生成对应的PDF

要通过Vue使用html2canvas将DOM节点生成对应的PDF&#xff0c;您需要安装html2canvas和jspdf这两个库。html2canvas用于将DOM节点转换为Canvas&#xff0c;而jspdf用于将Canvas转换为PDF。以下是一个简单的示例代码&#xff0c;展示了如何使用html2canvas和jspdf生成PDF文件&am…...

专访阿里云席明贤,视频云如何运用大模型与小模型来破茧升级2.0

不久前&#xff0c;LiveVideoStack与阿里云视频云负责人席明贤&#xff08;花名右贤&#xff09;展开一场深度的对话&#xff0c;一个是圈内专业的社区媒体&#xff0c;一个是20年的IT老兵&#xff0c;双方有交集、有碰撞、有火花。 面对风云变幻的内外环境&#xff0c;阿里云…...

Vue 2的计算属性与侦听器

计算属性 vs 方法 vs 侦听器 计算属性的出现是为了解决模板内表达式太过复杂而变得难以维护。 假设我们知道长和宽&#xff0c;要计算一个矩形的面积&#xff0c;如果没有计算属性&#xff0c;我们可能像下面这样处理&#xff1a; <div id"app"><input t…...

JavaScript基础:学习JavaScript语言的基本语法和常用操作,了解网页交互的基本原理

JavaScript是一种广泛应用于网页开发中的脚本语言&#xff0c;它可以与HTML和CSS一起使用&#xff0c;实现网页交互及动态效果。 以下是JavaScript的基本语法和常用操作&#xff1a; 变量声明&#xff1a;使用var、let或const关键字声明变量。 var name "John";let …...

网络每日一练

吴泽彬 C Ip 网络层 Tcp udp 传输层&#xff0c; Http 应用层 收起 1 回复 发布于 2019-10-11 12:07 举报 fighting2016 Java A类地址中的私有地址和保留地址&#xff1a; ①10.0.0.0到10.255.255.255是私有地址&#xff08;所谓的私有地址就是在互联网上不使用&#xff0c;而被…...

asp.net core读取request内容

在Startup.cs中定义Middleware&#xff0c;设置缓存Http请求的Body数据。代码如下。自定义Middleware请放到Configure方法的最前面。 app.Use(next > new RequestDelegate(async context > {context.Request.EnableBuffering();await next(context);})); GET请求 HttpC…...

笔记:移植xenomai到nuc972(2)

接下来的测试,出现了两个问题 第一个问题是demo程序启动不了,这是上一篇文章忘记说的事,启动不了的原因是权限问题,提示需要root, 但我是用busybox搭的文件系统,直接就是root,不存在权限问题,所以问题出在应用上,经过一番调试后发现,问题出在xenomai的应用库上,具体位置在xen…...

记忆正则表达式的基本元件

正则常见的三种功能&#xff0c;它们分别是&#xff1a;校验数据的有效性、查找符合要求的文本以及对文本进行切割和替换等操作。 正则表达式&#xff0c;简单地说就是描述字符串的规则。在正则中&#xff0c;普通字符表示的还是原来的意思&#xff0c;比如字符 a&#xff0c;…...

低代码是什么?解决哪些问题?什么业务场景适合用低码开发?

目录 一、低代码是什么&#xff1f; 二、低代码解决方案的主要特点 01.可视化开发环境 02.预构建的组件和模板 03.集成的开发和测试工具 04.跨平台兼容性 05.可伸缩性和可扩展性 三、开发工具中的强者 ​四、你所在企业为什么要关心低代码开发&#xff1f; ​五、什么业务场景适…...

SOA架构

SOA架构 Service-Oriented Architecture&#xff0c;SOA是一种软件架构模式&#xff0c;旨在将应用程序的不同功能划分为一组可重用的、自治的、可互操作的服务。 每个服务表示一个特定的业务功能&#xff0c;并通过定义明确的接口和协议来实现与其他服务的通信。 SOA的主要目…...