科技云报道:打造生成式AI应用,什么才是关键?
科技云报道原创。
生成式AI作为当前人工智能的前沿领域,全球多家科技企业都在加大生成式AI的研发投入力度。
随着技术、产品及应用等方面不断推出重要成果,如今有更多的行业用户在思考该如何将生成式AI应用落地。
但开发生成式AI应用是一个充满挑战的系统工程,并不是单纯的产品和服务拼接,涉及基础设施领域一系列的挑战。
亚马逊云科技大中华区产品部总经理陈晓建表示,当我们谈论生成式AI时,大多数人都在谈论基础模型,而整个生成式AI应用就像是浮在海面的冰山,露在海面上方能被大多数人看到的冰山一角就像是基础模型,而在冰川的底部,同样需要大量的基础模型以外的服务来支撑,如加速芯片、数据库、数据分析、数据安全服务等等。
那么,想要构建一个成功的生成式AI应用,需要哪些基础设施助力?业界是否有一些最佳实践可以参考呢?
生成式AI应用构建的关键
高性价比的基础设施
都说算力、算法和数据是人工智能发展的三要素,想要让这些要素更好地与生成式AI应用匹配,高性价比的基础设施必不可少。
AI高性能芯片为生成式AI训练提供算力支撑
人工智能的发展从深度学习时代进入到大模型时代,大规模预训练模型的参数量呈现指数级上升,需要高性能算力的支撑。
目前,大规模预训练模型训练算力是以往的10到100倍,当前主流生成式AI模型的训练广泛使用到英伟达Tensor Core GPU芯片,如微软斥资数亿美元购买数万颗英伟达A100芯片以帮助Open AI打造ChatGPT。
AI计算集群为生成式AI模型训练降低成本
AI计算集群能够提供大规模算力、持续提高算力资源利用率、提升数据存储和处理能力,进一步降低模型训练门槛和成本,推动生成式AI模型的落地进程。
当前较为典型的AI计算集群,例如基于英伟达最新GPU芯片H100 Tensor Core的Amazon EC2 P5实例,与上一代相比速度快6倍,训练成本节省40%;
基于亚马逊云科技自研的机器学习推理芯片Amazon Inferentia2推出的Amazon EC2 Inf2实例,与其他类似的EC2实例相比性价比高40%;
基于自研机器学习训练芯片Amazon Trainium推出的Amazon EC2 Trn1实例,与同类实例相比训练成本节省高达50%。
这也是为什么有越来越多的客户,比如Airbnb、OPPO、Sprinklr 和 Autodesk等,会选择使用亚马逊云科技的自研芯片来承载他们的生成式AI应用。
基础模型服务为构建生成式AI提升效率
生成式AI的核心是利用机器学习领域的基础模型驱动的,从RNN、CNN到VAE、GAN,每种模型都有其独特的优点和应用领域,这些模型在很大程度上决定了AI系统的表现。
然而,基础模型的发展和迭代速度正超越以外任何一项技术,基本以月甚至天为单位持续迭代。
在众多的基础模型中,应该如何便捷安全的选择最适合自己业务场景的基础模型,是每一家企业在构建生成式AI应用时面临的挑战。
事实上,借助专门构建的生成式AI工具和基础设施,可以帮助企业快速构建高性价比的生成式AI应用。
例如,亚马逊云科技Amazon Bedrock是一项无服务器服务,提供了广泛的模型选择、数据隐私,并且能够自定义模型,无需管理任何基础设施。
该服务提供的基础模型来自Meta, Anthropic, Stability AI, AI21 Labs, Cohere等第三方领先提供商以及自身的Amazon Titan模型等,近期还加入了Meta的下一代开源大模型Llama2以及Anthropic的Claude2等热门基础模型。
同时,Amazon Bedrock与Amazon SageMaker Jumpstart结合,用户可以从Amazon SageMaker Jumpstart中选择开源的基础模型,然后根据自身需求可以选择全量微调,轻量微调等不同方式,进一步确定微调框架,利用分布式训练实现微调,从而更好的评估微调效果。
云原生服务加速生成式AI应用构建
人工智能预训练模型的开发对于云服务有较大需求,AI云服务可以提供人工智能开发模块,通过多元化的服务模式,降低开发者的开发成本和产品开发周期,为模型开发提供AI赋能。
尤其是借助云原生服务,可以加速AI应用构建,助力业务敏捷创新。
比如,以微服务化和事件驱动架构为核心的设计框架,松耦合的去处理每个功能模块之间的互相依赖;Serverless First能够简化运维、提升效率;在DevOps、基础设施即服务、自动化等现代应用治理理念持续投入,可以促进企业内部的应用资产与实践的分享,构建高效敏捷的构建者文化等等。
数据服务为生成式AI打造基座
数据作为生成式AI的关键,也将推动生成式AI的广泛应用,对于所有的组织企业来说都十分重要。
首先,面向生成式AI构建强大的数据“基座”,需要一套全面的服务,以便能够存储用于构建和微调模型的各种类型的数据;
其次,还需要服务间的集成,以打破数据孤岛,确保能够随时访问所有数据;
最后,还需要在构建生成式AI应用程序的整个生命周期中,确保数据安全并对其进行管理。
以亚马逊云科技为例,针对生成式AI领域的用户个人信息、会话信息管理、私域知识库等应用场景都提供了专门构建的数据库。
在数据集成方面,亚马逊云科技已经在Amazon S3、Amazon Aurora、Amazon Redshift、Amazon SageMaker、Amazon EMR、Amazon Athena、Amazon Kinesis等各项服务之间,实现了深度的数据集成,帮助企业执行分析和机器学习,且无需移动数据。
在数据治理方面,亚马逊云科技Amazon DataZone让客户能够跨组织边界发现、访问、共享和治理大规模数据,并减少企业内部成员访问数据和使用分析工具时繁重的工作量。
构建生成式AI
应用的行业实践
目前,由生成式AI引导的企业变革序幕全面展开,以多元应用不断创新AI应用范式,并将实践成果逐步延伸至智慧教育、智能制造、医疗等领域,真正成为人们生产生活的得力助手。
其中,在行业类应用场景中,AI助手类应用得到了广泛运用,比如在协同办公赛道就掀起了新风口:
钉钉接入千问大模型,用户可以唤起10余项AI能力如:自动整理群聊要点、生成待办、预约日程、写文案、生成海报、一键生成讨论要点等。
飞书宣布推出智能助手“My AI”,功能包括汇总会议纪要、创建报告、优化和续写文字内容等功能。
金山办公推出“WPS AI”,支持内容生成、公式生成、制作PPT、扫描识别并分析文件等功能。
而在金融、医疗、工业等领域,最具前景的应用则来自于数据挖掘和知识洞察(Insight)类工具。
但无论是哪种形式的生成式AI的应用落地,背后都离不开强大的基础设施作为支撑。
金山办公软件股份有限公司的 AI 研发总监刘强表示,今年起WPS开始将大语言模型的能力全面引入产品,致力于开发新一代办公软件。
而在构建生成式AI应用的过程中,基础模型性能有限,数据隐私与安全难以保障,高额管理成本等现实情况成为了摆在金山办公面前的重重障碍。
亚马逊云科技Amazon Bedrock中支持的领先大语言模型,在多个文字处理场景中符合金山办公的需求。
除多种模型选择外,Amazon Bedrock还在数据安全层面给金山办公提供了充分的支持,极大地提高了金山办公的内部开发效率,助力金山办公进一步革新办公体验。
西门子中国也借助了一系列云基础设施、大数据、机器学习等技术,来构建生成式AI应用。
据西门子中国大禹团队介绍,长期以来企业内部资源的检索和调用都存在结构散乱、检索速度慢、交互不便等问题。因此,大禹团队决定将大数据库和生成式 AI 应用于一个全新的“智能知识库”,从根本上提升知识库的可用性。
在亚马逊云的技术支持下,西门子中国大禹团队通过一个智能知识库暨智能会话机器人的解决方案,三个月时间就上线了生成式AI对话机器人“小禹”,实现了快速、精准的查询和回复。
在整个解决方案中,包括预训练大语言模型,Amazon OpenSearch Service的向量数据服务,以及相关系统集成等,这些核心关键能力让解决方案指南能实现目标知识库约80%功能,西门子中国根据企业内部需求再做20%定制化开发,最终形成完整的解决方案。
同时,Amazon OpenSearch Service的无服务器特性,让开发人员不需要管理集群或担心生产规模,可以快速推动部署。
基于Amazon SageMaker上提供的丰富的模型开发和训练工具,也保证了开发人员可以在云端轻松实现大语言模型的调优以及测试更多不同类型的开源模型。
结语
生成式AI正在成为企业新一轮业务创新的重要工具,成为下一代的生产力工具。
总体来看,高性价比的云基础设施技术如同一艘航母,能够为企业提供坚实的底座,让企业摆脱基础设施的束缚,更好、更高效地专注于创新。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。
相关文章:

科技云报道:打造生成式AI应用,什么才是关键?
科技云报道原创。 生成式AI作为当前人工智能的前沿领域,全球多家科技企业都在加大生成式AI的研发投入力度。 随着技术、产品及应用等方面不断推出重要成果,如今有更多的行业用户在思考该如何将生成式AI应用落地。 但开发生成式AI应用是一个充满挑战的…...

可回馈式电子负载的工作原理
可回馈式电子负载是一种用于模拟负载并测试电源或电子设备性能的工具。其工作原理如下: 控制回路:可回馈式电子负载内部有一个控制回路,用于监测和控制负载的电流、电压和功率等参数。这个控制回路可以根据用户设定的参数,自动调整…...

基于Vite使用VitePress搭建静态站点博客
使用VitePress搭建静态站点博客 官方文档什么是VitePress?一、初始化项目1.安装依赖包VitePress可以单独使用,也可以安装到现有的项目中。在这两种情况下,您都可以安装它: (也可以全局安装,建议:当前项目内安装) 2.初始…...

湖南互联网医院-让患者随时随地接受医疗服务
打造移动互联网医院,就是,通过移动互联网将医院与患者、医院内部(医生、护士、领导层)、医院与生态链上的各类组织机构连接起来。以患者为中心,优化医院业务流程,提升医疗服务质量与医院资源能效࿰…...

【建议收藏】免费体验的AI论文写作网站-「智元兔 AI」
在当今技术飞速发展的时代,越来越多的领域开始应用人工智能(Artificial Intelligence,简称AI)。其中,AI写作工具备受瞩目,备受推崇。 在众多的选择中,智元兔AI是一款在笔者使用过程中非常有帮助…...

CUDA编程
线程全局索引计算方式 一维网格和一维的线程块 计算方法:...

gorilla/websocket的chat示例代码简单分析
代码地址:https://github.com/gorilla/websocket/tree/main/examples/chat 文件包含:main.go、hub.go、client.go、home.html main.go文件 func main() {flag.Parse()hub : newHub() // 实例化Hubgo hub.run() // 使用chan处理 增删Hub的连接 和 广播消…...

地图坐标展示工具folium
参考:https://github.com/python-visualization/folium https://zhuanlan.zhihu.com/p/384078185?utm_id0 https://www.w3cschool.cn/article/37568875.html 其他还有baidu:echarts 安装: pip install folium代码(离线地图&a…...

Ruby 之方法委托
ruby 方法委托的优点在于,可以将多个不同实例(或类)的方法组织在一起,然后进行统一调用,方便各类方法的统一管理。比如下边示例中的 color 和 username,本来是不同类里边的方法,但最后都可以统一…...

[论文笔记]RetroMAE
引言 RetroMAE,中文题目为 通过掩码自编码器预训练面向检索的语言模型。 尽管现在已经在许多重要的自然语言处理任务上进行了预训练,但对于密集检索来说,仍然需要探索有效的预训练策略。 本篇工作,作者提出RetroMAE,一个新的基于掩码自编码器(Masked Auto-Encoder,MAE)…...

服务熔断保护实践--Sentinal
目录 概述 环境说明 步骤 Sentinel服务端 Sentinel客户端 依赖 在客户端配置sentinel参数 测试 保护规则设置 设置资源名 设置默认的熔断规则 RestTemplate的流控规则 Feign的流控规则 概述 微服务有很多互相调用的服务,构成一系列的调用链路…...

页面淘汰算法模拟实现与比较
1.实验目标 利用标准C 语言,编程设计与实现最佳淘汰算法、先进先出淘汰算法、最近最久未使用淘汰算法、简单 Clock 淘汰算法及改进型 Clock 淘汰算法,并随机发生页面访问序列开展有关算法的测试及性能比较。 2.算法描述 1. 最佳淘汰算法(Op…...

FPGA实现HDMI转LVDS视频输出,纯verilog代码驱动,提供4套工程源码和技术支持
目录 1、前言免责声明 2、目前我这里已有的图像处理方案3、本 LVDS 方案的特点4、详细设计方案设计原理框图视频源选择静态彩条IT6802解码芯片配置及采集ADV7611解码芯片配置及采集silicon9011解码芯片配置及采集纯verilog的HDMI 解码模块奇偶场分离并串转换LVDS驱动 5、vivado…...

JAVA-easyexcel多sheet页导入
今天给宝子带来一套多sheet页导入的模板,话不多说直接上代码 String localFilePath "file.xlsx";JSONObject jsonObject JSON.parseObject(file);String useFile jsonObject.getString("file");useFileuseFile.replace("\\\\",&qu…...

Java——比较器(一文搞懂比较器Comparable和Comparator)
基于Comparable的接口类基于Comparator的接口类 1、比较器的Comparable接口类 Comparable类的定义: public interface Comparable<T>{ public int compareTo(T o); }2、Comparable比较器的返回值: 此方法返回一个int类型的数据,但是此int的值…...

企业直播招聘抖音报白如何实现?怎么样才能报白成功?
现在每天几亿人都在使用抖音等短视频平台进行娱乐或者工作学习,也有很多商家和企业利用抖音等短视频平台进行盈利和企业宣传相关的服务,其中比较典型的就是通过抖音直播等功能为自身企业进行招聘。 但是通过抖音等短视频平台进行招聘时,很多…...

【考研数学】概率论与数理统计 —— 第七章 | 参数估计(2,参数估计量的评价、正态总体的区间估计)
文章目录 一、参数估计量的评价标准1.1 无偏性1.2 有效性1.3 一致性 二、一个正态总体参数的双侧区间估计2.1 对参数 μ \mu μ 的双侧区间估计 三、一个正态总体的单侧置信区间四、两个正态总体的双侧置信区间写在最后 一、参数估计量的评价标准 1.1 无偏性 设 X X X 为总…...

【设计模式】第10节:结构型模式之“组合模式”
一、简介 组合模式:将一组对象组织成树形结构,将单个对象和组合对象都看做树中的节点,以统一处理逻辑,并且它利用树形结构的特点,递归地处理每个子树,依次简化代码实现。使用组合模式的前提在于࿰…...

改进YOLOv3!IA-YOLO:恶劣天气下的目标检测
恶劣天气条件下从低质量图像中定位目标还是极具挑战性的任务。现有的方法要么难以平衡图像增强和目标检测任务,要么往往忽略有利于检测的潜在信息。本文提出了一种新的图像自适应YOLO (IA-YOLO)框架,可以对每张图像进行自适应增强,以提高检测…...

Vue路由跳转的几种方式
1.this. $router.push( ) 跳转到指定的URL,在history栈中添加一个记录,点击后退会返回上一个页面。 1. 不带参数// 字符串this.$router.push(/home)this.$router.push(/home/first)// 对象this.$router.push({path:/home})this.$router.push({ path: /…...

TiDB x 汉口银行丨分布式数据库应用实践
汉口银行是一家城市商业银行,近年来专注科技金融、民生金融等领域。在数据库国产化改造中,汉口银行引入了 TiDB 数据库,并将其应用在重要业务系统:头寸系统中,实现了一栈式的数据服务,同时满足了高并发、低…...

uci机器学习数据库简介
UCI(University of California, Irvine)机器学习数据库是经过精心整理的、用于研究和开发机器学习算法的数据集合。UCI机器学习数据库是一个公开的、广泛使用的数据集合,它由加州大学欧文分校的计算机科学系维护。该数据库中包含了许多数据集…...

多人协作使用git如何解决冲突?
什么情况会产生冲突 git merge XXX(合并分支时的冲突): 当你尝试将一个分支的更改合并到另一个分支时,如果两个分支都修改了相同的文件的相同部分,Git 将无法自动解决冲突,因此会发生冲突。你需要手动解决这些冲突,然后…...

基于【逻辑回归】的评分卡模型金融借贷风控项目实战
背景知识: 在银行借贷过程中,评分卡是一种以分数形式来衡量一个客户的信用风险大小的手段。今天我们来复现一个评分A卡的模型。完整的模型开发所需流程包括:获取数据,数据清洗和特征工程,模型开发,…...

企业拉美跨境出海面对时延情况怎么办?
随着全球化不断发展,中国企业也不断向海外拓展业务,开拓市场,增加收入来源,扩大自身品牌影响力。然而出海企业面临不同以往的困难和挑战,在其中不可避免面临的跨境网络时延问题,如何选择区域进行部署企业业…...

【vector题解】只出现一次的数字 | 电话号码的数字组合
只出现一次的数字 力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 给你一个整数数组 nums,其中恰好有两个元素只出现一次,其余所有元素均出现两次。 找出只出现一次的那两个元素。你可以按 任意顺序 返回答案。 你必须设计并…...

VS2022 开发方式
使用 C# 在VS 2022 上开发时,发现有多种项目类型可以创建。这些类型放一起容易搞混,于是记录一下各种类型的区别。 这里主要介绍windows控制台程序、MFC程序、WPF程序、WinForm程序的特点。 创建哪种应用? 创建控制台应用 Windows控制台程序…...

【Python语言速回顾】——数据可视化基础
目录 引入 一、Matplotlib模块(常用) 1、绘图流程&常用图 编辑 2、绘制子图&添加标注 编辑 3、面向对象画图 4、Pylab模块应用 二、Seaborn模块(常用) 1、常用图 2、代码示例 编辑 编辑 编辑 …...

java实现pdf文件添加水印,下载到浏览器
java实现pdf文件添加水印,下载到浏览器 添加itextpdf依赖 <dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.8</version> </dependency>文件下载到浏览器和指定路径 …...

代码随想录算法训练营第四十一天丨 动态规划part04
01背包理论基础 见连接:代码随想录 416. 分割等和子集 思路 01背包问题 背包问题,大家都知道,有N件物品和一个最多能背重量为W 的背包。第i件物品的重量是weight[i],得到的价值是value[i] 。每件物品只能用一次,求解…...