Serverless + AI 让应用开发更简单
本文整理自 2024 云栖大会,阿里云智能高级技术专家,史明伟演讲议题《Serverless + AI 让应用开发更简单》
随着云计算和人工智能(AI)技术的飞速发展,企业对于高效、灵活且成本效益高的解决方案的需求日益增长。本文旨在探讨 Serverless 架构与 AI 技术的结合,如何通过 Serverless 函数计算和 AI 开发平台,助力企业简化应用开发流程,减少企业 AI 业务试错成本,加速业务创新,为企业业务发展提供无限可能。
Serverless+AI 的无限可能
客户构建 AI 应用的“绊脚石”
AI 作为一个新兴技术领域,企业可能面临技术积累不足的挑战,同时需要紧跟开源社区的创新步伐,将最新的技术和能力快速应用于业务中。同时,高性能计算资源(如 GPU)的获取成本高昂,且供应有限,企业难以仅靠标准化 API 跟上 AI 的发展步伐,这都对于希望尝试 AI 技术的开发者或中小企业构成了重大障碍。
而 Serverless 架构的核心优势在于其根据业务流量按需使用资源的能力,允许企业仅为其实际使用的计算资源付费,从而显著降低成本并提高效率。当这一理念与 AI 技术相结合时,便产生了新的应用开发模式,不仅降低了 AI 应用的入门门槛,还极大地提升了开发速度和灵活性。
成本优化与效率提升
Serverless 架构通过按需提供极细粒度的资源,避免了对闲置或空闲资源的浪费,确保企业只为真正发挥作用的算力付费。此外,通过简化基础设施代码与业务代码的分离,减少了发布成本和维护负担,使得企业能够更加专注于核心业务逻辑的开发。
灵活的资源供给与业务联动
Serverless 架构能够提供灵活的资源供给,满足业务高峰期的高并发需求,无需长期持有大量资源。同时,通过与大数据、对象存储等云产品无缝对接,Serverless 架构加速了数据处理和AI应用场景的构建,如音视频处理、智能数据分析等。
CAP:Serverless+AI 让应用开发更简单
面对 AI 技术快速发展带来的挑战,如技术积累不足、标准化能力滞后、高昂的算力成本及多样化需求难以统一满足等问题,阿里云推出了全新的云应用开发平台 CAP,重点聚焦于成本控制、模型托管服务、一键快速创建 AI 应用、AI 能力的云上编排和灵活的二次开发能力。旨在帮助客户加速业务创新,减少企业试错成本,提升开发效率,并灵活适应不断变化的市场需求。
立即体验:https://cap.console.aliyun.com/whitelist
CAP 有奖评测正在进行中!
三步轻松完成云应用开发平台 CAP 快速部署体验评测,赢罗技无线键盘、WIFI 智能插座、泼墨马克杯。
立即参与:https://developer.aliyun.com/topic/cloud-application-platform
云应用开发平台 CAP 具备以下四大核心特性:
- 一键极速创建 AI 应用: 满足缺乏专业运维团队或研发能力的企业快速构建 AI 应用的需求,平台提供一键极速创建 AI 应用,使设计师和小微企业能够在短时间内将 AI 能力融入创新产品,加速市场推广。
- 按需模型托管服务: 平台提供了模型托管服务,不仅支持 API 化 AI 服务的快速接入,还允许企业托管自定义模型,以应对特定场景下的模型服务定制,高并发需求,实现个性化业务能力的拓展。成本上按需使用,按量付费,通过 Serverless 架构和 AI 能力的集成,解决小微企业客户“一卡难求”困境,降低企业的创新门槛和成本。
- 流程式开发工具: 通过集成 CloudFlow 等产品能力,平台支持用户对 API 和 AI 服务进行流程式的编排,满足多样化需求,同时保持开发流程的灵活性和可扩展性。
- 灵活的二次开发能力: 允许用户在平台提供的抽象原子服务基础上进行二次开发,通过组装式的理念替换部分服务或 API,加速产品落地。
Serverless 与 AI 的融合实践
云应用开发平台 CAP 的出现为企业提供了从传统应用智能化改造到 AI 应用快速开发的完整解决方案。无论是提升现有业务系统的智能水平,还是构建全新的 AI 应用,企业都能在该平台上找到合适的工具和服务。
高质量应用模板与二次开发
CAP 提供丰富的应用模板,涵盖问答对话、图像生成等多种场景,支持一键部署。用户可根据需求进行二次开发,如替换 API 供应商、引入开源模型或自定义服务,以满足特定业务需求。
卡片式集成与流程智能助手
CAP 采用卡片式集成方式,用户可通过拖拽操作快速组合不同的函数服务、流程编排等组件,实现灵活的场景构建。流程智能助手则通过自然语言理解,自动生成基本的流程原型,进一步降低开发门槛。
灵活,低成本的模型托管服务
AI 应用的开发离不开模型服务,基础大模型+领域模型已成为模型服务参与 AI 应用构建的共识,基础大模型服务化并不能完全的替代领域模型,同时开源驱动的模型服务日新月异,在这样的背景下,为 AI 开发者提供灵活,低成本的模型托管服务作为业务创新环节不可或缺的部分,是平台针对 AI 定制化需求提供的兜底能力。
以下几种基于 Serverless 架构的应用场景,利用其独特的技术优势,如事件驱动、高弹性和按需计费,为用户提供更智能、高效且灵活的服务。
- AI 应用: 提供了一系列预先构建的 AI 模板,覆盖了各类热门 AI 应用场景。结合 Serverless 的高弹性和成本效益,用户能够轻松创建自己的 AIGC(人工智能生成内容)云端环境,无需从零开始搭建基础设施。
- Web 应用: 为多种流行的编程语言配备了主流 Web 框架模板,使开发者能够迅速部署,并在熟悉的框架基础上进行二次开发,极大地提高了 Web 应用的开发速度和灵活性。
- ETL 数据处理应用: Serverless 架构的事件驱动特性,使其在数据处理领域展现出巨大潜力。以函数计算为例,它支持广泛的事件源,通过事件触发机制,只需少量代码和简单配置,即可实现数据的实时处理,简化了数据管道的构建流程。
- 音视频处理应用: 提供了一套基于 FFmpeg 的音视频处理解决方案,涵盖了转码、元信息提取、时长获取、格式转换、雪碧图生成、GIF 制作、水印添加等功能。这使得用户能够快速部署一个弹性、高可用、免运维、低成本且高度定制化的音视频处理服务,满足多样化需求。
- 文件处理应用: Serverless 由于其高弹性、开箱即用、免运维的特点非常适合处理文件。CAP 官方提供了丰富的文件处理的项目案例,例如 OSS 上传 Zip 文件自动解压、Zip 打包下载 OSS 文件等。
体验 CAP,测评有奖
CAP 快速部署项目体验评测活动正在进行中,领取免费试用额度,快速体验 CAP。三步完成评测,答题赢罗技无线键盘、WIFI 智能插座、泼墨马克杯。
立即参与评测:https://developer.aliyun.com/topic/cloud-application-platform
结语
Serverless 与 AI 的深度融合,为企业带来了前所未有的机遇,不仅降低了 AI 应用的开发难度和成本,还极大地提高了业务响应速度和灵活性。云应用开发平台 CAP 凭借其在成本控制、效率提升、资源灵活调配以及业务联动等方面的优势,正成为企业拥抱 AI、加速数字化转型的关键驱动力。未来,随着技术的不断进步和应用场景的不断拓展,Serverless 与 AI 的结合将持续为企业创造更多价值,推动智能应用开发进入一个全新的时代。
相关文章:

Serverless + AI 让应用开发更简单
本文整理自 2024 云栖大会,阿里云智能高级技术专家,史明伟演讲议题《Serverless AI 让应用开发更简单》 随着云计算和人工智能(AI)技术的飞速发展,企业对于高效、灵活且成本效益高的解决方案的需求日益增长。本文旨在…...

外包功能测试就干了4周,技术退步太明显了。。。。。
先说一下自己的情况,大专生,21年通过校招进入武汉某软件公司,干了差不多3个星期的功能测试,那年国庆,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落!而我才在一个外包企业干了4周的功…...
外观模式及运用场景
外观模式(Facade Pattern)是一种结构性设计模式,它为复杂子系统提供一个统一的接口,从而简化与这些子系统的交互。通过外观模式,客户端可以更轻松地使用复杂系统,而不必了解其内部实现。接下来,…...

PyQt5实战——多脚本集合包,UI以及工程布局(二)
个人博客:苏三有春的博客 系列往期: PyQt5实战——多脚本集合包,前言与环境配置(一) 布局 2.1 UI页面布局 整体框架分为分为三个部分,垂直分布。 第一个部分为功能选择按钮(如UTF-8转换&#…...

Python 数据结构对比:列表与数组的选择指南
文章目录 💯前言💯Python中的列表(list)和数组(array)的详细对比1. 数据类型的灵活性2. 性能与效率3. 功能与操作4. 使用场景5. 数据结构选择的考量6. 实际应用案例7. 结论 💯小结 💯…...

gem5运行简单RISC-V全系统模拟
简单记录gem5中运行最简单的RISC-V Full System Simulation的过程 首先是编译RISC-V和m5term,这部分不多写了,官网均有对应教程。 之后直接使用官方在configs/example/gem5_library目录下的riscv-fs.py 运行如下命令 ./build/RISCV/gem5.opt configs/…...
洛谷 P1195 口袋的天空
自用。 题目传送门:口袋的天空 - 洛谷 题解:Inori_333 参考题解:题解 P1195 【口袋的天空】 - 洛谷专栏 /*P1195 口袋的天空https://www.luogu.com.cn/problem/P11952024/11/03 submit:inori333 */#include <iostream> #include &…...

ffmpeg视频滤镜:膨胀操作-dilation
滤镜介绍 dilation 官网链接 > FFmpeg Filters Documentation 膨胀滤镜会使图片变的更亮,会让细节别的更明显。膨胀也是形态学中的一种操作,在opencv中也有响应的算子。此外膨胀结合此前腐蚀操作,可以构成开闭操作。 开操作是先腐蚀…...
3.3 windows,ReactOS系统中页面的换出----2,结构体PHYSICAL_PAGE
系列文章目录 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 例如:第一章 Python 机器学习入门之pandas的使用 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目…...

lvgl
lvgl 目录 lvgl Lvgl移植到STM32 -- 1、下载LVGL源码 -- 2、将必要文件复制到工程目录 -- 3、修改配置文件 将lvgl与底层屏幕结合到一块 -- lvgl也需要有定时器,专门给自己做了一个函数,告诉lvgl经过了多长时间(ms(毫秒)级别) 编写代码 lvgl的中文教程手册网站…...
【django】RESTful API 设计指南
目录 一、协议 二、域名 三、版本(Versioning) 四、路径(Endpoint) 五、HTTP动词 5.1 CRUD操作: 5.2 其他动词: 六、过滤信息(Filtering) 七、状态码(Status Co…...

提升大数据量分页查询性能:深分页优化全解
前言 在处理数据量逐渐增大的数据库表时,优化查询性能是一个常见的挑战。朋友们可能会建议说,创建索引不就能解决问题了吗?然而,当数据量达到相当规模时,简单的索引可能不足以应对所有情况。这时,可能会有…...
WPF 实现冒泡排序可视化
WPF 实现冒泡排序可视化 实现冒泡排序代码就不过多讲解,主要是实现动画效果思路,本demo使用MVVM模式编写,读者可自行参考部分核心代码,即可实现如视频所示效果。 对于新手了解算法相关知识应该有些许帮助,至于其它类型…...

Claude 3.5 新功能 支持对 100 页的PDF 图像、图表和图形进行可视化分析
Claude 3.5 Sonnet发布PDF图像预览新功能,允许用户分析长度不超过100页的PDF中的视觉内容。 此功能使用户能够轻松上传文档并提取信息,特别适用于包含图表、图形和其他视觉元素的研究论文和技术文档。 视觉PDF分析:用户现在可以从包含各种视觉…...

正式开源:从 Greenplum 到 Cloudberry 迁移工具 cbcopy 发布
Cloudberry Database 作为 Greenplum 衍生版本和首选开源替代,由 Greenplum 原始团队成员创建,与 Greenplum 保持原生兼容,并能实现无缝迁移,且具备更新的 PostgreSQL 内核和更丰富的功能。GitHub: https://github.com/cloudberry…...
Python如何读写文件?
1. 文件读取 (1)使用open()函数打开文件 基本语法是file_object open(file_name, mode),其中file_name是要打开的文件的名称(包括路径,如果文件不在当前目录下),mode是打开文件的模式。例如&a…...
100种算法【Python版】第38篇——Boyer-Moore算法
本文目录 1 算法说明2 算法示例3 python代码1 算法说明 Boyer-Moore算法由Robert S. Boyer和J. Strother Moore于1977年提出,旨在提高字符串匹配的效率。该算法在寻找固定模式的过程中,利用模式本身的信息,优化搜索过程,特别适合长文本中的模式查找。 算法原理 Boyer-Moo…...

贪心算法---java---黑马
贪心算法 1)Greedy algorithm 称之为贪心算法或者贪婪算法,核心思想是 将寻找最优解的问题分为若干个步骤每一步骤都采用贪心原则,选取当前最优解因为未考虑所有可能,局部最优的堆叠不一定得到最终解最优 贪心算法例子 Dijkstra while …...
程序员的减压秘籍:高效与健康的平衡艺术
引言 在当今竞争激烈的科技行业中,程序员常常面临着极高的精神集中要求和持续的创新压力。这种工作性质让许多程序员在追求高效和创新的过程中,感到精疲力竭,面临身心健康的挑战。因此,找到有效的方法来缓解工作压力,…...

2024 年 QEMU 峰会纪要
2024 年 QEMU 峰会已于 10 月 31 日在 KVM 论坛召开,这是一个仅对项目中最活跃的维护者和子维护者开放的邀请会议。 出席者: Dan Berrang Cdric Le Goater Kevin Wolf Michael S. Tsirkin Stefan Hajnoczi Philippe Mathieu-Daud Markus Armbruster Th…...
谷歌浏览器插件
项目中有时候会用到插件 sync-cookie-extension1.0.0:开发环境同步测试 cookie 至 localhost,便于本地请求服务携带 cookie 参考地址:https://juejin.cn/post/7139354571712757767 里面有源码下载下来,加在到扩展即可使用FeHelp…...

idea大量爆红问题解决
问题描述 在学习和工作中,idea是程序员不可缺少的一个工具,但是突然在有些时候就会出现大量爆红的问题,发现无法跳转,无论是关机重启或者是替换root都无法解决 就是如上所展示的问题,但是程序依然可以启动。 问题解决…...

练习(含atoi的模拟实现,自定义类型等练习)
一、结构体大小的计算及位段 (结构体大小计算及位段 详解请看:自定义类型:结构体进阶-CSDN博客) 1.在32位系统环境,编译选项为4字节对齐,那么sizeof(A)和sizeof(B)是多少? #pragma pack(4)st…...

[ICLR 2022]How Much Can CLIP Benefit Vision-and-Language Tasks?
论文网址:pdf 英文是纯手打的!论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和语法错误,若有发现欢迎评论指正!文章偏向于笔记,谨慎食用 目录 1. 心得 2. 论文逐段精读 2.1. Abstract 2…...

苍穹外卖--缓存菜品
1.问题说明 用户端小程序展示的菜品数据都是通过查询数据库获得,如果用户端访问量比较大,数据库访问压力随之增大 2.实现思路 通过Redis来缓存菜品数据,减少数据库查询操作。 缓存逻辑分析: ①每个分类下的菜品保持一份缓存数据…...
【Go】3、Go语言进阶与依赖管理
前言 本系列文章参考自稀土掘金上的 【字节内部课】公开课,做自我学习总结整理。 Go语言并发编程 Go语言原生支持并发编程,它的核心机制是 Goroutine 协程、Channel 通道,并基于CSP(Communicating Sequential Processes࿰…...
【android bluetooth 框架分析 04】【bt-framework 层详解 1】【BluetoothProperties介绍】
1. BluetoothProperties介绍 libsysprop/srcs/android/sysprop/BluetoothProperties.sysprop BluetoothProperties.sysprop 是 Android AOSP 中的一种 系统属性定义文件(System Property Definition File),用于声明和管理 Bluetooth 模块相…...
Unit 1 深度强化学习简介
Deep RL Course ——Unit 1 Introduction 从理论和实践层面深入学习深度强化学习。学会使用知名的深度强化学习库,例如 Stable Baselines3、RL Baselines3 Zoo、Sample Factory 和 CleanRL。在独特的环境中训练智能体,比如 SnowballFight、Huggy the Do…...
【生成模型】视频生成论文调研
工作清单 上游应用方向:控制、速度、时长、高动态、多主体驱动 类型工作基础模型WAN / WAN-VACE / HunyuanVideo控制条件轨迹控制ATI~镜头控制ReCamMaster~多主体驱动Phantom~音频驱动Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation速…...

Docker 本地安装 mysql 数据库
Docker: Accelerated Container Application Development 下载对应操作系统版本的 docker ;并安装。 基础操作不再赘述。 打开 macOS 终端,开始 docker 安装mysql之旅 第一步 docker search mysql 》〉docker search mysql NAME DE…...