Serverless + AI 让应用开发更简单
本文整理自 2024 云栖大会,阿里云智能高级技术专家,史明伟演讲议题《Serverless + AI 让应用开发更简单》
随着云计算和人工智能(AI)技术的飞速发展,企业对于高效、灵活且成本效益高的解决方案的需求日益增长。本文旨在探讨 Serverless 架构与 AI 技术的结合,如何通过 Serverless 函数计算和 AI 开发平台,助力企业简化应用开发流程,减少企业 AI 业务试错成本,加速业务创新,为企业业务发展提供无限可能。
Serverless+AI 的无限可能
客户构建 AI 应用的“绊脚石”
AI 作为一个新兴技术领域,企业可能面临技术积累不足的挑战,同时需要紧跟开源社区的创新步伐,将最新的技术和能力快速应用于业务中。同时,高性能计算资源(如 GPU)的获取成本高昂,且供应有限,企业难以仅靠标准化 API 跟上 AI 的发展步伐,这都对于希望尝试 AI 技术的开发者或中小企业构成了重大障碍。

而 Serverless 架构的核心优势在于其根据业务流量按需使用资源的能力,允许企业仅为其实际使用的计算资源付费,从而显著降低成本并提高效率。当这一理念与 AI 技术相结合时,便产生了新的应用开发模式,不仅降低了 AI 应用的入门门槛,还极大地提升了开发速度和灵活性。

成本优化与效率提升
Serverless 架构通过按需提供极细粒度的资源,避免了对闲置或空闲资源的浪费,确保企业只为真正发挥作用的算力付费。此外,通过简化基础设施代码与业务代码的分离,减少了发布成本和维护负担,使得企业能够更加专注于核心业务逻辑的开发。
灵活的资源供给与业务联动
Serverless 架构能够提供灵活的资源供给,满足业务高峰期的高并发需求,无需长期持有大量资源。同时,通过与大数据、对象存储等云产品无缝对接,Serverless 架构加速了数据处理和AI应用场景的构建,如音视频处理、智能数据分析等。
CAP:Serverless+AI 让应用开发更简单
面对 AI 技术快速发展带来的挑战,如技术积累不足、标准化能力滞后、高昂的算力成本及多样化需求难以统一满足等问题,阿里云推出了全新的云应用开发平台 CAP,重点聚焦于成本控制、模型托管服务、一键快速创建 AI 应用、AI 能力的云上编排和灵活的二次开发能力。旨在帮助客户加速业务创新,减少企业试错成本,提升开发效率,并灵活适应不断变化的市场需求。
立即体验:https://cap.console.aliyun.com/whitelist
CAP 有奖评测正在进行中!
三步轻松完成云应用开发平台 CAP 快速部署体验评测,赢罗技无线键盘、WIFI 智能插座、泼墨马克杯。
立即参与:https://developer.aliyun.com/topic/cloud-application-platform

云应用开发平台 CAP 具备以下四大核心特性:
- 一键极速创建 AI 应用: 满足缺乏专业运维团队或研发能力的企业快速构建 AI 应用的需求,平台提供一键极速创建 AI 应用,使设计师和小微企业能够在短时间内将 AI 能力融入创新产品,加速市场推广。
- 按需模型托管服务: 平台提供了模型托管服务,不仅支持 API 化 AI 服务的快速接入,还允许企业托管自定义模型,以应对特定场景下的模型服务定制,高并发需求,实现个性化业务能力的拓展。成本上按需使用,按量付费,通过 Serverless 架构和 AI 能力的集成,解决小微企业客户“一卡难求”困境,降低企业的创新门槛和成本。
- 流程式开发工具: 通过集成 CloudFlow 等产品能力,平台支持用户对 API 和 AI 服务进行流程式的编排,满足多样化需求,同时保持开发流程的灵活性和可扩展性。
- 灵活的二次开发能力: 允许用户在平台提供的抽象原子服务基础上进行二次开发,通过组装式的理念替换部分服务或 API,加速产品落地。
Serverless 与 AI 的融合实践
云应用开发平台 CAP 的出现为企业提供了从传统应用智能化改造到 AI 应用快速开发的完整解决方案。无论是提升现有业务系统的智能水平,还是构建全新的 AI 应用,企业都能在该平台上找到合适的工具和服务。
高质量应用模板与二次开发
CAP 提供丰富的应用模板,涵盖问答对话、图像生成等多种场景,支持一键部署。用户可根据需求进行二次开发,如替换 API 供应商、引入开源模型或自定义服务,以满足特定业务需求。


卡片式集成与流程智能助手
CAP 采用卡片式集成方式,用户可通过拖拽操作快速组合不同的函数服务、流程编排等组件,实现灵活的场景构建。流程智能助手则通过自然语言理解,自动生成基本的流程原型,进一步降低开发门槛。

灵活,低成本的模型托管服务
AI 应用的开发离不开模型服务,基础大模型+领域模型已成为模型服务参与 AI 应用构建的共识,基础大模型服务化并不能完全的替代领域模型,同时开源驱动的模型服务日新月异,在这样的背景下,为 AI 开发者提供灵活,低成本的模型托管服务作为业务创新环节不可或缺的部分,是平台针对 AI 定制化需求提供的兜底能力。

以下几种基于 Serverless 架构的应用场景,利用其独特的技术优势,如事件驱动、高弹性和按需计费,为用户提供更智能、高效且灵活的服务。
- AI 应用: 提供了一系列预先构建的 AI 模板,覆盖了各类热门 AI 应用场景。结合 Serverless 的高弹性和成本效益,用户能够轻松创建自己的 AIGC(人工智能生成内容)云端环境,无需从零开始搭建基础设施。
- Web 应用: 为多种流行的编程语言配备了主流 Web 框架模板,使开发者能够迅速部署,并在熟悉的框架基础上进行二次开发,极大地提高了 Web 应用的开发速度和灵活性。
- ETL 数据处理应用: Serverless 架构的事件驱动特性,使其在数据处理领域展现出巨大潜力。以函数计算为例,它支持广泛的事件源,通过事件触发机制,只需少量代码和简单配置,即可实现数据的实时处理,简化了数据管道的构建流程。
- 音视频处理应用: 提供了一套基于 FFmpeg 的音视频处理解决方案,涵盖了转码、元信息提取、时长获取、格式转换、雪碧图生成、GIF 制作、水印添加等功能。这使得用户能够快速部署一个弹性、高可用、免运维、低成本且高度定制化的音视频处理服务,满足多样化需求。
- 文件处理应用: Serverless 由于其高弹性、开箱即用、免运维的特点非常适合处理文件。CAP 官方提供了丰富的文件处理的项目案例,例如 OSS 上传 Zip 文件自动解压、Zip 打包下载 OSS 文件等。
体验 CAP,测评有奖
CAP 快速部署项目体验评测活动正在进行中,领取免费试用额度,快速体验 CAP。三步完成评测,答题赢罗技无线键盘、WIFI 智能插座、泼墨马克杯。
立即参与评测:https://developer.aliyun.com/topic/cloud-application-platform
结语
Serverless 与 AI 的深度融合,为企业带来了前所未有的机遇,不仅降低了 AI 应用的开发难度和成本,还极大地提高了业务响应速度和灵活性。云应用开发平台 CAP 凭借其在成本控制、效率提升、资源灵活调配以及业务联动等方面的优势,正成为企业拥抱 AI、加速数字化转型的关键驱动力。未来,随着技术的不断进步和应用场景的不断拓展,Serverless 与 AI 的结合将持续为企业创造更多价值,推动智能应用开发进入一个全新的时代。
相关文章:
Serverless + AI 让应用开发更简单
本文整理自 2024 云栖大会,阿里云智能高级技术专家,史明伟演讲议题《Serverless AI 让应用开发更简单》 随着云计算和人工智能(AI)技术的飞速发展,企业对于高效、灵活且成本效益高的解决方案的需求日益增长。本文旨在…...
外包功能测试就干了4周,技术退步太明显了。。。。。
先说一下自己的情况,大专生,21年通过校招进入武汉某软件公司,干了差不多3个星期的功能测试,那年国庆,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落!而我才在一个外包企业干了4周的功…...
外观模式及运用场景
外观模式(Facade Pattern)是一种结构性设计模式,它为复杂子系统提供一个统一的接口,从而简化与这些子系统的交互。通过外观模式,客户端可以更轻松地使用复杂系统,而不必了解其内部实现。接下来,…...
PyQt5实战——多脚本集合包,UI以及工程布局(二)
个人博客:苏三有春的博客 系列往期: PyQt5实战——多脚本集合包,前言与环境配置(一) 布局 2.1 UI页面布局 整体框架分为分为三个部分,垂直分布。 第一个部分为功能选择按钮(如UTF-8转换&#…...
Python 数据结构对比:列表与数组的选择指南
文章目录 💯前言💯Python中的列表(list)和数组(array)的详细对比1. 数据类型的灵活性2. 性能与效率3. 功能与操作4. 使用场景5. 数据结构选择的考量6. 实际应用案例7. 结论 💯小结 💯…...
gem5运行简单RISC-V全系统模拟
简单记录gem5中运行最简单的RISC-V Full System Simulation的过程 首先是编译RISC-V和m5term,这部分不多写了,官网均有对应教程。 之后直接使用官方在configs/example/gem5_library目录下的riscv-fs.py 运行如下命令 ./build/RISCV/gem5.opt configs/…...
洛谷 P1195 口袋的天空
自用。 题目传送门:口袋的天空 - 洛谷 题解:Inori_333 参考题解:题解 P1195 【口袋的天空】 - 洛谷专栏 /*P1195 口袋的天空https://www.luogu.com.cn/problem/P11952024/11/03 submit:inori333 */#include <iostream> #include &…...
ffmpeg视频滤镜:膨胀操作-dilation
滤镜介绍 dilation 官网链接 > FFmpeg Filters Documentation 膨胀滤镜会使图片变的更亮,会让细节别的更明显。膨胀也是形态学中的一种操作,在opencv中也有响应的算子。此外膨胀结合此前腐蚀操作,可以构成开闭操作。 开操作是先腐蚀…...
3.3 windows,ReactOS系统中页面的换出----2,结构体PHYSICAL_PAGE
系列文章目录 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 例如:第一章 Python 机器学习入门之pandas的使用 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目…...
lvgl
lvgl 目录 lvgl Lvgl移植到STM32 -- 1、下载LVGL源码 -- 2、将必要文件复制到工程目录 -- 3、修改配置文件 将lvgl与底层屏幕结合到一块 -- lvgl也需要有定时器,专门给自己做了一个函数,告诉lvgl经过了多长时间(ms(毫秒)级别) 编写代码 lvgl的中文教程手册网站…...
【django】RESTful API 设计指南
目录 一、协议 二、域名 三、版本(Versioning) 四、路径(Endpoint) 五、HTTP动词 5.1 CRUD操作: 5.2 其他动词: 六、过滤信息(Filtering) 七、状态码(Status Co…...
提升大数据量分页查询性能:深分页优化全解
前言 在处理数据量逐渐增大的数据库表时,优化查询性能是一个常见的挑战。朋友们可能会建议说,创建索引不就能解决问题了吗?然而,当数据量达到相当规模时,简单的索引可能不足以应对所有情况。这时,可能会有…...
WPF 实现冒泡排序可视化
WPF 实现冒泡排序可视化 实现冒泡排序代码就不过多讲解,主要是实现动画效果思路,本demo使用MVVM模式编写,读者可自行参考部分核心代码,即可实现如视频所示效果。 对于新手了解算法相关知识应该有些许帮助,至于其它类型…...
Claude 3.5 新功能 支持对 100 页的PDF 图像、图表和图形进行可视化分析
Claude 3.5 Sonnet发布PDF图像预览新功能,允许用户分析长度不超过100页的PDF中的视觉内容。 此功能使用户能够轻松上传文档并提取信息,特别适用于包含图表、图形和其他视觉元素的研究论文和技术文档。 视觉PDF分析:用户现在可以从包含各种视觉…...
正式开源:从 Greenplum 到 Cloudberry 迁移工具 cbcopy 发布
Cloudberry Database 作为 Greenplum 衍生版本和首选开源替代,由 Greenplum 原始团队成员创建,与 Greenplum 保持原生兼容,并能实现无缝迁移,且具备更新的 PostgreSQL 内核和更丰富的功能。GitHub: https://github.com/cloudberry…...
Python如何读写文件?
1. 文件读取 (1)使用open()函数打开文件 基本语法是file_object open(file_name, mode),其中file_name是要打开的文件的名称(包括路径,如果文件不在当前目录下),mode是打开文件的模式。例如&a…...
100种算法【Python版】第38篇——Boyer-Moore算法
本文目录 1 算法说明2 算法示例3 python代码1 算法说明 Boyer-Moore算法由Robert S. Boyer和J. Strother Moore于1977年提出,旨在提高字符串匹配的效率。该算法在寻找固定模式的过程中,利用模式本身的信息,优化搜索过程,特别适合长文本中的模式查找。 算法原理 Boyer-Moo…...
贪心算法---java---黑马
贪心算法 1)Greedy algorithm 称之为贪心算法或者贪婪算法,核心思想是 将寻找最优解的问题分为若干个步骤每一步骤都采用贪心原则,选取当前最优解因为未考虑所有可能,局部最优的堆叠不一定得到最终解最优 贪心算法例子 Dijkstra while …...
程序员的减压秘籍:高效与健康的平衡艺术
引言 在当今竞争激烈的科技行业中,程序员常常面临着极高的精神集中要求和持续的创新压力。这种工作性质让许多程序员在追求高效和创新的过程中,感到精疲力竭,面临身心健康的挑战。因此,找到有效的方法来缓解工作压力,…...
2024 年 QEMU 峰会纪要
2024 年 QEMU 峰会已于 10 月 31 日在 KVM 论坛召开,这是一个仅对项目中最活跃的维护者和子维护者开放的邀请会议。 出席者: Dan Berrang Cdric Le Goater Kevin Wolf Michael S. Tsirkin Stefan Hajnoczi Philippe Mathieu-Daud Markus Armbruster Th…...
在Ubuntu中设置开机自动运行(sudo)指令的指南
在Ubuntu系统中,有时需要在系统启动时自动执行某些命令,特别是需要 sudo权限的指令。为了实现这一功能,可以使用多种方法,包括编写Systemd服务、配置 rc.local文件或使用 cron任务计划。本文将详细介绍这些方法,并提供…...
从零开始打造 OpenSTLinux 6.6 Yocto 系统(基于STM32CubeMX)(九)
设备树移植 和uboot设备树修改的内容同步到kernel将设备树stm32mp157d-stm32mp157daa1-mx.dts复制到内核源码目录下 源码修改及编译 修改arch/arm/boot/dts/st/Makefile,新增设备树编译 stm32mp157f-ev1-m4-examples.dtb \stm32mp157d-stm32mp157daa1-mx.dtb修改…...
Module Federation 和 Native Federation 的比较
前言 Module Federation 是 Webpack 5 引入的微前端架构方案,允许不同独立构建的应用在运行时动态共享模块。 Native Federation 是 Angular 官方基于 Module Federation 理念实现的专为 Angular 优化的微前端方案。 概念解析 Module Federation (模块联邦) Modul…...
WEB3全栈开发——面试专业技能点P2智能合约开发(Solidity)
一、Solidity合约开发 下面是 Solidity 合约开发 的概念、代码示例及讲解,适合用作学习或写简历项目背景说明。 🧠 一、概念简介:Solidity 合约开发 Solidity 是一种专门为 以太坊(Ethereum)平台编写智能合约的高级编…...
【C语言练习】080. 使用C语言实现简单的数据库操作
080. 使用C语言实现简单的数据库操作 080. 使用C语言实现简单的数据库操作使用原生APIODBC接口第三方库ORM框架文件模拟1. 安装SQLite2. 示例代码:使用SQLite创建数据库、表和插入数据3. 编译和运行4. 示例运行输出:5. 注意事项6. 总结080. 使用C语言实现简单的数据库操作 在…...
12.找到字符串中所有字母异位词
🧠 题目解析 题目描述: 给定两个字符串 s 和 p,找出 s 中所有 p 的字母异位词的起始索引。 返回的答案以数组形式表示。 字母异位词定义: 若两个字符串包含的字符种类和出现次数完全相同,顺序无所谓,则互为…...
MySQL用户和授权
开放MySQL白名单 可以通过iptables-save命令确认对应客户端ip是否可以访问MySQL服务: test: # iptables-save | grep 3306 -A mp_srv_whitelist -s 172.16.14.102/32 -p tcp -m tcp --dport 3306 -j ACCEPT -A mp_srv_whitelist -s 172.16.4.16/32 -p tcp -m tcp -…...
代理篇12|深入理解 Vite中的Proxy接口代理配置
在前端开发中,常常会遇到 跨域请求接口 的情况。为了解决这个问题,Vite 和 Webpack 都提供了 proxy 代理功能,用于将本地开发请求转发到后端服务器。 什么是代理(proxy)? 代理是在开发过程中,前端项目通过开发服务器,将指定的请求“转发”到真实的后端服务器,从而绕…...
网站指纹识别
网站指纹识别 网站的最基本组成:服务器(操作系统)、中间件(web容器)、脚本语言、数据厍 为什么要了解这些?举个例子:发现了一个文件读取漏洞,我们需要读/etc/passwd,如…...
在Mathematica中实现Newton-Raphson迭代的收敛时间算法(一般三次多项式)
考察一般的三次多项式,以r为参数: p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]; 此多项式的根为: 尽管看起来这个多项式是特殊的,其实一般的三次多项式都是可以通过线性变换化为这个形式…...
