当前位置: 首页 > article >正文

DigitalOcean 打造 AI 原生云,帮助 AI 应用大幅降低成本与运维复杂度

人工智能行业存在一个复合型的瓶颈而这个瓶颈并非模型本身而是推理。过去仅仅是一次模型调用如今已演变成一个持续交互的系统。现在的应用程序会编排多个模型检索并合成数据执行工具并在生产环境中重复这一循环。这些不再是“无状态请求”而是更像基础设施而非软件特性的动态系统。以下四个变化正在重新定义基础设施必须具备的能力推理已取代训练成为重心推理模型正成为默认选择自主智能体正在大规模运行开源模型正以极低的成本达到与闭源模型相当的质量大多数技术栈从未为此而设计。超大规模云服务商提供了数百种服务但依然需要将它们拼接在一起。推理提供商则坐落在别人的算力之上额外增加了一层利润空间。GPU 供应商提供芯片但不提供系统。推理已悄然成为现代技术栈中最昂贵、却又最无人真正掌控的一层。每一项新能力都被叠加在一个碎片化的基础之上而其底层的复杂性则在不断累积。最终你遇到的问题不再是模型问题而是技术栈的问题。今天在 Deploy 2026 大会上DigitalOcean 发布了 DigitalOcean 的 AI 原生云这是一个面向生产级AI工作负载的全栈系统。DigitalOcean 的 AI 原生云建立在 DigitalOcean 的核心云服务之上涵盖计算、存储、网络和托管服务并针对AI系统在实际生产中的运行方式扩展了专门设计的能力。目标很简单精简技术栈让构建者能够专注于构建而不是把各种系统拼凑在一起。在这里开源不是附加功能而是基础。DigitalOcean 去除了不必要的抽象层消除了供应商之间的利润叠加让开发者可以直接访问构建和扩展AI系统所需的原语。这并非空谈。像 Workato 这样的客户在 DigitalOcean 上运行了数万亿次自动化任务成本降低了67%。Character.ai 部署于DigitalOcean 云平台上每天处理超过 10 亿次查询推理吞吐量提高了2倍。Hippocratic AI 医疗平台支持超过 2000 万次患者交互延迟降低了40%。这三个客户案例表明 DigitalOcean AI 原生云已在生产环境中稳定运行。面向现代AI系统的五层技术栈AI应用程序不是单一系统而是由多个相互作用的层组成这些层必须持续协同工作。DigitalOcean AI 原生云将这五层整合为一个统一的系统包括 托管式Agents、数据与分析、推理引擎、核心云服务、基础设施。如下图所示DigitalOcean AI原生云的新增能力这些并非概念上的层次而是实际运行的系统。DigitalOcean 正在扩展产品服务提供涵盖推理、数据和存储的生产级能力使其能够大规模运行。Inference Router推理路由器公测版一个具备策略感知能力的控制平面可根据成本、延迟、质量与数据合规性动态路由请求。团队无需硬编码模型逻辑只需定义意图系统即可在不同模型提供商和部署方式之间自动优化执行路径。例如LawVo 运行着 130 AI 智能体每周处理超过 5 亿 Token在无需修改代码的情况下将推理成本降低了 42%。专用推理与 Bring Your Own Model支持在专用 GPU 基础设施上运行自定义或微调模型全面掌控性能、扩展和配置。开发者可以从 Hugging Face 或自有环境部署模型通过预调优的推理栈和托管编排实现高吞吐运行而无需承担 Kubernetes 的复杂性。扩展模型与服务通过统一系统运行和评估文本、图像、音频和视频模型。模型库持续更新包含 25 新模型并支持“Day 0”首发接入例如 NVIDIA Nemotron 3 Nano Omni在 DigitalOcean 首发。该高效开源多模态模型整合视觉、语音、语言与工具调用能力并通过 NVIDIA TensorRT-LLM 在内核层优化。内置评估工具可在上线前对质量、成本和延迟进行基准测试。PostgreSQL和MySQL高级版公测托管式PostgreSQL和MySQL高级版提供超大规模云服务商级别的可靠性和扩展能力与标准版并行提供。托管式 Weaviate预览版提供可用于生产环境的向量数据库基础设施无需运维负担并与 Serverless Inference 原生集成具备可预测定价。Knowledge Bases知识库一个完全托管的 RAG 服务处理数据摄取、分块、嵌入、检索和重排序并为智能体框架提供 MCP 支持。让你的团队只需几天就能从原型走向生产。旨在简化同时不限制灵活性优势并不在于任何一个单独的层而在于它们如何协同工作。当智能体、推理和数据运行在同一个系统上时性能和成本方面的优化会自动相互叠加。技术栈变得能够自我强化而不是碎片化。与此同时灵活性得以保留。开放的 API 和与现有工具的兼容性使得采用新模型、集成外部系统以及根据需要演进架构变得容易。展望未来从本地部署到云计算的转变催生了 AWS。从云到 SaaS 的转变催生了 Salesforce。而从云原生到 AI 原生和智能体原生应用的转变将催生下一家伟大的基础设施公司。DigitalOcean 志在于此。五层技术栈。一个平台。层层开放。今天就让我们与开发者一起构建吧。

相关文章:

DigitalOcean 打造 AI 原生云,帮助 AI 应用大幅降低成本与运维复杂度

人工智能行业存在一个复合型的瓶颈,而这个瓶颈并非模型本身,而是推理。 过去仅仅是一次模型调用,如今已演变成一个持续交互的系统。现在的应用程序会编排多个模型,检索并合成数据,执行工具,并在生产环境中…...

怎么查快递最快?2026年高效率查件工具五强出炉

说句实在话,2026年了,下单买东西确实爽,但等快递的过程依然像是一场“漫长”的修行。最烦人的莫过于在几十条取件短信和通知里翻找单号,那种焦虑感,想必大家深有体会。 如果你还在纠结怎么查快递最快,或者到…...

告别NPOI!用EPPlus 7.0在.NET 8里优雅地读写Excel(附图片插入完整代码)

告别NPOI!用EPPlus 7.0在.NET 8里优雅地读写Excel(附图片插入完整代码) 如果你还在使用NPOI处理Excel文件,现在是时候考虑升级到更现代的解决方案了。EPPlus 7.0作为.NET生态中最强大的Excel操作库之一,在.NET 8环境下…...

场地ViL实测:总线注入这样做,智驾测试真实度+复现率双达标|新能源研发必看

场地ViL实测:总线注入这样做,智驾测试真实度复现率双达标|新能源研发必看 【简述】 纯路测场景不全、风险高、难复现;纯仿真缺真实动力学、落地偏差大。场地整车在环(ViL)把实车动力学虚拟场景焊死在一起&a…...

LibreVNA矢量网络分析仪深度解析:从入门到精通的全方位实战指南

LibreVNA矢量网络分析仪深度解析:从入门到精通的全方位实战指南 【免费下载链接】LibreVNA 100kHz to 6GHz 2 port USB based VNA 项目地址: https://gitcode.com/gh_mirrors/li/LibreVNA LibreVNA是一款覆盖100kHz至6GHz频率范围的开源矢量网络分析仪&#…...

小红书三面挂了!被问“热搜榜怎么防 5 万水军”,我答了限流

深夜 2 点,某明星的热搜词瞬间空降榜单前三,后台警报长鸣。本文拆解小红书热搜背后的“排毒”系统:从信息熵(Entropy)识别异常团伙,到斜率检测拦截突发流量,再到让黑产最绝望的“影子榜单”策略…...

【R 4.5低代码黄金配置清单】:国家级数据分析项目组内部使用的7条不可绕过规范

更多请点击: https://intelliparadigm.com 第一章:R 4.5低代码平台的核心架构与能力边界 R 4.5低代码平台采用分层可插拔架构,由运行时引擎、可视化编排中心、模型驱动服务总线(MDSB)和统一元数据仓库四大核心组件构成…...

临床数据挖掘黄金窗口期只剩11个月!——R语言应对ICH E6(R3)电子化源数据新规的5大不可逆技术升级路径

更多请点击: https://intelliparadigm.com 第一章:临床数据挖掘黄金窗口期的倒计时本质与R语言战略定位 临床数据正以前所未有的速度和规模积累——电子病历(EMR)、基因组测序、可穿戴设备流式监测、多中心真实世界研究&#xff…...

内容创作团队如何借助多模型API聚合平台提升创意生成效率与多样性

内容创作团队如何借助多模型API聚合平台提升创意生成效率与多样性 1. 多模型接入的价值与挑战 内容创作团队在日常工作中经常面临创意枯竭或风格单一的困境。传统单一模型接入方式存在局限性,无法充分利用不同模型的特性生成多样化内容。Taotoken作为大模型聚合分…...

OpenAvatar LAM数字人使用教程:单图生成专属3D形象并实现实时对话【保姆级教程】

OpenAvatar LAM数字人使用教程:生成专属3D形象并实现实时对话 OpenAvatarChat 是一款模块化的交互数字人对话工具,支持在单台PC上运行完整的数字人对话功能,其中LAM(Large Avatar Model)数字人模块尤为亮眼——依托SI…...

非涉密系统

非涉密系统是指不涉及国家秘密的信息系统,即该系统不具备存储、处理或传输国家秘密的功能或权限。在这样的系统中,严禁上传、处理或传输任何国家秘密信息,以确保国家秘密的安全。非涉密系统通常用于处理公开或内部但非涉密的工作信息&#xf…...

手写最基础的大模型推理

代码样例 手写一个 最基础的大模型推理示例,但是为了方便测试和节省显存,我们先用一个 小模型,比如 HuggingFace 上的 distilgpt2(比 GPT-2 小很多,适合 CPU/GPU 本地跑)。 下面我给你一个 完整 Python 示例…...

Labelme2YOLO:机器学习数据预处理中的数据格式转换工具完整指南

Labelme2YOLO:机器学习数据预处理中的数据格式转换工具完整指南 【免费下载链接】Labelme2YOLO Help converting LabelMe Annotation Tool JSON format to YOLO text file format. If youve already marked your segmentation dataset by LabelMe, its easy to use …...

AI代码生成技术:从原理到工程实践

1. 代码生成技术的范式转移十年前我第一次接触代码自动生成工具时,使用的还是基于模板的代码生成器。这些工具需要预先定义好代码结构,通过简单的参数替换生成基础CRUD代码。而今天,当我向GPT-4描述一个复杂业务需求后,它能在几秒…...

如何快速下载网盘文件?八大平台直链解析工具完全指南

如何快速下载网盘文件?八大平台直链解析工具完全指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...

Arduino IDE 2.2.1 + STM32:解放C盘空间与离线配置全攻略(含库路径迁移技巧)

Arduino IDE 2.2.1 STM32:空间优化与高效开发环境配置指南 对于长期使用Arduino进行STM32开发的工程师来说,C盘空间告急和开发环境迁移困难是两大痛点。本文将提供一套完整的解决方案,从Arduino15文件夹迁移到STM32离线支持包配置&#xff0…...

网关路由AI安全审计系统:全量自动化检测+成本优化,实现API安全审计智能化

突发:网关路由AI安全审计系统带来智能化解决方案本项目构建了一个网关路由AI安全审计系统,采用"通用Agent 业务Skill"分层设计,增量日检/存量月检。落地Open网关路由越权漏洞检测流程,通过AI批量筛查 人工深度验证的人…...

Qwen3.5生成的简化版vector存在野指针bug

今天用Qwen3.5生成了一份简化版vector代码&#xff1a;#ifndef MY_VECTOR_H #define MY_VECTOR_H#include <iostream> #include <algorithm> // 用于 std::swap #include <stdexcept> // 用于 std::out_of_rangetemplate <class T> class My_vector { …...

高校学工平台采购避坑指南:招标选型的5个关键考量点

✅作者简介&#xff1a;合肥自友科技 &#x1f4cc;核心产品&#xff1a;智慧校园平台(包括教工管理、学工管理、教务管理、考务管理、后勤管理、德育管理、资产管理、公寓管理、实习管理、就业管理、离校管理、科研平台、档案管理、学生平台等26个子平台) 。公司所有人员均有多…...

为Nodejs应用快速集成稳定可靠的大模型api服务

为Nodejs应用快速集成稳定可靠的大模型API服务 1. 统一接入方案的技术选型 现代Node.js应用集成AI能力时&#xff0c;开发者常面临多模型供应商接入复杂、密钥管理分散等问题。Taotoken提供的OpenAI兼容API层可统一对接主流大模型&#xff0c;通过标准化接口降低接入成本。其…...

AI意识思想实验

意识是一种主观体验&#xff0c;他人无法完全确证&#xff0c;只能基于外在证据进行推断。当观察AI有意识现象的外在表现时&#xff0c;就可以认定为它有意识。“AI教父”杰弗里辛顿&#xff08;Geoffrey Hinton&#xff09;采用了一种独特且有力的方式&#xff0c;他借鉴了哲学…...

Unlock Music:浏览器内一键解锁加密音乐文件的终极指南 [特殊字符]

Unlock Music&#xff1a;浏览器内一键解锁加密音乐文件的终极指南 &#x1f3b5; 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库&#xff1a; 1. https://github.com/unlock-music/unlock-music &#xff1b;2. https://git.unlock-music.dev/um/web …...

5分钟学会particles.js:让网页动起来的终极粒子特效指南

5分钟学会particles.js&#xff1a;让网页动起来的终极粒子特效指南 【免费下载链接】particles.js A lightweight JavaScript library for creating particles 项目地址: https://gitcode.com/gh_mirrors/pa/particles.js 还在为静态网页缺乏活力而烦恼吗&#xff1f;想…...

暗黑破坏神2存档解析与编辑:基于Vue.js的现代化解决方案

暗黑破坏神2存档解析与编辑&#xff1a;基于Vue.js的现代化解决方案 【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 你是否曾因暗黑破坏神2存档损坏而失去数小时的游戏进度&#xff1f;是否想要快速测试不同职业Build却苦于漫长…...

生活有品质,安全须随行:Ledger大陆官方授权购买指引

生活有品质&#xff0c;安全须随行&#xff1a;Ledger 大陆官方授权购买指引 【核心摘要】 在追求高品质数字生活的今天&#xff0c;资产的底层安全是行稳致远的基石。针对大中华区用户面临的 App Store 地区限制及复杂的网络连接环境&#xff0c;认准 Ledger 官方授权链路 是…...

别再死记硬背了!用一张图+实战配置,彻底搞懂华为VXLAN里的NVE、VTEP和VNI

华为VXLAN实战图解&#xff1a;从NVE到VTEP的配置记忆法 刚接触VXLAN时&#xff0c;那些缩略词就像天书——NVE、VTEP、VNI、BD...每个字母都认识&#xff0c;连起来就懵。直到我在华为CE6880交换机上输错三次命令被考官扣分后&#xff0c;才意识到死记硬背根本行不通。这张手…...

QueryExcel:3分钟搞定上百个Excel文件批量查询的终极解决方案

QueryExcel&#xff1a;3分钟搞定上百个Excel文件批量查询的终极解决方案 【免费下载链接】QueryExcel 多Excel文件内容查询工具。 项目地址: https://gitcode.com/gh_mirrors/qu/QueryExcel 还在为海量Excel文件中的数据查找而烦恼吗&#xff1f;面对分散在不同文件夹中…...

Qt实战:手把手教你定制QTabWidget的垂直标签页,让文字和图标都“正”过来

Qt实战&#xff1a;垂直标签页的文字与图标方向优化全解析 在桌面应用开发中&#xff0c;侧边导航栏的设计往往能显著提升用户体验。当使用Qt的QTabWidget实现这一功能时&#xff0c;开发者常会遇到一个棘手问题&#xff1a;将标签页(tabbar)置于左侧或右侧时&#xff0c;默认的…...

2026年阿里云部署OpenClaw/Hermes Agent详解+百炼token Plan速成全攻略教程

2026年阿里云部署OpenClaw/Hermes Agent详解百炼token Plan速成全攻略教程。 OpenClaw和Hermes Agent是什么&#xff1f;OpenClaw和Hermes Agent怎么部署&#xff1f;如何部署OpenClaw/Hermes Agent&#xff1f;2026年还在为部署OpenClaw和Hermes Agent到处找教程踩坑吗&#x…...

C盘空间不足?C盘爆满这样操作才干净 一招教你安全清理C盘

在日常使用电脑的过程中&#xff0c;相信很多人都遇到过这样的困扰&#xff1a;桌面弹出“C盘空间不足”的警告&#xff0c;电脑开机变慢、软件启动卡顿&#xff0c;甚至打开一个简单的文档都要加载半天&#xff0c;严重影响工作和娱乐效率。C盘作为Windows系统的默认安装盘&am…...