当前位置: 首页 > news >正文

云原生周刊:云原生和 AI

开源项目推荐

FlashMLA

DeepSeek 于北京时间 2025 年 2 月 24 日上午 9 点正式开源了 FlashMLA 项目。FlashMLA 是专为 NVIDIA Hopper 架构 GPU(如 H100、H800)优化的高效多头潜在注意力(MLA)解码内核,旨在提升大模型推理性能,特别是针对可变长度序列进行了优化。
性能表现:

在 NVIDIA H800 SXM5 GPU 上,FlashMLA 展现了卓越的性能:

  • 内存带宽: 高达 3000 GB/s,确保快速的数据传输和访问。
  • 计算性能: 峰值达到 580 TFLOPS,满足大规模 AI 任务的计算需求。

DeepLearningExamples

NVIDIA 的开源项目 DeepLearningExamples 提供了最先进的深度学习模型实现,涵盖计算机视觉、自然语言处理、推荐系统等领域。这些示例经过优化,可在 NVIDIA GPU 上实现最佳性能和精度,支持多种深度学习框架,如 PyTorch、TensorFlow 和 PaddlePaddle。此外,项目集成了最新的 NVIDIA CUDA-X 软件栈,确保在 Volta、Turing 和 Ampere 架构的 GPU 上高效运行。开发者可以利用这些资源,快速训练和部署模型,加速 AI 研究与应用。

LoxiLB

LoxiLB 是一个开源的云原生负载均衡器,专为 Kubernetes、边缘计算、5G、物联网等场景设计。它采用 eBPF 作为核心引擎,使用 Go 语言编写,提供高性能、灵活且可编程的负载均衡服务。LoxiLB 支持多种模式,包括 NAT44、NAT66、NAT64、FullNAT 和 DSR 等,具备高可用性和高扩展性。此外,它还支持 L7 代理、SRv6 实现以及 GTP 隧道等特性,能够自动化管理外部负载均衡器的部署、配置、扩展和监控等任务。LoxiLB 旨在为云原生环境中的网络负载均衡提供高效、灵活的解决方案。

Cube Studio

Cube Studio 是由腾讯音乐开源的云原生一站式人工智能平台,涵盖机器学习、深度学习和大模型开发等全流程。该平台提供从数据管理、模型开发、训练到部署的完整解决方案,支持多种功能模块,如在线开发、任务编排、分布式训练、超参数搜索、推理服务、边缘计算、标注平台和大模型微调等。Cube Studio 采用模块化设计,用户可根据需求灵活组合各功能模块,快速构建适合自身业务的 AI 平台。

文章推荐

云原生 AI:引领企业 IT 变革的双引擎

本文探讨了云原生技术与人工智能(AI)如何共同推动企业 IT 能力的发展。作者 Ken Kaplan 指出,随着生成式 AI、AI 增强和云原生技术在 Gartner 2023 年新兴技术炒作周期中达到预期膨胀的顶峰,这些技术正日益融合,成为企业未来发展的关键驱动力。Kaplan 强调,尽管一些组织仍在探索如何利用这些技术,许多企业已积极推进,将云原生和 AI 视为提升业务效率和生产力的核心手段。他还提到,K8s 等云原生平台的成熟,使得容器编排更为普及,为 AI 应用的开发和管理提供了灵活性和可扩展性。

探索 k8gb 的多集群容错机制

作者 Gerardo Lopez 介绍了 k8gb,这是一种为跨多个 Kubernetes 集群运行的应用程序提供全局负载均衡的解决方案。k8gb 通过实时健康检查确保流量被引导至健康的集群,并与外部 DNS 提供商集成,以管理故障转移场景。该工具支持多种部署策略,包括主动-主动和主动-被动模式,使组织能够自信地在地理上分布的集群中运行应用程序,确保最佳性能和最小的停机时间。

福布斯:从云原生到 AI 原生的演进

本文探讨了企业在数字化转型过程中,从云原生架构迈向 AI 原生模式的必要性和实施路径。云原生技术通过微服务和容器化提升了系统的灵活性和可扩展性,而 AI 原生模式则将人工智能深度融入业务流程,实现自动化和智能化决策。这一转变需要企业在数据管理、模型训练和 AI 工具集成方面进行战略性投资,同时培养具备 AI 技能的人才,以确保成功实施和持续优化 AI 驱动的解决方案。

然而,迈向 AI 原生并非易事,企业必须克服数据隐私、伦理问题和技术复杂性等挑战。制定明确的 AI 战略、建立跨部门协作机制,以及持续监测和评估 AI 系统的表现,对于实现 AI 原生至关重要。通过稳健的规划和执行,企业能够在 AI 时代保持竞争优势,推动创新和业务增长。

云原生动态

Podman Desktop 1.16 发布

Podman Desktop 1.16 正式发布了,带来了多项新功能和改进:

  • 实验性功能:在设置中新增“实验性”板块,用户可查看当前的实验功能列表,并链接至相关讨论页面。

  • 状态栏显示提供者:激活实验性功能后,提供者的状态将显示在状态栏中,提升可见性。

  • 精确清理镜像:在清理镜像时,用户可选择仅删除未标记的镜像或所有未使用的镜像。

  • 日志搜索功能:支持在容器和 Pod 的日志中搜索特定术语,方便定位信息。

  • Kubernetes 上下文监控:默认仅监控当前上下文,减少不必要的连接和资源占用。

此外,本次更新还包含其他性能优化和问题修复,进一步提升了用户体验。。

Falcosidekick 2.31.0

Falcosidekick 2.31.0 版本已于近日发布,主要更新包括:

  • 新增输出功能:引入了 OTLP Metrics 输出,允许将 Falco 事件转发至 OpenTelemetry 收集器或任何支持该协议的接收端。

  • 改进的日志系统:替换了 Falcosidekick 的日志系统,提升了未来扩展的可能性,且对用户无破坏性影响。

  • Loki 集成增强:默认情况下,转发至 Loki 的日志行现在包含源命名空间和 Pod 名称,便于在仪表板中筛选事件。

  • NATS/STAN 主题模板化:原先硬编码的 NATS/STAN 消息主题模板现在可以通过配置项 nats/stan.subjecttemplate 进行覆盖。

此外,本版本还修复了多个问题,包括:

  • Loki 负载中缺失模板化字段作为标签的问题。

  • 创建 ClusterPolicyReport 时的错误。

  • Loki HTTP 请求中缺失自定义头部的问题。

  • Prometheus 自定义字段键格式错误的问题。

用户可以通过更新 Helm 图表来体验这些新特性和修复。

关于KubeSphere

KubeSphere (https://kubesphere.io)是在 Kubernetes 之上构建的开源容器平台,提供全栈的 IT 自动化运维的能力,简化企业的 DevOps 工作流。

KubeSphere 已被 Aqara 智能家居、本来生活、东方通信、微宏科技、东软、华云、新浪、三一重工、华夏银行、四川航空、国药集团、微众银行、紫金保险、去哪儿网、中通、中国人民银行、中国银行、中国人保寿险、中国太平保险、中国移动、中国联通、中国电信、天翼云、中移金科、Radore、ZaloPay 等海内外数万家企业采用。KubeSphere 提供了开发者友好的向导式操作界面和丰富的企业级功能,包括 Kubernetes 多云与多集群管理、DevOps (CI/CD)、应用生命周期管理、边缘计算、微服务治理 (Service Mesh)、多租户管理、可观测性、存储与网络管理、GPU support 等功能,帮助企业快速构建一个强大和功能丰富的容器云平台。

相关文章:

云原生周刊:云原生和 AI

开源项目推荐 FlashMLA DeepSeek 于北京时间 2025 年 2 月 24 日上午 9 点正式开源了 FlashMLA 项目。FlashMLA 是专为 NVIDIA Hopper 架构 GPU(如 H100、H800)优化的高效多头潜在注意力(MLA)解码内核,旨在提升大模型…...

rust笔记9-引用与原始指针

Rust 中的指针类型和引用类型是理解其内存管理机制的关键部分。& 引用和 * 原始指针在底层原理上确实都可以认为是指针,它们都存储了某个内存地址,并指向该地址处的数据。然而,它们在安全性、使用方式和编译器支持上有显著的区别。下面我会详细解释它们的异同点,帮助你…...

信而泰CCL仿真:解锁AI算力极限,智算中心网络性能跃升之道

引言 随着AI大模型训练和推理需求的爆发式增长,智算中心网络的高效性与稳定性成为决定AI产业发展的核心要素。信而泰凭借自主研发的CCL(集合通信库)评估工具与DarYu-X系列测试仪,为智算中心RoCE网络提供精准评估方案,…...

本地部署AI模型 --- DeepSeek(二)---更新中

目录 FAQ 1.Failed to load the model Exit code: 18446744072635812000 FAQ 1.Failed to load the model Exit code: 18446744072635812000 问题描述: 🥲 Failed to load the model Error loading model. (Exit code: 18446744072635812000). Unkn…...

c++类知识点复习与总结

类 c 是一种人机交互的面向对象的编程语言,面向对象思想主要体现在 类 上。 类是具有相同属性和相同行为的对象的集合, 具有封装,继承,多态的特性。 类的定义 class 类名 { }; 封装 例如:人就是一种类…...

C++的allactor

https://zhuanlan.zhihu.com/p/693267319 1 双层内存配置器 SGI设计了两层的配置器,也就是第一级配置器和第二级配置器。同时为了自由选择,STL又规定了 __USE_MALLOC 宏,如果它存在则直接调用第一级配置器,不然则直接调用第二级配…...

【2025深度学习环境搭建-2】pytorch+Docker+VS Code+DevContainer搭建本地深度学习环境

上一篇文章:【2025深度学习环境搭建-1】在Win11上用WSL2和Docker解锁GPU加速 先启动Docker!对文件内容有疑问,就去问AI 一、用Docker拉取pytorch镜像,启动容器,测试GPU docker pull pytorch/pytorch:2.5.0-cuda12.4…...

在CentOS 7上安装和使用Spleeter音频分离工具的详细步骤

在音频处理领域,Spleeter是一款优秀的开源工具,能够帮助用户轻松实现音频文件中人声和背景音的分离。本文将详细介绍在CentOS 7系统上安装和配置Spleeter的步骤,以及如何使用Spleeter进行音频分离。 准备环境: 在开始安装Spleeter之前&…...

【1】VS Code 新建上位机项目---C#基础语法

VS Code 新建上位机项目---C#基础语法 1 基本概念1.1 准备工具1.2 新建项目2 C#编程基础2.1 命名空间和类2.2 数据类型2.3 控制台输入输出2.3.1 输入输出: write 与 read2.3.2 格式化 : string.Foramt() 与 $2.3.3 赋值与运算2.4 类型转换2.4.1 数值类型之间的转换:(int)2.4…...

电脑经常绿屏(蓝屏)怎么办(解决方法)?

一、排查系统与驱动问题 进入安全模式修复系统 强制重启电脑 3 次触发恢复环境,选择 疑难解答 > 高级选项 > 启动设置 > 重启,按 F5 或 5 进入带网络连接的安全模式3。 在安全模式下,尝试卸载最近安装的软件或更新,尤其…...

clickhouse--本地表和分布式表,副本机制,分片集群

1、本地表和分布式表 ck的表分为两种: 分布式表   一个逻辑上的表,可以理解为数据库中的视图,一般查询都查询分布式表。分布式表引擎会将我们的查询请求路由本地表进行查询,然后进行汇总最终返回给用户。本地表   实际存储数据的表。 …...

react hook useReducer

useReducer useReducer 是 React 中用于状态管理的 Hook,与 useState 不同,它更适合处理复杂的状态逻辑. const [state, dispatch] useReducer(reducer, initialArg, init?) reducer 是一个处理函数,用于更新状态, reducer 里面包含了两个…...

告别阻塞,迎接高效:掌握 AsyncIOScheduler 实现异步任务调度

前言 时间在编程中是宝贵的,直接关联到效率与灵活性,尤其在异步编程里,如何优雅地管理定时任务简直是一门“艺术”。如果你还在用 time.sleep() 来控制延时任务,恐怕你早已体会过它的“痛苦”:程序卡住、线程阻塞、性能急剧下滑。想象一下,你的程序如同一个永远无法按时…...

【基于SprintBoot+Mybatis+Mysql】电脑商城项目之加入购物车和显示购物车列表

🧸安清h:个人主页 🎥个人专栏:【Spring篇】【计算机网络】【Mybatis篇】 🚦作者简介:一个有趣爱睡觉的intp,期待和更多人分享自己所学知识的真诚大学生。 目录 🚀1.加入购物车-数…...

再谈影刀RPA成长学习路线

近期,我将使用影刀RPA开发各电商平台移动端商品信息爬取,实战流程会在QQ群里分享,欢迎大家进群,一起探讨交流! 1. 影刀RPA学习路线概述 1.1 学习目标与意义 学习影刀RPA的目标在于掌握一种高效的工作自动化工具,以提…...

PHP-综合4

[题目信息]: 题目名称题目难度PHP-综合42 [题目考点]: PHP综合训练[Flag格式]: SangFor{Ouk3i63BuShgxqdRcn_9kMNqKFDe5j4f}[环境部署]: docker-compose.yml文件或者docker tar原始文件。 http://分配ip:2087[题目writeup]:…...

学习笔记-沁恒第五讲-米醋

一&#xff0c;设置音量 上次 这次 #include "uart.h" #include "debug.h" void audio_init() { Usart3_Init(); } void audio_play(u8 num) { u8 string[]{0x7e,0x05,0x41,0x00,num,0x05^0x41^0x00^num,0xef}; u8 i; for(i0;i<7;i) { USART_Se…...

【JavaScript】JavaScript 常见概念 - 变量与数据类型 - 运算符 - 条件语句 - 循环 - 函数 - 数组操作 - 对象

1. 变量与数据类型 变量声明 JavaScript 提供了三种方式来声明变量&#xff1a; var&#xff08;全局或函数作用域&#xff0c;不推荐&#xff09;let&#xff08;块级作用域&#xff0c;推荐&#xff09;const&#xff08;常量&#xff0c;块级作用域&#xff0c;推荐&…...

Web自动化之Selenium添加网站Cookies实现免登录

在使用Selenium进行Web自动化时&#xff0c;添加网站Cookies是实现免登录的一种高效方法。通过模拟浏览器行为&#xff0c;我们可以将已登录状态的Cookies存储起来&#xff0c;并在下次自动化测试或爬虫任务中直接加载这些Cookies&#xff0c;从而跳过登录步骤。 Cookies简介 …...

AI手机的技术细节

前序&#xff1a;先说各个功能涉及到的技术&#xff0c;再说宏观系统架构。AI手机有这样几个做法&#xff0c;给手机侧边增加一个按键&#xff1b;把手机的语音助手做的很好&#xff0c;能够快速稳定的进行唤醒&#xff1b;通过特殊形式的触摸手机的曲面屏位置等来进行唤醒AI …...

利用ngx_stream_return_module构建简易 TCP/UDP 响应网关

一、模块概述 ngx_stream_return_module 提供了一个极简的指令&#xff1a; return <value>;在收到客户端连接后&#xff0c;立即将 <value> 写回并关闭连接。<value> 支持内嵌文本和内置变量&#xff08;如 $time_iso8601、$remote_addr 等&#xff09;&a…...

Linux相关概念和易错知识点(42)(TCP的连接管理、可靠性、面临复杂网络的处理)

目录 1.TCP的连接管理机制&#xff08;1&#xff09;三次握手①握手过程②对握手过程的理解 &#xff08;2&#xff09;四次挥手&#xff08;3&#xff09;握手和挥手的触发&#xff08;4&#xff09;状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...

Frozen-Flask :将 Flask 应用“冻结”为静态文件

Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是&#xff1a;将一个 Flask Web 应用生成成纯静态 HTML 文件&#xff0c;从而可以部署到静态网站托管服务上&#xff0c;如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...

AI编程--插件对比分析:CodeRider、GitHub Copilot及其他

AI编程插件对比分析&#xff1a;CodeRider、GitHub Copilot及其他 随着人工智能技术的快速发展&#xff0c;AI编程插件已成为提升开发者生产力的重要工具。CodeRider和GitHub Copilot作为市场上的领先者&#xff0c;分别以其独特的特性和生态系统吸引了大量开发者。本文将从功…...

AI病理诊断七剑下天山,医疗未来触手可及

一、病理诊断困局&#xff1a;刀尖上的医学艺术 1.1 金标准背后的隐痛 病理诊断被誉为"诊断的诊断"&#xff0c;医生需通过显微镜观察组织切片&#xff0c;在细胞迷宫中捕捉癌变信号。某省病理质控报告显示&#xff0c;基层医院误诊率达12%-15%&#xff0c;专家会诊…...

回溯算法学习

一、电话号码的字母组合 import java.util.ArrayList; import java.util.List;import javax.management.loading.PrivateClassLoader;public class letterCombinations {private static final String[] KEYPAD {"", //0"", //1"abc", //2"…...

淘宝扭蛋机小程序系统开发:打造互动性强的购物平台

淘宝扭蛋机小程序系统的开发&#xff0c;旨在打造一个互动性强的购物平台&#xff0c;让用户在购物的同时&#xff0c;能够享受到更多的乐趣和惊喜。 淘宝扭蛋机小程序系统拥有丰富的互动功能。用户可以通过虚拟摇杆操作扭蛋机&#xff0c;实现旋转、抽拉等动作&#xff0c;增…...

springboot 日志类切面,接口成功记录日志,失败不记录

springboot 日志类切面&#xff0c;接口成功记录日志&#xff0c;失败不记录 自定义一个注解方法 import java.lang.annotation.ElementType; import java.lang.annotation.Retention; import java.lang.annotation.RetentionPolicy; import java.lang.annotation.Target;/***…...

DBLP数据库是什么?

DBLP&#xff08;Digital Bibliography & Library Project&#xff09;Computer Science Bibliography是全球著名的计算机科学出版物的开放书目数据库。DBLP所收录的期刊和会议论文质量较高&#xff0c;数据库文献更新速度很快&#xff0c;很好地反映了国际计算机科学学术研…...

es6+和css3新增的特性有哪些

一&#xff1a;ECMAScript 新特性&#xff08;ES6&#xff09; ES6 (2015) - 革命性更新 1&#xff0c;记住的方法&#xff0c;从一个方法里面用到了哪些技术 1&#xff0c;let /const块级作用域声明2&#xff0c;**默认参数**&#xff1a;函数参数可以设置默认值。3&#x…...