大模型 / 智能体在智能运维领域的应用总结与发展趋势概述
智能体 + 智能运维 = ?
回顾大模型的发展
大模型的发展在过去两年间呈现出爆炸式的增长,成为推动人工智能领域快速进步的关键力量。
- 2023年3月:百度发布了其知识增强的大语言模型产品“文心一言”,这标志着国内AI大模型产业竞争的开始,即所谓的“百模大战”。
- 2023年7月初:中国电信在世界人工智能大会上展示了百亿参数的星辰语义模型,并宣布了商业化落地过程中遇到的问题及解决方案。
- 2023年7月8日:中国移动在世界人工智能大会期间正式发布了面向政务领域的九天·海算政务大模型和面向客服领域的九天·客服大模型。
- 2023年11月11日:中国电信进一步披露了其大模型布局,包括开源开放的时间表以及首批试商用的12个行业大模型。
- 2024年2月:百度推出了多模态大模型“ERNIE-ViL”,它结合了图像识别和自然语言处理的能力,可以同时理解和分析文本与图片内容,在视觉问答、图像字幕生成等任务上表现出色。
- 2024年7月:字节跳动发布了针对教育市场的智能辅导助手,结合了自然语言处理和深度学习技术,帮助学生更好地理解和掌握知识点。
- 2024年8月:百度升级了其智能云平台,增强了对大规模预训练模型的支持力度。新的云计算架构优化了模型训练速度和推理效率,为用户提供了一个更为稳定高效的开发环境。
- 2024年9月19日:全球首个多模态地理科学大模型“坤元”在北京发布,这是我国科研团队在全球范围内的一项重要创新成果。
- 2024年11月:百度发布了最新的语音合成系统“Deep Voice 4”,该系统基于深度学习技术,可以在保持高质量语音输出的同时大幅降低计算成本,适用于各类语音交互场景。
- ……
- ……
- 2025年1月21日:腾讯开源了混元3D生成大模型2.0,专注于游戏、具身智能等领域的应用,显示了国内企业在特定垂直领域的探索和技术进步。
从大模型到智能体
不知道从哪一天起,大家聊天的时候不再讨论哪家发布新的大模型,而是哪家公司发布具有新功能的应用。比如:
-
2024年9月12日:百度在其年度大会上揭示了最新的智能体生态方案,推出了开放的文心智能体平台,开发者可以通过简单的文本指令“一句话”创建智能体,降低了开发门槛,吸引了超过10万家企业和60万名开发者参与。

-
2024年7月:阿里云进一步扩展了通义系列,发布了支持多模态数据处理的智能体“通义万相”,增强了对图像、视频等内容的理解和生成能力。

-
2024年5月15日字节跳动发布的火山引擎原动力大会上正式推出了豆包大模型,并且在之后几个月内不断扩展其能力和应用场景。

-
2024年4月:华为发布了针对金融行业的定制化智能体,优化了风险评估、智能投顾等功能,满足金融机构对于精准决策的需求。
-
联想:2024年11月30日,联想发布了国内首款IT服务智能体“联想百应”,该智能体集成了三大AI应用及五大核心技术能力,为中小企业提供了安全可靠的AI解决方案。
-
……
智能体 + 智能运维 = ?
前面介绍那么多大模型与智能体的发展,仿佛一切都充满希望,甚至给人一种 “智能体无所不能” 的 错觉。
这里首先需要回答 第一个问题:什么是智能运维?
这里我们先摘一段大模型的回答结果:
- 智能运维(AIOps, Artificial Intelligence for IT Operations)是利用人工智能技术(如机器学习、数据挖掘和自然语言处理)来优化、自动化和智能化 IT 运维管理的技术和方法。它旨在通过数据驱动的方式帮助企业提升运维效率、降低成本、减少人为干预,并快速响应和解决系统故障。
换而言之:智能是手段,是期望;运维是目的,是根本。
那么,基于大模型,或者精心调教后的智能体,是否可靠 ? 这个问题非常非常关键。
假设,你是一名运维工程师,你需要担心某台机器响应延迟突增,需要考虑某个实例突然挂掉,需要考虑 QPS 突增是否可能存在风险,需要考虑数据库写入速率突增是否存在问题 …… 你是否愿意相信智能体,让它帮你过滤掉误报,保留甚至强调真实报警?
你可能会回答:我使用智能体仅仅用来做一些分析,它给出的结果也仅仅是给我提供参考,我不会完全相信它,所以不会给自己带来损失。
但是,这才是问题的关键。
在大模型/智能体应用在智能运维场景下之前,需要招聘一堆开发者进行研发,并且收集数据,更新知识库,不断迭代更新产品。然后在有一定把握的情况下,才能尝试让运维工程师使用。
经过这么多困难,我们才刚刚开始 !
需要考虑的事情还包括:
- 复杂的业务场景。运维领域的业务场景极其复杂,根本就不是一句话,一百句话,一万句话能讲清楚的事情,甚至业务场景还是一个动态变化的过程。即便是超长时间的运维人员,也没有办法保证自己能解决各种复杂业务场景下的运维问题,更何况目前还不够成熟的大模型/智能体?
- 复杂的真实数据。如果稍微参与过智能运维的真实场景研发,就一定会发现真实数据其实非常非常 “恶心”,换而言之,毫无美感。真实数据最最最大的价值,仅仅在于真实,而不是它具有研发价值。算法能够 cover 的数据场景目前也仅仅是一小块内容。给出一段历史数据,我们训练得到一个模型,在已有数据上表现非常好,但是真实世界很魔幻,数据分布经常发生变化。真实的数据场景是不具备稳定性的。稳定性很可能是短暂的,当且仅当业务稳定,整个世界都平静无波澜才行。但真实世界往往与童话差别很大。
- 复杂的需求场景。同一份数据,在不同的场景下可能被判定存在风险,也可能被判定非常平稳 —— 这是由需求场景决定的。哪怕是同一个需求场景,因为领导、同事的偏好不同,也可能导致大家的理解不同。这个问题在标准化之前,是无解的。
所以 ?
不知不觉写了快3000字 —— 尽管我一直在提醒自己应该做总结,而不是强调智能体在智能运维领域落地有多难。
写了这么多,回顾这近一年时间自己的真实投入,这里我必须给出一个自己的答案:经过23年与24年大模型 / 智能体 的迅猛发展,在当前场景下,智能体 + 智能运维 等于什么。
我的答案是:进展微乎其微,需要解决的问题太多,就连知识库的构建都很难做好。
但是,未来依然是美好的 ~ 共勉 ~
Smileyan
2025.01.23 23:59
相关文章:
大模型 / 智能体在智能运维领域的应用总结与发展趋势概述
智能体 智能运维 ? 回顾大模型的发展 大模型的发展在过去两年间呈现出爆炸式的增长,成为推动人工智能领域快速进步的关键力量。 2023年3月:百度发布了其知识增强的大语言模型产品“文心一言”,这标志着国内AI大模型产业竞争的…...
uniapp 在线更新应用
在线更新应用及进度条显示 1.比较现安装手机中的apk 与线上apk的版本 getVersion(){var newVersionuni.getStorageSync("newVersion").split(".")var versionplus.runtime.version.split(".") // 获取手机安装的版本var versionNum""…...
AIGC视频生成模型:ByteDance的PixelDance模型
大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance,论文于2023年11月发布,模型上线于2024年9月,同时期上线的模型还有Seaweed&…...
python远程获取数据库中的相关数据并存储至json文件
1. conn中的5个变量的含义: ① Driver:数据库驱动程序,我使用的是SQL Server数据库。 ② Server:数据库所在的服务器地址。 ③ Database:要连接的数据库的名称。 ④ UID:登录 SQL Server 数据库的用户名…...
Kubernetes v1.28.0安装dashboard v2.6.1(k8s图形化操作界面)
准备工作 Kubernetes v1.28.0搭建教程请参考:Kubernetes v1.28.0集群快速搭建教程-CSDN博客 查看当前集群nodes都是ready状态 查看当前pods都是running状态 下载并修改配置文件 下载 recommended.yaml ,下载好之后,进入文件编辑 下载地址…...
详解三种常用标准化:Batch Norm、Layer Norm和RMSNorm
在深度学习中,标准化技术是提升模型训练速度、稳定性和性能的重要手段。本文将详细介绍三种常用的标准化方法:Batch Normalization(批量标准化)、Layer Normalization(层标准化)和 RMS Normalization&#…...
linux+docker+nacos+mysql部署
一、下载 docker pull mysql:5.7 docker pull nacos/nacos-server:v2.2.2 docker images 二、mysql部署 1、创建目录存储数据信息 mkdir ~/mysql cd ~/mysql 2、运行 MySQL 容器 docker run -id \ -p 3306:3306 \ --name mysql \ -v $PWD/conf:/etc/mysql/conf.d \ -v $PWD/…...
如何实现gitlab和jira连通
将 GitLab 和 Jira 集成起来可以实现开发任务与代码变更的联动,提高团队协作效率。以下是实现两者连通的详细步骤: 1. 确保必要条件 在进行集成之前,确保以下条件满足: 你有 GitLab 和 Jira 的管理员权限。Jira 是 Jira Cloud 或…...
利用ML.NET精准提取人名
在当今信息爆炸的时代,文本处理任务层出不穷,其中人名提取作为基础且重要的工作,广泛应用于信息检索、社交网络分析、客户关系管理等领域。随着人工智能不断进步,ML.NET作为微软推出的开源机器学习框架,为开发者提供了…...
Node.js的解释
1. Node.js 入门教程 1.1 什么是 Node.js? 1.1.1 Node.js 是什么? Node.js 是一个基于 JavaScript 的开源服务器端运行时环境,允许开发者用 JavaScript 编写服务器端代码。与传统的前端 JavaScript 主要运行在浏览器端不同,Nod…...
Macos下交叉编译安卓的paq8px压缩算法
官方没有android的编译方法,自己编写脚本在macos下交叉编译. 下载源码: git clone https://github.com/hxim/paq8px.git 稍旧的ndk并不能编译成功,需要下载最新的ndkr27c, 最后是使用clang来编译。 编译build.sh export ANDROID_NDK/Vol…...
如何在data.table中处理缺失值
📊💻【R语言进阶】轻松搞定缺失值,让数据清洗更高效! 👋 大家好呀!今天我要和大家分享一个超实用的R语言技巧——如何在data.table中处理缺失值,并且提供了一个自定义函数calculate_missing_va…...
从零安装 LLaMA-Factory 微调 Qwen 大模型成功及所有的坑
文章目录 从零安装 LLaMA-Factory 微调 Qwen 大模型成功及所有的坑一 参考二 安装三 启动准备大模型文件 四 数据集(关键)!4.1 Alapaca格式4.2 sharegpt4.3 在 dataset_info.json 中注册4.4 官方 alpaca_zh_demo 例子 999条数据, 本机微调 5分…...
SQL-leetcode—1164. 指定日期的产品价格
1164. 指定日期的产品价格 产品数据表: Products ---------------------- | Column Name | Type | ---------------------- | product_id | int | | new_price | int | | change_date | date | ---------------------- (product_id, change_date) 是此表的主键(具…...
[Day 15]54.螺旋矩阵(简单易懂 有画图)
今天我们来看这道螺旋矩阵,和昨天发的题很类似。没有技巧,全是循环。小白也能懂~ 力扣54.螺旋矩阵 题目描述: 给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。 示例 1: …...
HTTP 配置与应用(不同网段)
想做一个自己学习的有关的csdn账号,努力奋斗......会更新我计算机网络实验课程的所有内容,还有其他的学习知识^_^,为自己巩固一下所学知识,下次更新校园网设计。 我是一个萌新小白,有误地方请大家指正,谢谢…...
Quartus:开发使用及 Tips 总结
Quartus是Altera(现已被Intel收购)推出的一款针对其FPGA产品的综合性开发环境,用于设计、仿真和调试数字电路。以下是使用Quartus的一些总结和技巧(Tips),帮助更高效地进行FPGA项目开发: 这里写目录标题 使用总结TIPS…...
VSCode下EIDE插件开发STM32
VSCode下STM32开发环境搭建 本STM32教程使用vscode的EIDE插件的开发环境,完全免费,有管理代码文件的界面,不需要其它IDE。 视频教程见本人的 VSCodeEIDE开发STM32 安装EIDE插件 Embedded IDE 嵌入式IDE 这个插件可以帮我们管理代码文件&am…...
Golang并发机制及CSP并发模型
Golang 并发机制及 CSP 并发模型 Golang 是一门为并发而生的语言,其并发机制基于 CSP(Communicating Sequential Processes,通信顺序过程) 模型。CSP 是一种描述并发系统中交互模式的正式语言,强调通过通信来共享内存…...
HTML 文本格式化详解
在网页开发中,文本内容的呈现方式直接影响用户的阅读体验。HTML 提供了多种文本格式化元素,可以帮助我们更好地控制文本的显示效果。本文将详细介绍 HTML 中的文本格式化元素及其使用方法,帮助你轻松实现网页文本的美化。 什么是 HTML 文本格…...
Docker 离线安装指南
参考文章 1、确认操作系统类型及内核版本 Docker依赖于Linux内核的一些特性,不同版本的Docker对内核版本有不同要求。例如,Docker 17.06及之后的版本通常需要Linux内核3.10及以上版本,Docker17.09及更高版本对应Linux内核4.9.x及更高版本。…...
日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする
日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする 1、前言(1)情况说明(2)工程师的信仰2、知识点(1) にする1,接续:名词+にする2,接续:疑问词+にする3,(A)は(B)にする。(2)復習:(1)复习句子(2)ために & ように(3)そう(4)にする3、…...
DAY 47
三、通道注意力 3.1 通道注意力的定义 # 新增:通道注意力模块(SE模块) class ChannelAttention(nn.Module):"""通道注意力模块(Squeeze-and-Excitation)"""def __init__(self, in_channels, reduction_rat…...
页面渲染流程与性能优化
页面渲染流程与性能优化详解(完整版) 一、现代浏览器渲染流程(详细说明) 1. 构建DOM树 浏览器接收到HTML文档后,会逐步解析并构建DOM(Document Object Model)树。具体过程如下: (…...
BCS 2025|百度副总裁陈洋:智能体在安全领域的应用实践
6月5日,2025全球数字经济大会数字安全主论坛暨北京网络安全大会在国家会议中心隆重开幕。百度副总裁陈洋受邀出席,并作《智能体在安全领域的应用实践》主题演讲,分享了在智能体在安全领域的突破性实践。他指出,百度通过将安全能力…...
Android Bitmap治理全解析:从加载优化到泄漏防控的全生命周期管理
引言 Bitmap(位图)是Android应用内存占用的“头号杀手”。一张1080P(1920x1080)的图片以ARGB_8888格式加载时,内存占用高达8MB(192010804字节)。据统计,超过60%的应用OOM崩溃与Bitm…...
保姆级教程:在无网络无显卡的Windows电脑的vscode本地部署deepseek
文章目录 1 前言2 部署流程2.1 准备工作2.2 Ollama2.2.1 使用有网络的电脑下载Ollama2.2.2 安装Ollama(有网络的电脑)2.2.3 安装Ollama(无网络的电脑)2.2.4 安装验证2.2.5 修改大模型安装位置2.2.6 下载Deepseek模型 2.3 将deepse…...
Mysql中select查询语句的执行过程
目录 1、介绍 1.1、组件介绍 1.2、Sql执行顺序 2、执行流程 2.1. 连接与认证 2.2. 查询缓存 2.3. 语法解析(Parser) 2.4、执行sql 1. 预处理(Preprocessor) 2. 查询优化器(Optimizer) 3. 执行器…...
STM32HAL库USART源代码解析及应用
STM32HAL库USART源代码解析 前言STM32CubeIDE配置串口USART和UART的选择使用模式参数设置GPIO配置DMA配置中断配置硬件流控制使能生成代码解析和使用方法串口初始化__UART_HandleTypeDef结构体浅析HAL库代码实际使用方法使用轮询方式发送使用轮询方式接收使用中断方式发送使用中…...
HTML前端开发:JavaScript 获取元素方法详解
作为前端开发者,高效获取 DOM 元素是必备技能。以下是 JS 中核心的获取元素方法,分为两大系列: 一、getElementBy... 系列 传统方法,直接通过 DOM 接口访问,返回动态集合(元素变化会实时更新)。…...
