Elasticsearch:人工智能时代的公共部门数据治理
作者:来自 Elastic Darren Meiss

人工智能(AI)和生成式人工智能(GenAI)正在迅速改变公共部门,从理论探讨走向实际应用。正确的数据准备、管理和治理将在 GenAI 的成功实施中发挥关键作用。
我们最近举办了一场名为 “人工智能时代的公共部门数据治理” 的网络研讨会,邀请了行业专家 IDC 研究总监 Max Klaps 和 Elastic 杰出架构师 Dave Erickson。他们探讨了 GenAI 在政府、教育和国防领域的现状,并深入分析了 GenAI 带来的数据挑战和机遇。
公共部门机构对 AI 的态度发生了重大转变。最初,它们主要在不同的 AI 工具和试点项目上进行探索,如今的重点则是确定能够带来实际价值并与组织使命及关键绩效指标(KPI)相契合的具体用例。
人工智能 ( AI ) 在政府中的发展
政府机构和其他公共部门组织对 AI 的应用方式发生了重大变化。最初,这些组织尝试使用各种 AI 工具和试点项目。然而,现在的重点已经转向识别能够提供实际价值并符合组织使命和关键绩效指标 ( key performance indicators - KPIs ) 的具体用例。
根据 IDC 的研究,大约一半的公共部门组织正在运行试点项目,20% 的组织已经在生产环境中实施 AI 。现在的关键问题是 AI 可以在哪些领域产生最大影响。各组织正在优先考虑那些能够提升运营效率、增强韧性、减少错误、确保合规性并提高流程可观察性的用例。最终目标是利用 AI ,尤其是生成式 AI ( GenAI ) ,为公共部门的工作人员、公民和学生带来更好的成果。
优先考虑高影响力的用例
当前的重点集中在几个关键用例上,被归类为 “第一阶段” ( horizon one ) ,其目标是取得早期成果、测试现有能力,并探索更具影响力和外部导向的未来用例。
第一阶段的用例通常涉及内部流程,例如关键自然基础设施保护、金融市场监管、动态数字立法、公共沟通和通知,以及为高等教育提供 AI 研究和写作辅助。这些用例通常围绕内容获取、摘要和准备展开。
展望未来,公共部门领导者正在探索并扩大对任务成果有直接影响的用例。这些包括提升服务交付、减少税务合规负担、确保支付完整性并降低欺诈风险、将自然语言能力集成到 311 系统中,以及在高等教育中实现超个性化的学生招生和干预。
克服挑战并确保数据准备就绪
实施 GenAI 并非没有挑战,常见的障碍包括:
-
治理 ( Governance )
-
风险 ( Risk )
-
安全性 ( Security )
-
成本控制 ( Cost control )
-
可扩展性 ( Scalability )
但一个反复出现的主题是数据准备的重要性。尽管高质量数据至关重要,但数量并不是主要问题。公共部门组织可以利用预训练模型,并专注于为 AI 提供与特定用例相关的、精心整理的数据。这种方法被称为 检索增强生成 ( RAG, Retrieval Augmented Generation ),可以确保 AI 的回答基于权威信息,并降低错误或偏见输出的风险。输入生成模型的数据质量至关重要。
RAG:成功的关键模式
RAG 是为 生成式 AI ( GenAI ) 提供适当上下文的重要工作流。它不是仅依赖模型的 预先知识 ( pre-existing knowledge ),而是从组织的 专有数据 ( proprietary data )(如 文档 ( documents )、图像 ( images )、音频 ( audio ))中检索相关数据,并利用这些数据来优化 AI ( 人工智能 ) 的回答。这种方法可以提高 AI 生成答案的准确性 ( accuracy )、可信度 ( trustworthiness ) 和 可解释性 ( explainability )。
Elastic 在实现 RAG 方面发挥着重要作用。我们的 向量数据库 ( vector database ) 使组织能够存储、检索和分析海量数据,从而更轻松地将 AI 关联到权威信息。
负责任的 AI 和风险缓解
负责任的 AI ( Responsible AI ) 需要确保 AI 系统 ( AI systems ) 具备 道德性 ( ethical )、可解释性 ( explainable ) 和 透明性 ( transparent )。组织可以采取以下措施来促进 负责任的 AI:
-
评估和分类不同用例的 风险等级 ( risk levels )
-
优先考虑 风险缓解策略 ( risk mitigation strategies ),例如实施 数据安全协议 ( data security protocols ) 和 检测偏见 ( detecting bias )
-
建立 明确的责任和报告机制 ( clear accountability and reporting mechanisms )
-
与公众沟通,解释 AI 的风险 ( risks ) 和 机遇 ( opportunities )
在讨论 AI 风险 ( AI risks ) 时,使用 统一的语言和框架 ( common language and framework ) 至关重要。例如,在 美国 ( United States ),可以参考 国家标准与技术研究院 ( NIST ) 的风险管理框架 ( Risk Management Framework, RMF )。
另一个关键点是,将 负责任 AI 的补偿控制 ( compensating controls ) 与 AI 本身 ( AI itself ) 分开 —— 换句话说,就是 保持对 AI 监管措施 ( guardrails ) 的控制。此外,持续评估 ( continuous evaluation ) AI 生成的答案 对于确保公众信任至关重要。
为 GenAI 培养人才
人 ( People ) 是 成功实施 GenAI ( 生成式 AI ) 的关键。组织需要投入 培训 ( training ) 和 发展 ( development ),以确保员工适应这一变革。关键关注点包括:
-
为所有员工建立 AI 认知 ( AI awareness ) 和 风险培训 ( risk training )
-
为 技术人员 ( technical staff ) 提供 AI 工具 ( tools ) 和 实践机会 ( opportunities )
-
利用 合作伙伴生态系统 ( partner ecosystem ) 的专业知识,例如 学术研究机构 ( academic research institutions ) 和 标准机构 ( standards bodies )
-
创建空间,让员工体验 AI 的局限性 ( AI's limitations ),并学习如何将其 有效作为工具 ( use it effectively as a tool )。强调 摒弃 AI 是全知全能 ( all-knowing entity ) 的思维方式,并鼓励更加 务实 ( practical ) 的方法,以理解 AI 的能力 ( capabilities ) 和 局限性 ( limitations )。
了解更多
收听 《人工智能时代的公共部门数据管理》 以获取更多关于 利用 GenAI 的巨大力量与潜力 的见解。
原文:Public sector data stewardship for the AI era | Elastic Blog
相关文章:
Elasticsearch:人工智能时代的公共部门数据治理
作者:来自 Elastic Darren Meiss 人工智能(AI)和生成式人工智能(GenAI)正在迅速改变公共部门,从理论探讨走向实际应用。正确的数据准备、管理和治理将在 GenAI 的成功实施中发挥关键作用。 我们最近举办了…...
Web开发:数据的加密和解密
一、常见通用术语解析 加盐:在密码中加入随机数据,提高安全性。摘要:固定长度的输出,用于数据完整性验证。加密:将数据转换为不可读形式,确保安全。撞库:通过暴力破解比对常见密码的攻击方式。…...
低功耗LPWAN模块开发指南:远距离无线通信与边缘计算融合实战
在远程资产追踪、野外环境监测等场景中,稳定可靠的长距离通信与超低功耗是系统设计的核心挑战。eFish-SBC-RK3576通过 原生双UART接口 USB OTG扩展能力 ,可无缝集成主流LPWAN模组(LoRa/NB-IoT),实现“数据采集-边…...
RHCA核心课程技术解析5:红帽高可用性集群架构与深度实践
一、红帽高可用集群架构全景 1.1 核心组件交互逻辑 graph TD A[节点1] -->|Corosync 心跳| B[节点2] A -->|Pacemaker 资源管理| C[共享存储] B --> C D[Fencing设备] -->|STONITH| A D -->|STONITH| B C -->|GFS2锁管理| A C -->|GFS2锁管理| B 1.2 集…...
Python切片中的步长秘密
Python切片中的步长秘密 大家好!今天我们来聊聊Python切片中一个有趣的话题 - 步长(step)。 基本格式回顾 Python切片的完整格式是: [起点:终点:步长] 但你是否注意到,很多代码里的切片都只写了起点和终点?没错,步长是可以省略的! 步长的默认…...
Spring Boot事务管理详解(附银行转账案例)
一、事务基础概念 事务的ACID特性: 原子性(Atomicity):操作要么全部成功,要么全部失败一致性(Consistency):数据在事务前后保持合法状态隔离性(Isolation)&…...
【超详细教程】2025年3月最新Pytorch安装教程(同时讲解安装CPU和GPU版本)
目录 一、前言二、pytorch简介三、安装准备工作3.1、下载Anaconda 四、判断是否有NVIDIA显卡五、安装pytorch-CPU版本六、安装pytorch-GPU版本6.1、查看CUDA显卡驱动版本6.2、安装CUDA6.3、安装CuDNN(加速器)6.4、安装pytorch-GPU6.5 其他方法安装注意 七…...
Unity光线传播体积(LPV)技术实现详解
一、LPV技术概述 光线传播体积(Light Propagation Volumes)是一种实时全局光照技术,通过将场景中的间接光信息存储在3D网格中,实现动态物体的间接光照效果。 核心优势: 实时性能:相比传统光照贴图,支持动态场景 硬件…...
Git和GitCode使用(从Git安装到上传项目一条龙)
第一步 菜鸟教程-Git教程 点击上方链接,完成Git的安装,并了解Git 工作流程,知道Git 工作区、暂存区和版本库的区别 第二步 GitCode官方帮助文档-SSH 公钥管理 点击上方链接,完成SSH公钥设置 第三步(GitCode的官方引…...
通信之光纤耦合器
以下是关于光纤耦合器的详细介绍: 定义与原理 - 定义:光纤耦合器是一种能使传输中的光信号在特殊结构的耦合区发生耦合,并进行再分配的器件,也叫分歧器、连接器、适配器、光纤法兰盘。 - 原理:利用不同光纤面紧邻光纤芯…...
5G核心网(5GC)开户中,DNN(Data Network Name,数据网络名称)
在5G核心网(5GC)开户中,DNN(Data Network Name,数据网络名称)是关键概念之一,以下是关于它的详细介绍: 定义 DNN是5G网络中用于标识外部数据网络的名称,相当于4G中的APN(Access Point Name),两者功能等价。 组成 DNN由两部分组成: 网络ID(NI):必选,至少包…...
OpenCV、YOLO与大模型的区别与关系
OpenCV、YOLO 和大模型的区别与关系 1. OpenCV(Open Source Computer Vision Library) 定位:开源的计算机视觉基础库。功能:提供传统的图像处理算法(如图像滤波、边缘检测、特征提取)和基础工具ÿ…...
虚拟电商-话费充值业务(二)话费充值对接供应商模块开发
一、对接供应商模块开发 供应商对接模块chongba_recharge_supplier主要负责的就是调用外部的供应商系统进行充值下单,这种调用是一种基于HTTP协议的调用。 此外在供应商对接模块中主要是实现的业务逻辑有: 1:余额或押金不足情况下的失败轮…...
练习题:110
目录 Python题目 题目 题目分析 需求理解 关键知识点 实现思路分析 代码实现 代码解释 函数定义: 计算值的总和: 测试函数: 运行思路 结束语 Python题目 题目 定义一个函数,接受一个字典作为参数,返回字…...
c#winform,倒鸭子字幕效果,typemonkey字幕效果,抖音瀑布流字幕效果
不废话 直接上效果图 C# winform 开发抖音的瀑布流字幕。 也是typemonkey插件字幕效果 或者咱再网上常说的倒鸭子字幕效果 主要功能 1,软件可以自定义添加字幕内容 2,软件可以添加字幕显示的时间区间 3,可以自定义字幕颜色,可以随…...
游戏被外挂攻破?金融数据遭篡改?AI反作弊系统实战方案(代码+详细步骤)
一、背景与需求分析 随着游戏行业与金融领域的数字化进程加速,作弊行为(如游戏外挂、金融数据篡改)日益复杂化。传统基于规则的防御手段已难以应对新型攻击,而AI技术通过动态行为分析、异常检测等能力,为安全领域提供了革命性解决方案。本文以游戏反作弊系统和金融数据安…...
晶晨S905L3A(B)-安卓9.0-开启ADB和ROOT-支持IPTV6-支持外置游戏系统-支持多种无线芯片-支持救砖-完美通刷线刷固件包
晶晨S905L3A(B)-安卓9.0-开启ADB和ROOT-支持IPTV6-支持外置游戏系统-支持多种无线芯片-支持救砖-完美通刷线刷固件包 适用型号:M401A、CM311-1a、CM311-1sa、B863AV3.1-M2、B863AV3.2-M、UNT403A、UNT413A、M411A、E900V22C、E900V22D、IP112H等等晶晨S905L3A(B)处…...
AI来了,新手如何着手学习软件开发?
AI时代新手学习软件开发的7步进化指南 (附具体工具与避坑策略) 一、建立“人机协作”学习观 AI是教练,不是替身 正确姿势:用AI辅助理解概念(如让DeepSeek 、ChatGPT用生活案例解释递归),但坚持手…...
JDK 24 Class File API 介绍
概述 JDK 24 引入的 Class File API 提供了一套类型安全的 API 用于操作 Java 类文件。这套 API 允许我们以编程方式读取、修改和创建 Java 类文件,而不需要直接处理底层的字节码。 注1:JDK 24 已于2025年3月18日正式发布,Release信息参见官…...
C++23:现代C++的模块化革命与零成本抽象新高度
以下代码为伪代码,仅供参考 一、标准库的范式突破 1. std::expected:类型安全的错误处理 std::expected<DataPacket, ErrorCode> parsePacket(ByteStream& stream) {if (stream.header_valid()) return decode_packet(stream);elsereturn s…...
《K230 从熟悉到...》矩形检测
《K230 从熟悉到...》矩形检测 《庐山派 K230 从熟悉到...》矩形检测 矩形检测技术是一种广泛应用于电子图像处理的核心技术。它通过识别和分析图像中的矩形结构,为各种应用提供基础支持。从传统图像处理算法到现代深度学习技术,矩形检测的实现途径多种多…...
Unity 面向对象实战:掌握组件化设计与脚本通信,构建玩家敌人交互
Langchain系列文章目录 01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块:四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain:从核心链条构建到动态任务分配的实战指南 04-玩转 LangChai…...
3. 第三放平台部署deepseek
有时候我们会发现使用deepseek服务器,异常卡顿,这是由于多方面原因造成的,比如说访问人数过多等。想要解决这个问题,我们可以选择第三方平台进行部署 第三方平台 我们可以选择的第三方平台很多,比如硅基流动、秘塔搜索…...
【C++指针】搭建起程序与内存深度交互的桥梁(下)
🔥🔥 个人主页 点击🔥🔥 每文一诗 💪🏼 往者不可谏,来者犹可追——《论语微子篇》 译文:过去的事情已经无法挽回,未来的岁月还可以迎头赶上。 目录 C内存模型 new与…...
.NET开发基础知识1-10
1. 依赖注入(Dependency Injection) 技术知识:依赖注入是一种设计模式,它允许将对象的依赖关系从对象本身中分离出来,通过构造函数、属性或方法参数等方式注入到对象中。这样可以提高代码的可测试性、可维护性和可扩展…...
IEEE PDF Xpress校验出现 :字体无法嵌入问题以及pdf版本问题
文章目录 问题描述一、字体嵌入问题首先查看一下,哪些字体没有被嵌入查看window的font文件夹里的字体下载字体的网站修复字体嵌入问题 二、pdf版本不对 问题描述 在处理IEEE的camera ready的时候,提交到IEEE express的文件没有办法通过validate…...
cookie详解
一、cookie出现原因 http是无状态的,浏览器无法记录当前是哪个人浏览的,所以出现了cookie 作用:会话状态管理(用户登录状态、购物车、游戏分数)、个性化设置(主题、自定义设置)、浏览器行为跟…...
Mayo Clinic Platform在人工智能医疗领域的现状及启示意义研究
一、引言 1.1 研究背景与意义 在科技飞速发展的当下,人工智能(AI)已逐渐渗透至各个行业,医疗领域作为关乎人类生命健康的重要领域,也迎来了人工智能技术带来的深刻变革。人工智能医疗,作为人工智能与医疗行业深度融合的产物,正重塑着全球医疗的格局。 从全球范围来看,…...
Rust基础语法
以下是 Rust 语言基础语法的核心要点,结合与 JavaScript 的对比,帮助前端开发者快速掌握核心概念: 一、变量与常量 1. 变量声明 Rust:变量默认不可变,需用 mut 显式声明可变性。let x 5; // 不可变变量 le…...
如何将 Java 应用做成 EXE 的可执行软件
目录 前言一、情景介绍二、实现步骤1. 打 Jar 包2. 编写 bat 批处理文件3. bat 转 exe 前言 最近使用 GUI 帮朋友写了一个软件,为了方便他处理工作上的重复性且很麻烦的事情,程序是使用 Java 写的,就不得不面对一个问题:我必须将…...
