当前位置: 首页 > article >正文

数据开发者的AI转型:大模型应用实录

1️⃣需求解析辅助研发这个功能其实很有意思我们迭代了两期。第一期其实这个功能一开始设计的比较天马行空就是直接给一个需求进来然后直接给你开发好。但是研发了半个月叫停了发现模型根本理解不了整个需求我们尝试过使用claude准确率确实好一点但是对于上线直接用还是不行。所以最后我们退而求其次还是做辅助吧就是你一个需求来了先帮你设计个大概或者你自己描述清楚点一步步做引导式的进行开发就像现在的cursor不过这里做了rag检索就是用把2️⃣里面的表和描述都放进去了。你每描述一句就帮你把对应的表相应的sql写出来但是用不用还是你自己定不保证正确性只是纯辅助。发现这个功能数据同学用起来还挺爽因为你不会干掉他们但是能减轻他们的工作量。第二期跟数据一起做了很多的对焦后发现他们很多需求其实有些相似和重复甚至很多代码跟线上的某些片段式类似的。所以我们做了一个事情就是把他们线上的代码都解析一下这个解析真的花了很大的工作就这一句话我们花了一个同学两周的时间。最后保证了很高的准确率的。就是每个代码片段从局部到整体都让大模型做描述最后得到很多描述和代码pair。然后我们把这个也落库当他们在写需求的时候我们就纯检索然大模型参考写。这个真的是大大提高了代码的准确性。他们用起来贼爽。2️⃣表查询答疑这个功能应该是所有企业都做了的对于一个大的公司一个大部门常用表都得上万张老方法都是直接找到对应部门问tl然后层层传导找到具体的人看有没有相应的数据和表。而找到人大概率就是甩给你一个文档你先通读一遍。稍微先进点的都有对应的搜索系统但是纯模糊匹配再自己挨个看再找对应人答疑看文档。所以大模型第一个提效的就是这个活把所有表落库且有对应的说明对应的字段都有解释。我们给该场景做了很多智能化能力首先是落库落库前大模型会仔细check描述和解释是否符合标准不符合标准从来。然后是答疑faq有标准的格式。然后是表和faq落库建立索引。最后是建立一个大模型的数据表查询和答疑库进行rag答疑。3️⃣报表查数首先这个一开始想的是给运营和老板做的因为他们不会写代码但是就是会有各种奇奇怪怪的查数需求之前都是提需求给数据研发所以想说能不能用大模型做这事这个功能我觉得做的不是很好虽然老板和业务买单了因为这个功能要求非常精准的结果我们做到最后单表查询是很准的多表查询不行。为什么单表查询老板和运营就买单了呢因为我们的场景有上千个字段老板只是会统计一些组合数据看一下指导自己的决策。但是单表就注定他不是很灵活所以我是觉得做的失败的。4️⃣运维治理很多人不理解数据开发为啥要治理其实你自己想想你很有可能开发了某个功能每天例行在跑数据但是突然哪天这个业务停了这个数据没用了但是你很可能并没有把数据停下就会造成浪费在真实的工作中大部分人不会自己去审核自己的代码是否还有用这种费力不讨好的活基本上不会有人干。所以之前有很多检测机制最简单的就是检测这个表有没有读取但是这个方法也有很多应对的策略。所以为了能够更好的治理就让大模型解读代码帮你把上下游梳理出来然后看哪些表根本没有业务在使用。迫使你去干掉。这个活其实很有意思但是其实准确率不高不过还是在持续迭代中。2026年大模型已经无处不在但幻觉hallucination仍是企业落地的最大杀手金融风控、医疗问诊、客服机器人动辄编造事实直接导致合规风险和信任崩盘。知识图谱Knowledge Graph的核心价值正是结构化知识把碎片化数据变成实体-关系-属性的三元组网络让大模型先查图谱再回答。行业价值支持复杂多跳推理、知识溯源、实时更新广泛用于推荐系统、智能搜索、企业大脑。大模型痛点纯向量RAG召回率低、无法处理逻辑关系知识图谱大模型GraphRAG可将准确率提升40%以上。图谱赋能意义把大模型从概率生成器变成可信知识引擎真正实现企业级私有化落地。核心知识点知识图谱不是又一个数据库而是大模型的长期记忆和推理大脑。为方便大家学习 这里给大家整理了一份学习资料包 需要的同学 根据下图自取即可

相关文章:

数据开发者的AI转型:大模型应用实录

1️⃣需求解析&辅助研发 这个功能其实很有意思,我们迭代了两期。 第一期,其实这个功能一开始设计的比较天马行空,就是直接给一个需求进来,然后直接给你开发好。但是研发了半个月叫停了,发现模型根本理解不了整个需…...

避坑指南:ABB机器人PC SDK开发中,网络扫描(NetworkScanner)为何总为空?

ABB机器人PC SDK网络扫描故障深度排查指南 当你在C#项目中调用NetworkScanner.Scan()方法时,那个本该充满控制器信息的ControllerInfoCollection却固执地保持空白——这种挫败感每个ABB机器人开发者都深有体会。本文将从协议栈底层到网络拓扑,系统性地拆…...

从理论到代码:深入理解OpenCV中NMSBoxes的双重过滤机制

从理论到代码:深入理解OpenCV中NMSBoxes的双重过滤机制 在目标检测任务中,非极大值抑制(NMS)是后处理环节的核心技术之一。OpenCV提供的cv2.dnn.NMSBoxes()函数通过双重阈值过滤机制实现了高效的目标框筛选,本文将深入…...

保姆级避坑指南:在只有一台能上网的服务器上,搞定Proxmox VE 7.0三节点集群和Ceph存储

混合网络环境下Proxmox VE集群与Ceph存储的实战部署指南 在企业的IT基础设施部署中,网络环境往往存在各种限制。特别是在安全要求较高的场景下,服务器节点可能被划分为不同的网络区域,仅有少数节点能够直接访问互联网。这种混合网络环境给Pro…...

算法岗正在分化:谁在做模型谁在做应用

你这个问题,我先给个结论,一个可能会让你有点意外但绝对是现实的结论:你遇到的情况,不是特例,而是正在迅速成为行业的主流和新常态。你实习干的活,很有可能就是未来几年大多数“AI工程师”或者“算法工程师…...

“INMS: Memory Sharing for Large Language Model based Agents“ 论文笔记誓

1.概述在人工智能快速发展的今天,AI不再仅仅是回答问题的聊天机器人,而是正在演变为能够主动完成复杂任务的智能代理。OpenAI的Codex CLI就是这一趋势的典型代表——一个跨平台的本地软件代理,能够在用户的机器上安全高效地生成高质量的软件变…...

C#的[DoesNotReturn]和[DoesNotReturnIf]:帮助流分析的特性

C#的[DoesNotReturn]和[DoesNotReturnIf]特性是编译器流分析的重要工具,它们通过显式标记方法或代码块的终止行为,帮助开发者编写更安全、更高效的代码。这些特性在异常处理、条件终止等场景中尤为实用,能够显著提升代码的可读性和静态分析的…...

SDD基于规范编程-OpenSpec及SuperPowers沙

智能体时代的代码范式转移与 C# 的战略转型 传统的 C# 开发模式,即所谓的“工程导向型”开发,要求开发者创建一个复杂的项目结构,包括项目文件(.csproj)、解决方案文件(.sln)、属性设置以及依赖…...

自编码器在图像处理中的5个隐藏用法:从降噪到异常检测

自编码器在图像处理中的5个隐藏用法:从降噪到异常检测 当大多数人提起自编码器时,第一反应往往是"数据压缩"。确实,这个由Geoffrey Hinton团队在2006年重新发掘的技术,最初被广泛应用于降维和特征提取。但如果你只把自编…...

3步释放20GB空间:DriverStore Explorer的系统驱动优化方案

3步释放20GB空间:DriverStore Explorer的系统驱动优化方案 【免费下载链接】DriverStoreExplorer Driver Store Explorer 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer DriverStore Explorer(简称RAPR)是一款轻量…...

如何用Dify零代码打造专属AI知识管家:从资料整理到智能对话全指南

1. 为什么你需要一个AI知识管家? 你有没有遇到过这种情况:电脑里存了几百份工作文档,手机相册堆满了截图,微信收藏夹塞得满满当当,但真要找某个关键信息时却像大海捞针?我以前经常被这个问题困扰&#xff0…...

从零搭建一个RAG应用:我为什么最终放弃了ChromaDB而选择了Milvus?

从零搭建一个RAG应用:我为什么最终放弃了ChromaDB而选择了Milvus? 去年夏天,当我接到为企业内部构建文档知识库系统的任务时,本以为选择向量数据库会是整个项目中最简单的决策。毕竟ChromaDB在开发者社区的口碑极佳,文…...

用K230开发板给AI模型拍训练集照片?一个物理按键搞定(附Python源码)

用K230开发板打造智能训练集采集器:从硬件连接到Python实战 在AI模型训练过程中,高质量的数据集往往比算法本身更重要。但对于初学者和小型项目来说,专业的数据采集设备成本高昂,而普通摄像头又缺乏灵活性和可编程控制。K230开发板…...

Symfony 安全日志集成:TokenProcessor与SwitchUserTokenProcessor完全指南

Symfony 安全日志集成:TokenProcessor与SwitchUserTokenProcessor完全指南 【免费下载链接】monolog-bridge Provides integration for Monolog with various Symfony components 项目地址: https://gitcode.com/gh_mirrors/mo/monolog-bridge 在Symfony应用…...

Kubernetes集群的自动化运维实践

Kubernetes集群的自动化运维实践 🔥 硬核开场 各位技术老铁,今天咱们聊聊Kubernetes集群的自动化运维实践。别跟我扯那些理论,直接上干货!在云原生时代,Kubernetes已经成为容器编排的事实标准,但随着集群规…...

Ubuntu20.04下Intel RealSense设备开发环境搭建:从libRealsense SDK 2.0到ROS Wrapper全流程指南

1. 环境准备与基础概念 在Ubuntu 20.04上搭建Intel RealSense开发环境前,我们需要明确几个关键概念。librealsense SDK 2.0是Intel官方提供的底层驱动库,负责与硬件直接通信;而ROS Wrapper则是将SDK功能封装成ROS节点,让深度相机数…...

VMware Workstation 16 中 Windows Server 2019 数据中心版安装与优化指南

1. VMware Workstation 16 环境准备 在开始安装 Windows Server 2019 数据中心版之前,我们需要先准备好 VMware Workstation 16 的环境。我建议大家在安装前检查下自己的电脑配置,毕竟跑虚拟机还是挺吃资源的。我的经验是,至少要有 16GB 内存…...

VCSA 7.0 高效部署实战:从零搭建企业级虚拟化平台

1. 环境准备与ISO获取 部署VCSA 7.0的第一步是准备好安装环境。我建议使用物理服务器或高性能虚拟机作为部署平台,内存至少16GB起步。很多新手容易忽略硬件兼容性问题,这里有个实用技巧:到VMware官网的兼容性指南页面,用你的硬件型…...

告别ns3-gym!用ns3-ai在Ubuntu 22.04上实现百倍速AI网络仿真(附完整避坑指南)

告别ns3-gym!用ns3-ai在Ubuntu 22.04上实现百倍速AI网络仿真(附完整避坑指南) 如果你正在使用ns3-gym进行AI网络仿真研究,很可能已经遇到了通信效率低下的瓶颈。传统基于Socket的进程间通信(IPC)方式在大量…...

基于深度学习的yolo交通信号灯检测与分类项目 红绿灯识别 道路标识识别(数据集+模型+gui界面)

交通信号灯检测与分类项目详细介绍 yolov9交通信号灯检测与分类项目 项目概述 随着自动驾驶技术的迅速发展,交通信号灯的准确检测和分类对于确保车辆的安全性和效率至关重要。本项目——交通信号灯检测与分类(Traffic Light Detection and Classificatio…...

三自由度车辆仿真融合Matlab与carsim,融合EKF/UKF与积分法测量质心侧偏角、纵向...

matlab和carsim联合仿真,基于三自由度车辆模型,搭建ekf或者ukf与积分法融合的用于测量质心侧偏角,纵向速度,横摆角速度。清晨六点半的实验室键盘声格外清脆,我盯着屏幕里那辆在CarSim里蛇形走位的虚拟高尔夫&#xff0…...

隐私优先的AI助手:OpenClaw+Qwen3-4B离线处理敏感财务文档

隐私优先的AI助手:OpenClawQwen3-4B离线处理敏感财务文档 1. 为什么需要离线AI财务助手 去年整理家庭年度支出时,我遇到了一个尴尬问题:想把银行流水导出到Excel做分类统计,但账单PDF包含太多敏感信息(账户号、交易对…...

Windows更新修复工具深度技术指南:从问题诊断到系统优化

Windows更新修复工具深度技术指南:从问题诊断到系统优化 【免费下载链接】Reset-Windows-Update-Tool Troubleshooting Tool with Windows Updates (Developed in Dev-C). 项目地址: https://gitcode.com/gh_mirrors/re/Reset-Windows-Update-Tool Windows更…...

喔去,litellm 竟然被投毒了,赶紧检查你的机器中招了没有敝

一、什么是setuptools? setuptools 是一个用于创建、分发和安装 Python 包的核心库。 它可以帮助你: 定义 Python 包的元数据(如名称、版本、作者等)。 声明包的依赖项,确保你的包能够正确运行。 构建源代码分发包&…...

AI时代的算法思维:大经典排序学习矩

引言 在现代软件开发中,性能始终是衡量应用质量的重要指标之一。无论是企业级应用、云服务还是桌面程序,性能优化都能显著提升用户体验、降低基础设施成本并增强系统的可扩展性。对于使用 C# 开发的应用程序而言,性能优化涉及多个层面&#x…...

cfn-lint社区生态建设:参与贡献与获取支持的完整指南

cfn-lint社区生态建设:参与贡献与获取支持的完整指南 【免费下载链接】cfn-lint CloudFormation Linter 项目地址: https://gitcode.com/gh_mirrors/cf/cfn-lint cfn-lint 作为 AWS CloudFormation 模板的权威验证工具,拥有一个活跃的开源社区生态…...

开源项目合规性警示:从PyWxDump案例看技术工具的法律边界

开源项目合规性警示:从PyWxDump案例看技术工具的法律边界 【免费下载链接】PyWxDump 删库 项目地址: https://gitcode.com/GitHub_Trending/py/PyWxDump 在开源技术快速发展的今天,开发者常常面临技术实现与法律合规的平衡难题。近期,…...

3种方法如何解决Balena Etcher在Arch Linux上的安装难题

3种方法如何解决Balena Etcher在Arch Linux上的安装难题 【免费下载链接】etcher Flash OS images to SD cards & USB drives, safely and easily. 项目地址: https://gitcode.com/GitHub_Trending/et/etcher 问题诊断:为什么Arch Linux安装Etcher总是失…...

安卓手机免root玩转青龙面板:Alpine Term+Docker全流程指南(附SSH配置技巧)

安卓手机免root玩转青龙面板:Alpine TermDocker全流程指南(附SSH配置技巧) 在移动设备上搭建自动化工具链正成为技术爱好者的新趋势。想象一下,在通勤路上用手机就能管理定时任务、处理数据爬取或自动签到——这并非遥不可及的幻想…...

PySide6零基础实战指南:从环境搭建到首个GUI应用开发

1. PySide6开发环境搭建全攻略 第一次接触GUI开发的朋友可能会觉得配置环境很复杂,其实只要跟着步骤一步步来,半小时内就能搞定。我刚开始用PySide6时也踩过不少坑,这里把最稳妥的安装方法分享给大家。 1.1 Python安装避坑指南 Python是PySid…...