当前位置: 首页 > article >正文

如何快速实现Contoso Chat数据导出:从Cosmos DB到Blob Storage的完整指南

如何快速实现Contoso Chat数据导出从Cosmos DB到Blob Storage的完整指南【免费下载链接】contoso-chat项目地址: https://gitcode.com/GitHub_Trending/co/contoso-chatContoso Chat是一款基于Azure云服务构建的智能聊天应用集成了强大的RAG检索增强生成功能和企业级数据管理能力。本文将详细介绍如何使用Contoso Chat提供的工具实现从Cosmos DB到Blob Storage的高效数据导出帮助企业轻松管理和迁移关键业务数据。Contoso Chat数据架构概览 Contoso Chat采用现代化的云原生架构其中Cosmos DB作为核心数据存储负责管理客户信息、对话历史等关键业务数据。下图展示了Contoso Chat零售版的完整架构其中Cosmos DB位于数据处理层的核心位置该架构通过Azure Container Apps (ACA)实现弹性扩展结合Azure Open AI Services提供智能对话能力而Cosmos DB则提供全球分布式的数据存储支持确保数据的高可用性和低延迟访问。为什么需要数据导出工具在实际业务场景中数据导出是企业数据管理的重要环节数据备份定期将Cosmos DB数据导出到Blob Storage确保数据安全数据分析将数据导出到Blob Storage后可方便地与Azure Data Lake、Power BI等服务集成进行深度分析合规要求满足行业合规标准实现数据长期归档多系统集成为其他业务系统提供数据接口Contoso Chat项目中提供了完整的数据管理工具链包括位于data/customer_info/create-cosmos-db.ipynb的Jupyter Notebook脚本可用于Cosmos DB的初始化和数据操作。数据导出的核心流程 Contoso Chat的数据导出流程基于RAG设计模式确保数据在导出过程中保持结构完整性和业务关联性。下图展示了RAG架构中的数据处理流程从Cosmos DB到Blob Storage的数据导出主要包含以下步骤使用Cosmos DB SDK连接数据库执行查询获取需要导出的数据将数据转换为标准格式如JSON、CSV通过Azure Blob Storage SDK上传数据验证导出结果并记录日志实现步骤从Cosmos DB导出数据1. 准备工作环境首先确保已安装必要的依赖包Contoso Chat项目的依赖配置文件位于src/api/requirements.txt其中包含了Azure Cosmos DB和Blob Storage的Python SDK。2. 连接Cosmos DB数据库使用以下代码片段连接到Cosmos DB来自create-cosmos-db.ipynbfrom azure.cosmos import CosmosClient from azure.identity import DefaultAzureCredential import os from dotenv import load_dotenv load_dotenv() COSMOS_ENDPOINT os.environ[COSMOS_ENDPOINT] client CosmosClient(COSMOS_ENDPOINT, credentialDefaultAzureCredential()) DATABASE_NAME contoso-outdoor CONTAINER_NAME customers database client.get_database_client(DATABASE_NAME) container database.get_container_client(CONTAINER_NAME)3. 执行数据查询与导出可以使用Contoso Chat提供的工具类或参考以下代码实现数据导出import json import azure.storage.blob as blob_service # 初始化Blob Storage客户端 blob_service_client blob_service.BlobServiceClient.from_connection_string(os.environ[BLOB_CONNECTION_STRING]) container_client blob_service_client.get_container_client(exported-data) # 查询需要导出的数据 query SELECT * FROM c WHERE c.last_updated last_export_date items list(container.query_items( queryquery, parameters[ {name: last_export_date, value: 2023-01-01T00:00:00Z} ], enable_cross_partition_queryTrue )) # 导出数据到Blob Storage blob_client container_client.get_blob_client(fcosmos-export-{datetime.now().strftime(%Y%m%d)}.json) blob_client.upload_blob(json.dumps(items), overwriteTrue)自动化数据导出与管理Contoso Chat遵循现代AI应用的开发流程建议将数据导出任务集成到CI/CD pipeline中实现定期自动导出。下图展示了Gen AI应用的典型开发运维流程通过Azure Automation或Azure Functions可以设置定时触发的数据导出任务确保数据的持续同步和备份。相关的自动化脚本可存储在src/api/目录下与其他业务逻辑代码统一管理。常见问题与解决方案数据导出性能优化批量处理对于大量数据建议使用分页查询和批量上传索引优化确保Cosmos DB集合上创建了适当的索引异步处理使用异步API提高导出效率数据一致性保障事务处理对于关键数据实现事务性导出校验机制导出后验证数据完整性错误重试实现失败自动重试逻辑总结Contoso Chat提供了强大的数据管理能力通过本文介绍的方法您可以轻松实现从Cosmos DB到Blob Storage的数据导出。无论是为了数据备份、合规要求还是数据分析这套工具链都能满足企业级应用的需求。通过结合data/customer_info/create-cosmos-db.ipynb提供的数据库操作基础以及Azure云服务的弹性扩展能力Contoso Chat为企业数据管理提供了完整的解决方案。如需了解更多细节请参考项目中的官方文档和示例代码开始您的高效数据管理之旅【免费下载链接】contoso-chat项目地址: https://gitcode.com/GitHub_Trending/co/contoso-chat创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

如何快速实现Contoso Chat数据导出:从Cosmos DB到Blob Storage的完整指南

如何快速实现Contoso Chat数据导出:从Cosmos DB到Blob Storage的完整指南 【免费下载链接】contoso-chat 项目地址: https://gitcode.com/GitHub_Trending/co/contoso-chat Contoso Chat是一款基于Azure云服务构建的智能聊天应用,集成了强大的RA…...

CMake II 进阶单元测试:从基础配置到多场景验证

1. CMake单元测试进阶配置实战 刚接触CMake单元测试时,我们可能只满足于让测试跑起来。但随着项目复杂度提升,你会发现基础配置远远不够。比如在多配置环境下,Debug版本的测试用例可能在Release模式下失效;大型项目中测试文件分散…...

革新性规范驱动开发:Spec Kit与uv工具链的深度整合实践

革新性规范驱动开发:Spec Kit与uv工具链的深度整合实践 【免费下载链接】spec-kit 💫 Toolkit to help you get started with Spec-Driven Development 项目地址: https://gitcode.com/gh_mirrors/sp/spec-kit [核心价值]:规范如何成为…...

AI智能二维码工坊一文详解:OpenCV视觉库集成技术解析

AI智能二维码工坊一文详解:OpenCV视觉库集成技术解析 二维码,这个黑白相间的小方块,已经渗透到我们生活的方方面面。从扫码支付到添加好友,从产品溯源到活动签到,它无处不在。但你是否想过,这些二维码是如…...

SDMatte镜像安全加固:SELinux策略+只读文件系统+最小权限原则

SDMatte镜像安全加固:SELinux策略只读文件系统最小权限原则 1. 镜像安全加固概述 SDMatte是一款面向高质量图像抠图场景的AI模型,在处理主体分离、透明物体提取、边缘精修等任务时表现出色。随着AI模型在生产环境中的广泛应用,镜像安全加固…...

终极键盘自定义指南:使用SharpKeys轻松重映射Windows键盘按键

终极键盘自定义指南:使用SharpKeys轻松重映射Windows键盘按键 【免费下载链接】sharpkeys SharpKeys is a utility that manages a Registry key that allows Windows to remap one key to any other key. 项目地址: https://gitcode.com/gh_mirrors/sh/sharpkeys…...

Spring_couplet_generation 自动化运维脚本:使用Python进行服务健康检查与日志清理

Spring_couplet_generation 自动化运维脚本:使用Python进行服务健康检查与日志清理 1. 引言 想象一下这个场景:你花了不少功夫,终于把那个能自动生成对联的AI服务——Spring_couplet_generation,部署到了服务器上。刚开始几天&a…...

Topgrade社区分支对比:如何选择最适合的版本继续使用

Topgrade社区分支对比:如何选择最适合的版本继续使用 【免费下载链接】topgrade Upgrade everything 项目地址: https://gitcode.com/gh_mirrors/to/topgrade Topgrade是一款强大的系统升级工具,能够自动检测并更新您系统中所有的软件包管理器。这…...

单片机与手机远距离通信技术方案对比

单片机与手机远距离通信技术方案解析1. 通信技术方案概述现代嵌入式系统中,单片机与移动设备之间的通信需求日益增长。根据通信距离和应用场景的不同,主要存在三种主流技术方案:WiFi通信蓝牙通信4G/移动通信其中蓝牙通信由于传输距离限制&…...

3大核心优势解析:为什么选择wvp-GB28181-pro构建企业级视频监控系统

3大核心优势解析:为什么选择wvp-GB28181-pro构建企业级视频监控系统 【免费下载链接】wvp-GB28181-pro 项目地址: https://gitcode.com/GitHub_Trending/wv/wvp-GB28181-pro 想要快速搭建一个符合国标GB28181标准的专业视频监控平台吗?wvp-GB281…...

Faiss与Milvus实战对比:如何根据项目需求选择最适合的向量数据库?

Faiss与Milvus技术选型实战指南:从原理到落地的深度解析 当推荐系统的召回阶段需要处理千万级用户画像,当电商平台要实时搜索相似商品图片,开发者总会面临同一个核心问题:如何选择最适合业务场景的向量数据库?作为AI基…...

AI大厂疯抢文科生!月薪3万争抢写作、编剧人才,文科生逆袭时代来了?

3月17日,AI大厂月薪3万疯抢文科生的话题冲上热搜。据媒体报道,不久前,360创始人周鸿祎在接受采访时抛出一个惊人观点:随着AI技术的发展,文科生将比理科生更吃香。 在他看来,AI的快速迭代不仅催生出大量需要…...

智能客服系统升级:基于Gemma-3-12B-IT API的自动回复实现

智能客服系统升级:基于Gemma-3-12B-IT API的自动回复实现 1. 引言:客服系统的智能化转型 传统客服系统面临三大痛点:人力成本高、响应速度慢、服务质量不稳定。想象一下这样的场景:深夜11点,一位顾客咨询产品售后问题…...

终极指南:Webgrind与主流IDE集成的简单方法(VSCode、TextMate等)

终极指南:Webgrind与主流IDE集成的简单方法(VSCode、TextMate等) 【免费下载链接】webgrind Xdebug Profiling Web Frontend in PHP 项目地址: https://gitcode.com/gh_mirrors/we/webgrind Webgrind作为一款强大的Xdebug Profiling W…...

Pixel Mind Decoder 一键部署教程:基于Dify快速构建情绪分析应用

Pixel Mind Decoder 一键部署教程:基于Dify快速构建情绪分析应用 1. 开篇:为什么选择这个方案 情绪识别正在成为各类应用的标配能力,但传统方案往往面临两个难题:要么需要复杂的模型训练流程,要么调用商业API成本太高…...

DeepSeek-OCR-2显存优化技巧:量化加载+PagedAttention降低GPU占用50%

DeepSeek-OCR-2显存优化技巧:量化加载PagedAttention降低GPU占用50% 你是不是也遇到过这样的问题:想在本地跑DeepSeek-OCR-2做文档识别,结果刚加载模型就爆显存?4GB显存不够,8GB卡也卡顿,16GB才勉强能动—…...

7步打造AI自主操作电脑:Open Computer Use颠覆传统人机交互实战指南

7步打造AI自主操作电脑:Open Computer Use颠覆传统人机交互实战指南 【免费下载链接】open-computer-use Secure AI computer use powered by E2B Desktop Sandbox 项目地址: https://gitcode.com/gh_mirrors/op/open-computer-use 副标题:你的AI…...

告别手动按键!JX3Toy自动化宏工具让你的游戏体验飞升

告别手动按键!JX3Toy自动化宏工具让你的游戏体验飞升 【免费下载链接】JX3Toy 一个自动化测试DPS的小工具 项目地址: https://gitcode.com/GitHub_Trending/jx/JX3Toy 还在为剑网3复杂的技能循环头疼吗?每次副本输出都要盯着技能栏,手…...

React Grab元素抓取:前端开发提效指南

React Grab元素抓取:前端开发提效指南 【免费下载链接】react-grab Grab any element on in your app and give it to Cursor, Claude Code, etc 项目地址: https://gitcode.com/GitHub_Trending/re/react-grab 作为前端开发者,你是否曾为获取页面…...

别再手动编译WASM了!这5个自动化工具让Python→WASM编译效率提升11倍(含Docker镜像+VS Code插件)

第一章:Python→WASM编译自动化革命:为什么手动编译已成历史曾经,将 Python 代码编译为 WebAssembly(WASM)需手动配置 Emscripten、交叉编译 CPython 子集、处理内存模型差异、修补 ABI 不兼容问题,并反复调…...

从printf到硬件调试:用Keil+ST-Link快速定位STM32外设异常(以GPIO/SPI为例)

从printf到硬件调试:用KeilST-Link快速定位STM32外设异常(以GPIO/SPI为例) 在嵌入式开发中,调试是定位问题的关键环节。许多开发者习惯使用printf输出调试信息,这种方式简单直接,但对于复杂的硬件交互问题…...

为什么有的项目质量好,有的项目质量差?

哈喽,我是小乔,一个在软件项目里摸爬滚打了十五年的老测试。这些年,我见过产品上线后锣鼓喧天、用户好评如潮的“明星项目”,也经历过半夜被报警电话叫醒、顶着黑眼圈抢救数据的“火葬场项目”。 不知道你们有没有过这种困惑&…...

【AD24规则冲突解析】从Width Constraint报错看PCB设计中的规则优先级与冲突解决

1. 从报错现象看PCB设计规则体系 当你看到AD24弹出"Width Constraint: Track (5025mil,3895mil)(5171.57mil,3748.43mil) on Top Layer"这样的报错时,这不仅仅是简单的线宽设置问题,而是整个PCB设计规则体系在向你发出警报。我处理过上百个类似…...

【CMU 15-445】Extendible Hash Table 实现精讲:从位运算到并发测试

1. 可扩展哈希表的前世今生 第一次接触可扩展哈希表是在CMU 15-445的课程项目里,当时对着Project1的需求文档发呆了半小时——这个看似普通的哈希表实现起来处处是坑。传统哈希表在数据量激增时需要全量rehash,而可扩展哈希表通过巧妙的位运算和分层设计…...

Ink/Stitch 免费刺绣插件:从零到专业的机器刺绣设计完整指南

Ink/Stitch 免费刺绣插件:从零到专业的机器刺绣设计完整指南 【免费下载链接】inkstitch Ink/Stitch: an Inkscape extension for machine embroidery design 项目地址: https://gitcode.com/gh_mirrors/in/inkstitch Ink/Stitch 是一款强大的开源机器刺绣设…...

Actor-Critic算法实战:用PyTorch实现CartPole平衡(附完整代码)

Actor-Critic算法实战:用PyTorch实现CartPole平衡(附完整代码) 在强化学习领域,Actor-Critic算法因其独特的架构设计而备受关注。它巧妙地将策略梯度方法与值函数估计相结合,既避免了纯策略梯度方法的高方差问题&#…...

【03 Maven生命周期和插件】

九月九日忆山东兄弟何为生命周期生命周期详解clean生命周期deault生命周期site生命周期命令行与生命周期插件内置插件自定义插件绑定插件配置插件解析笔记王维独在异乡为异客,每逢佳节倍思亲。 遥知兄弟登高处,遍插茱萸少一人。 除了坐标、依赖以及仓库…...

霜儿-汉服-造相Z-Turbo与目标检测联动:YOLOv8辅助生成图像质量评估

霜儿-汉服-造相Z-Turbo与目标检测联动:YOLOv8辅助生成图像质量评估 1. 引言 如果你是做汉服内容的设计师或创作者,大概都遇到过这样的烦恼:用AI生成了一批汉服人物图,结果发现有些图里人物缺胳膊少腿,或者衣袖、裙摆…...

k3s生产环境避坑指南:Traefik Ingress配置常见问题与解决方案

k3s生产环境避坑指南:Traefik Ingress配置常见问题与解决方案 引言:为什么你的k3s应用总是访问失败? 凌晨三点,运维工程师小李的手机突然响起——生产环境的订单服务又无法访问了。他揉了揉眼睛,打开电脑检查k3s集群状…...

影墨·今颜小红书模型赋能微信小程序:AI文案助手开发实战

影墨今颜小红书模型赋能微信小程序:AI文案助手开发实战 最近在刷朋友圈,看到好几个做电商、做内容的朋友都在抱怨,每天想文案想得头秃。特别是小红书那种既要种草感、又要生活气、还得带点网感的文案,写起来特别费劲。正好&#…...