当前位置: 首页 > article >正文

从实践中提炼的架构设计与工程规范

前端开发工程师、技术日更博主、已过CET6 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》、《前端求职突破计划》蓝桥云课签约作者、上架课程《Vue.js 和 Egg.js 开发企业级健康管理项目》、《带你从入门到实战全面掌握 uni-app》文章目录一、架构设计核心原则实战版二、标准分层架构企业通用三、工程规范直接进团队文档1API 规范2Prompt 规范3RAG 规范4部署规范5安全规范6成本规范7日志规范四、上线前必做检查防崩清单五、一句话总结最精髓一、架构设计核心原则实战版统一入口不裸调模型所有业务 → 网关层 → 模型服务绝不前端直连第三方API。能规则就规则能检索就检索最后才大模型查询、计算、固定流程 → 用代码/数据库知识问答 → RAG自然语言生成 → 大模型模型与业务解耦今天用GPT明天换文心/通义/Llama业务代码不动。必须有缓存、限流、降级缓存扛重复请求限流防账单爆炸降级保证服务不死。输入必校验输出必审核输入防注入、防恶意prompt输出防幻觉、违规、越权。流式优先异步兜底对话用stream长任务用异步不阻塞、体验好。多模型路由动态选择简单问题小模型复杂问题强模型敏感问题本地模型。一切可观测日志、埋点、监控调用量、耗时、token、成本、错误率、幻觉率全都要看得见。二、标准分层架构企业通用接入层鉴权、限流、流量管控、协议统一业务层意图识别、状态管理、流程控制、工具调用能力层RAG检索、函数调用、插件系统、多模态模型调度层路由、熔断、重试、负载均衡模型适配层统一封装OpenAI/文心/通义/Claude/本地模型护栏层敏感词、越权行为、违规输出、事实校验日志与治理层审计、成本、质量、复盘三、工程规范直接进团队文档1API 规范统一使用类 OpenAI 格式/v1/chat/completions必传参数request_id、user_id、scene、stream统一返回结构code、data、message、usage2Prompt 规范固定结构角色 约束 资料 格式 示例禁止超长prompt必须走RAG禁止动态拼接用户输入无过滤温度 factual0.10.3创意0.40.73RAG 规范文档分段200~500 token召回数量3~8段召回策略向量 关键词混合必加引用来源减少幻觉4部署规范模型服务容器化Docker外网模型走代理统一出口IP白名单流式返回用SSE不轮询量化优先INT4/INT8降低显存5安全规范用户输入过滤对抗指令、敏感词、越权请求输出审核违规、极限词、越权承诺关键业务必须人工审核绝不把业务数据、隐私数据传入公网模型6成本规范相同请求必须缓存历史对话自动截断简单请求强制走低成本模型每日/每月额度硬限制7日志规范必记录输入、输出、耗时、token、场景、模型不记录敏感信息手机号、身份证、密钥全链路可追踪四、上线前必做检查防崩清单超时设置重试机制熔断降级缓存策略额度限制敏感词过滤输出审核转人工兜底全链路日志监控告警五、一句话总结最精髓大模型应用要做好就三件事架构分层解耦工程规范稳定安全护栏兜底。

相关文章:

从实践中提炼的架构设计与工程规范

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》、《前端求职突破计划》 🍚 蓝桥云课签约作者、…...

告别Diskpart恐惧症:手把手教你用命令行安全合并U盘分区(附完整命令清单)

命令行艺术:彻底掌握Diskpart合并U盘分区的底层逻辑 你是否遇到过这样的场景——插入U盘后系统提示需要格式化,打开磁盘管理工具却发现原本单一的存储空间被分割成多个陌生分区?这种"分区幽灵"现象往往让普通用户手足无措&#xff…...

从Vaadin 14到Vaadin 24的迁移:解决内存泄漏问题

引言 在现代Web应用开发中,迁移到新的版本是常见的需求。最近,我们将一个基于Spring Boot的Vaadin应用从版本14升级到了版本24,同时也保留了之前使用的Keycloak和OAuth2登录功能。然而,在这个迁移过程中,我们遇到了一个令人头疼的问题——内存泄漏。特别是在应用程序启动…...

3分钟快速上手:DamaiHelper大麦网抢票脚本完整指南

3分钟快速上手:DamaiHelper大麦网抢票脚本完整指南 【免费下载链接】DamaiHelper 大麦网演唱会演出抢票脚本。 项目地址: https://gitcode.com/gh_mirrors/dama/DamaiHelper 想要告别演唱会陪跑,轻松抢到心仪的门票吗?DamaiHelper大麦…...

终极PC多人游戏解决方案:Nucleus Co-Op分屏工具完全指南

终极PC多人游戏解决方案:Nucleus Co-Op分屏工具完全指南 【免费下载链接】nucleuscoop Starts multiple instances of a game for split-screen multiplayer gaming! 项目地址: https://gitcode.com/gh_mirrors/nu/nucleuscoop 你是否曾梦想过与好友在同一台…...

如何在 MATLAB 中调用 Taotoken 聚合的大模型 API 接口

如何在 MATLAB 中调用 Taotoken 聚合的大模型 API 接口 1. 准备工作 在 MATLAB 中调用 Taotoken 的大模型 API 接口前,需要确保具备以下条件: 有效的 Taotoken API Key,可在 Taotoken 控制台中创建。目标模型 ID,可在 Taotoken…...

解决iOS Safari上的SVG动画问题

引言 在移动设备上实现交互式SVG动画时,常常会遇到一些特定的挑战,尤其是对于iOS的Safari浏览器。本文将探讨如何解决在iOS Safari中SVG元素点击时无法触发淡入动画的问题,并提供一个实用的JavaScript解决方案。 背景介绍 最近我遇到一个问题,当在iOS Safari中点击SVG元…...

2025终极解决方案:八大网盘直链下载助手完整使用指南

2025终极解决方案:八大网盘直链下载助手完整使用指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云…...

深度解构:如何基于PX4-Autopilot构建高性能无人机控制系统

深度解构:如何基于PX4-Autopilot构建高性能无人机控制系统 【免费下载链接】PX4-Autopilot PX4 Autopilot Software 项目地址: https://gitcode.com/gh_mirrors/px/PX4-Autopilot 在无人机系统开发中,实时性、可靠性和扩展性一直是开发团队面临的…...

基于容器与Seccomp的代码沙盒安全实践:以dify-sandbox为例

1. 项目概述:构建一个安全的代码沙盒环境在构建一个多租户的AI应用平台或在线代码评测系统时,一个核心且棘手的问题是如何安全地执行用户提交的、不可信的代码。直接在生产服务器上运行这些代码无异于敞开大门,恶意代码可以轻易地耗尽系统资源…...

开发者如何利用 Taotoken 快速切换模型以应对不同场景需求

开发者如何利用 Taotoken 快速切换模型以应对不同场景需求 1. 多模型统一接入的价值 在构建多功能 AI 应用时,开发者常面临模型选型与接入的复杂性。不同场景对模型能力的需求各异:对话交互可能需要更强的上下文理解,代码生成需要编程语言的…...

初次使用 Taotoken 模型广场进行模型选型与对比的体验

初次使用 Taotoken 模型广场进行模型选型与对比的体验 1. 模型广场概览 登录 Taotoken 控制台后,左侧导航栏的"模型广场"入口非常醒目。页面加载后,首先看到的是按热门程度排序的模型列表,每个卡片展示了模型名称、提供商、简要描…...

正点原子IMX6ULL SR04模块+Qt使用

本篇文章用于记录在使用正点原子开发板进行自主开发时使用SR04模块完成倒车雷达辅助功能遇到的问题及延伸问题,文章重点在于记录!问题还待解决问题背景:想要实现sr04的模块驱动且配合Qt应用程序完成倒车雷达辅助功能但是在过程中发现 1.当前系…...

保姆级避坑指南:用PX4 v1.12.3 + Gazebo搞定Offboard模式,解决‘Vehicle armed’失败问题

PX4 v1.12.3与Gazebo仿真环境深度调优:从Offboard模式解锁到轨迹飞行的全流程实战 去年夏天,当我第一次尝试用PX4的Offboard模式控制Gazebo中的无人机时,遇到了一个令人抓狂的问题——终端不断显示"Offboard enabled",但…...

ai赋能:让快马智能生成虚拟化环境配置方案

最近在折腾虚拟化环境配置时,发现每次手动设置VMware虚拟机参数特别耗时。特别是需要反复创建不同用途的测试环境时,光是调整内存、磁盘这些基础配置就要花半天时间。后来尝试用InsCode(快马)平台的AI辅助功能,意外发现能大幅简化这个流程。 …...

告别复制粘贴!用CAPL脚本在CANoe里实现自动化测试(附完整代码示例)

告别复制粘贴!用CAPL脚本在CANoe里实现自动化测试(附完整代码示例) 在汽车电子测试领域,重复性工作往往占据了工程师大量时间。想象一下这样的场景:每天需要手动发送相同的CAN报文序列,记录ECU响应&#xf…...

实战应用:从需求到成品,用快马开发并部署win11桌面图标管理软件

今天想和大家分享一个实用小工具的完整开发过程——Windows 11桌面图标管理软件。起因是我发现很多朋友升级Win11后找不到"我的电脑"图标,网上教程又分散,于是决定做个一站式解决方案。 需求分析与功能设计 这个工具主要解决三个痛点&#xf…...

STM32H750内存不够用?实战修改CubeIDE链接脚本,把代码塞进ITCM/DTCM提速

STM32H750内存优化实战:巧用ITCM/DTCM提升关键代码性能 当你的STM32H750项目因为内存不足而频繁崩溃,或是关键函数执行速度拖累整体性能时,你可能已经触碰到这颗高性能MCU的潜力边界。但别急着换芯片——通过精心调整链接脚本,我们…...

微信聊天记录如何永久保存?这款开源工具让你的数字记忆不再丢失

微信聊天记录如何永久保存?这款开源工具让你的数字记忆不再丢失 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending…...

鸣潮智能自动化助手ok-ww:告别重复劳动,重拾游戏乐趣

鸣潮智能自动化助手ok-ww:告别重复劳动,重拾游戏乐趣 【免费下载链接】ok-wuthering-waves 鸣潮 后台自动战斗 自动刷声骸 一键日常 Automation for Wuthering Waves 项目地址: https://gitcode.com/GitHub_Trending/ok/ok-wuthering-waves 你是否…...

TMS320F28xxx开发踩坑记:手把手教你解决#10099-D内存溢出报错(附链接器脚本修改)

TMS320F28xxx开发实战:深度解析#10099-D内存溢出与链接器脚本优化 深夜的实验室里,CCS编译器的报错提示格外刺眼——"#10099-D program will not fit into available memory"。这个看似简单的内存溢出错误,背后却隐藏着DSP开发中最…...

Marp终极指南:5分钟学会用Markdown制作专业PPT

Marp终极指南:5分钟学会用Markdown制作专业PPT 【免费下载链接】marp The entrance repository of Markdown presentation ecosystem 项目地址: https://gitcode.com/gh_mirrors/mar/marp 你是否厌倦了复杂的PPT软件,想要一种更高效的方式来创建演…...

娱乐圈天降紫微星不靠捧,海棠山铁哥复刻历史帝王草根崛起

内娱最荒谬的乱象把“资本强捧”当成“天降紫微星”的捷径。01|捷径假星资本三板斧流量三板斧经纪公司砸钱平台热搜锁定金主爸爸背书饭圈控评洗版大制作资源投喂营销号统一话术 只要吹捧到位、资源喂够,就能掩盖实力匮乏与格局缺失? —— 他们…...

Node.js京东自动下单工具完整指南:告别手动抢购烦恼

Node.js京东自动下单工具完整指南:告别手动抢购烦恼 【免费下载链接】jd-happy [DEPRECATED]Node 爬虫,监控京东商品到货,并实现下单服务 项目地址: https://gitcode.com/gh_mirrors/jd/jd-happy 还在为京东热门商品秒光而烦恼吗&…...

B企业电商物流中心仓库布局和货位SLP方法【附代码】

✨ 本团队擅长数据搜集与处理、建模仿真、程序设计、仿真代码、EI、SCI写作与指导,毕业论文、期刊论文经验交流。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流,查看文章底部二维码(1)基于改进SLP与SHA的多目标布局优化模型&#xff1a…...

三步掌握PPTist:5大场景教你打造专业在线演示文稿

三步掌握PPTist:5大场景教你打造专业在线演示文稿 【免费下载链接】PPTist PowerPoint-ist(/pauəpɔintist/), An online presentation application that replicates most of the commonly used features of MS PowerPoint, allowing for th…...

3个技巧让网盘文件下载速度提升5倍:LinkSwift直链解析工具深度解析

3个技巧让网盘文件下载速度提升5倍:LinkSwift直链解析工具深度解析 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动…...

如何实现企业微信多渠道消息推送:开源工具完整指南

如何实现企业微信多渠道消息推送:开源工具完整指南 【免费下载链接】wecomchan 微信推送服务Server酱的开源替代。通过企业微信向微信推送消息的配置文档、直推函数和可自行搭建的在线服务代码。 项目地址: https://gitcode.com/gh_mirrors/we/wecomchan 企…...

PyTorch基于 GRU+ KAN(Kolmogorov-Arnold Network)的时间序列预测模型

一、研究背景 时间序列预测(如风电场功率、电力负荷)对能源调度与安全至关重要。传统 GRU 虽能捕获时序依赖,但全连接输出层对复杂非线性映射能力有限。KAN(Kolmogorov-Arnold Networks)以可学习的样条函数替代固定激活函数,具备更强的非线性拟合能力和可解释性。本代码…...

STL分解结果怎么看?从残差分布到趋势强度,教你像专家一样评估时间序列模型

STL分解结果深度诊断指南:从残差分析到业务洞察 当你第一次看到STL分解输出的趋势、季节性和残差三个分量时,可能会感到困惑——这些线条和数字背后到底隐藏着什么信息?本文将带你超越基础代码运行,掌握专家级的诊断方法&#xff…...