当前位置: 首页 > article >正文

RAG 还是 Lucene:私有化部署客服系统的 AI 知识库架构选型偌

在之前的文章中我们花了大量的篇幅从记录后端pod真实ip开始说起然后引入envoy再解决了各种各样的需求配置自动重载、流量劫持、sidecar自动注入到envoy的各种能力熔断、流控、分流、透明代理、可观测性等等已经可以支撑起一个完整的服务治理框架了而今天介绍的istio正是前面提到的这些所有功能的集大成者从本文开始我们将详细介绍istio并且与之前手搓的功能做一个详细的对比为大家以后选择服务治理的某个功能提供参考istio架构┌──────────────┐│ istiod │ ← 控制面│ (PilotCA) │└──────┬───────┘│ xDS (gRPC / TLS)│┌────────────┐ │ ┌────────────┐│ Envoy │?───┼───?│ Envoy │ ← 数据面│ (Sidecar) │ │ (Sidecar) │└─────▲──────┘ └─────▲──────┘│ iptables ││ │App Pod App Pod数据面就是之前一直在研究的envoy包括4/7代理、熔断、限流、可观测性等等envoy就是执行由控制面下发的配置控制面istiod主要的职责将配置下发到每一个envoy去。由于istio中配置以crd的形式成为了k8s的资源所以要不断的监听k8s apiserver将资源的变化翻译成envoy看得懂的配置并且下发到envoy去至于其余istio的资源我们后面详细介绍istio安装不说废话先把istio安装上去再说首先准备好k8s集群其次下载istio这一步有可能需要上网curl -L https://istio.io/downloadIstio | sh -cd istio-*sudo ln -s $PWD/istioctl /usr/local/bin/istioctl验证兼容性istioctl x precheck开始安装istioctl install --set profiledefault -y由于镜像仓库没法直接使用所以需要一些特殊的方法具体可以看这篇文章 快速拉取docker镜像需要的镜像有docker.io/istio/pilot:1.28.2docker.io/istio/proxyv2:1.28.2安装完成? kubectl -n istio-system get podNAME READY STATUS RESTARTS AGEistio-ingressgateway-865c448856-qs8s2 1/1 Running 0 8sistiod-86c75775bb-j7qbg 1/1 Running 0 12s安装完成要从哪儿开始呢istio的自动注入kubectl label namespace default istio-injectionenabled同之前envoy一样给namespace打上标签之后重启服务即可kubectl rollout restart deploy nginx-test重启之后sidecar已经注入进去了我们来观察一下istio注入到底做了什么事情先describe看看eventsEvents:Type Reason Age From Message---- ------ ---- ---- -------Normal Scheduled 8s default-scheduler Successfully assigned default/nginx-test-6f855b9bb9-9phsv to wilsonNormal Pulled 8s kubelet Container image docker.io/istio/proxyv2:1.28.2 already present on machineNormal Created 8s kubelet Created container: istio-initNormal Started 8s kubelet Started container istio-initNormal Pulled 8s kubelet Container image docker.io/istio/proxyv2:1.28.2 already present on machineNormal Created 8s kubelet Created container: istio-proxyNormal Started 8s kubelet Started container istio-proxyNormal Pulled 6s kubelet Container image registry.cn-beijing.aliyuncs.com/wilsonchai/nginx:latest already present on machineNormal Created 6s kubelet Created container: nginx-testNormal Started 5s kubelet Started container nginx-test1个initContainer1个业务container和1个sidecar其中initContainerInit Containers:istio-init:Container ID: containerd://2bf56cd37703d82a2a43e94e8c8d683ed66b0afe22bf7148a597d67b89a727a8Image: docker.io/istio/proxyv2:1.28.2Image ID: docker.m.daocloud.io/istio/proxyv2sha256:39065152d6bd3e7fbf6bb04be43c7a8bbd16b5c7181c84e3d78fa164a945ae7fPort:Host Port:Args:istio-iptables-p15001-z15006-u1337-mREDIRECT-i*-x-b*-d15090,15021,15020--log_output_leveldefault:info...和之前envoy中劫持流量的做法一样istio依然是使用iptables将端口流量导入到代理之中处理尝试访问一下? curl 10.22.12.178:30785/testi am backend in backend-6d76f54494-g6srz成功再次查看istio-proxy日志。空的为了调试方便将其打开并且输出至控制台kubectl -n istio-system edit cm istioapiVersion: v1data:mesh: |-accessLogFile: /dev/stdout...至此istio的第一个功能探索完毕自动注入sidecar container并且完成了流量劫持Upgrade Required 426 的问题当前的架构是左图现在要前进到右图watermarked-istio_1其实就是在backend注入istio-proxy直接重启就好? kubectl get pod -owideNAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATESbackend-5d4d7b598c-f7852 2/2 Running 0 13s 10.244.0.49 wilsonnginx-test-6f855b9bb9-9phsv 2/2 Running 0 58m 10.244.0.48 wilson注入完成测试一下? curl 10.22.12.178:30785/testUpgrade Required? kubectl logs -f -l appnginx-test -c istio-proxy[2026-01-26T07:54:42.977Z] GET /test HTTP/1.1 426 - upstream10.244.0.48:80 duration6ms routedefault[2026-01-26T07:54:42.978Z] - - - 0 - upstream10.105.148.194:10000 duration9ms route-在nginx注入istio-proxybackend没有注入的时候并没有报错。而一旦nginx与backend都注入的时候就会出现Upgrade Required (426)错误Nginx Sidecar 发现目标Backend是一个纯文本服务它会回退到“透明代理”模式简单地把 Nginx 发出的流量透传出去Nginx Sidecar 发现目标也有 Sidecar它会尝试建立一个高度优化的、基于 mTLS 的隧道关于mTLS后面会详细介绍。如果此时 Nginx 发出的请求头比如缺少 Host 字段或者使用了 HTTP/1.0不符合 Envoy 对这种隧道协议的预期Envoy 可能会向 Nginx 发送一个特殊的响应或者 Nginx 在尝试通过这种隧道通信时因为某些 Header 冲突如 Connection: close自发产生了 426 错误想要解决这个问题有两种方法改造nginx中加入标记location /test {proxy_http_version 1.1; # 必须添加这一行proxy_set_header Host $host; # 这一行也是必须的proxy_pass http://backend_ups;}Nginx 的 proxy_pass 默认使用 HTTP/1.0。在 Istio 环境中HTTP/1.0 不支持长连接Keep-Alive以及一些现代的协议协商这与 Istio SidecarEnvoy默认的 L7 代理行为冲突Istio 需要 HTTP/1.1 来支持复杂连接管理问题改造backend service如果nginx改造有难度那也可以尝试改造backend-serviceapiVersion: v1kind: Servicemetadata:name: backend-servicenamespace: defaultspec:ports:- name: tcp-80 # 原为 http-80 改为 tcp-80port: 10000protocol: TCPtargetPort: 10000selector:app: backendIstio 只有在识别到流量是 HTTP 时才会进行深度的协议检查和转换。如果你把这个服务声明为 TCPIstio 就会将其视为原始字节流进行透传不再关心它是 HTTP/1.0 还是 1.1。优点就是彻底解决 426 问题无需改 Nginx。缺点则是你会失去 Istio 针对该服务的 HTTP 监控指标如请求数、4xx/5xx 统计、分布式追踪以及基于路径的路由功能http 1.0 与 http 1.1这里再简单介绍一下两个协议版本的区别连接管理最显著的区别HTTP 1.0短连接 (Short-lived)默认情况下客户端每发起一个请求都要与服务器建立一次 TCP 三次握手。请求结束并收到响应后TCP 连接立即关闭。如果页面有 10 张图片浏览器就要建立 10 次 TCP 连接。这带来了极高的延迟和资源开销。HTTP 1.1持久连接 (Persistent Connection / Keep-Alive)。默认开启 Connection: keep-alive。一个 TCP 连接可以被多个请求复用。只有在明确声明 Connection: close 或连接超时后才会关闭。在 Istio 中 Envoy 极度依赖持久连接来维持高性能的 Sidecar 间隧道。HTTP 1.0 的频繁断开会让 Envoy 感到“压力山大”甚至认为这是一种非标准的协议行为。Host HeaderHTTP 1.0人们认为一个 IP 对应一个网站所以请求头里不需要带域名信息。HTTP 1.1随着虚拟主机一个 IP 跑多个网站的流行HTTP 1.1 规定请求头必须包含 Host 字段。在 K8s/Istio 中 Istio 的路由决策、Service 的匹配完全依赖 Host 头。这也是为什么 Nginx 使用 HTTP 1.0 转发时如果不手动补全 Host 头后端往往会返回 404 或协议错误。以上是istio必须要求HTTP 1.1最主要的两个因素当然还有其他非常重要的区别特性 HTTP 1.0 HTTP 1.1连接模型 默认短连接每次请求新开 TCP 默认持久连接 (Keep-Alive)复用 TCPHost 头部 可选 (导致无法支持虚拟主机) 必须 (支持一 IP 多域名)流水线 (Pipelining) 不支持 支持 (但在实际应用中受限)断点续传 不支持 支持 (通过 Range 头部)缓存控制 简单 (Expires) 复杂且强大 (Cache-Control, ETag)默认协议版本 许多旧软件(如 Nginx proxy)的默认值 现代 Web 应用的基石标准小结本章内容算是一个开胃小菜成功安装了istio并且解决了一个非常常见的426问题至于怎么把之前在envoy的那些最佳实践搬迁到istio那就是后面的内容了敬请期待后记如果整个namespace都已经有了注入标签istio-injectionenabled但是某个deployment不想让istio注入kubectl patch deployment nginx -p {spec:{template:{metadata:{annotations:{sidecar.istio.io/inject:false}}}}}坟痛嚷品

相关文章:

RAG 还是 Lucene:私有化部署客服系统的 AI 知识库架构选型偌

在之前的文章中,我们花了大量的篇幅,从记录后端pod真实ip开始说起,然后引入envoy,再解决了各种各样的需求:配置自动重载、流量劫持、sidecar自动注入,到envoy的各种能力:熔断、流控、分流、透明…...

效率倍增:OpenClaw+Phi-3-vision-128k-instruct自动化处理每日重复工作

效率倍增:OpenClawPhi-3-vision-128k-instruct自动化处理每日重复工作 1. 为什么我们需要自动化日常办公 每天早上打开电脑,总有一堆重复性工作等着我:整理邮件、生成报表、写会议纪要。这些工作消耗了我至少2小时的高效时间。直到我尝试用…...

Spring Boot 与 GraalVM 原生镜像 2026:极致性能优化

Spring Boot 与 GraalVM 原生镜像 2026:极致性能优化 今天我们来聊聊 Spring Boot 与 GraalVM 原生镜像,这是实现 Java 应用极致性能优化的重要技术。 一、什么是 GraalVM 原生镜像 GraalVM 原生镜像(Native Image)是一种提前编译…...

Applite终极指南:macOS上最简单免费的Homebrew Cask图形化管理工具

Applite终极指南:macOS上最简单免费的Homebrew Cask图形化管理工具 【免费下载链接】Applite User-friendly GUI macOS application for Homebrew Casks 项目地址: https://gitcode.com/gh_mirrors/ap/Applite Applite是一款专为macOS用户设计的开源图形界面…...

嵌入式开发工具链实战指南与效率提升

1. 嵌入式开发工具全景概览在嵌入式系统开发领域,工程师们每天都要面对交叉编译、调试、性能分析等重复性工作。经过十五年的一线开发实践,我整理出一套能显著提升效率的工具组合,这些工具覆盖了从芯片选型到产品发布的完整生命周期。不同于网…...

阻抗匹配原理与工程实践全解析

1. 阻抗匹配基础概念解析阻抗匹配是电子工程中最基础也最容易被忽视的技术要点之一。记得我刚入行时,第一次调试射频电路就栽在这个坑里——信号反射导致系统根本没法正常工作。阻抗匹配的本质,就是让信号源阻抗与负载阻抗达到共轭匹配状态,实…...

STM32智能遥控婴儿车设计与实现

1. 项目概述这个基于STM32的智能遥控婴儿车项目,是我在去年为朋友家新生儿设计的实用型作品。当时朋友抱怨市面上智能婴儿车要么功能单一,要么价格昂贵,于是萌生了DIY一个多功能、低成本解决方案的想法。经过三个月的迭代开发,最终…...

突破VMware限制:解锁macOS虚拟机的实战指南

突破VMware限制:解锁macOS虚拟机的实战指南 【免费下载链接】unlocker VMware Workstation macOS 项目地址: https://gitcode.com/gh_mirrors/unloc/unlocker 在虚拟化技术蓬勃发展的今天,VMware作为行业标杆却对macOS系统支持设置了重重限制。本…...

基于组件化架构的Bilibili-Evolved性能优化实战:实现60fps流畅播放与40%内存占用降低

基于组件化架构的Bilibili-Evolved性能优化实战:实现60fps流畅播放与40%内存占用降低 【免费下载链接】Bilibili-Evolved 强大的哔哩哔哩增强脚本 项目地址: https://gitcode.com/gh_mirrors/bi/Bilibili-Evolved Bilibili-Evolved作为一款强大的哔哩哔哩增强…...

OpenClaw版本升级指南:千问3.5-27B镜像兼容性测试与迁移

OpenClaw版本升级指南:千问3.5-27B镜像兼容性测试与迁移 1. 为什么需要这篇指南 上周五晚上11点,我的OpenClaw突然弹出一条警告:"当前版本即将停止维护"。作为一个重度依赖OpenClaw自动化处理日报和周报的用户,我意识…...

大卫小东(Sheldon)抑

Issue 概述 先来看看提交这个 Issue 的作者是为什么想到这个点子的,以及他初步的核心设计概念。?? 本 PR 实现了 Apache Gravitino 与 SeaTunnel 的集成,将其作为非关系型连接器的外部元数据服务。通过 Gravitino 的 REST API 自动获取表结构和元数据&…...

[具身智能-320]:语料库就是“语言材料的仓库”。

简单来说,语料库就是“语言材料的仓库”。在人工智能和语言学领域,它指的是经过科学取样、加工和整理的大规模电子文本或数据集合。如果把大语言模型(LLM)比作一个正在上学的孩子,那么语料库就是它读的“书”、做的“题…...

[具身智能-319]:分词器的词典的内容有哪些因素决定,该字典中的内容是如何构建的?英文的分词器字典多大?中文的分词器字典有多大?分别举例说明分词器字典中的内容?

分词器的词典(Vocabulary)是决定大语言模型如何“看”世界的关键组件。它不仅仅是一个单词列表,更是一个包含了各种粒度文本单元及其对应数字编号(Token ID)的映射表。 以下为你详细解析词典的决定因素、构建过程、英…...

[具身智能-318]:分词 (Tokenization)原理和代码示例

分词(Tokenization)是大语言模型(LLM)的“第一公里”,它的核心任务是将人类可读的自然语言文本,转换为模型能够理解和处理的数字序列。简单来说,分词器(Tokenizer)就是一…...

2025项目管理工具深度评测:Gitee如何引领技术团队敏捷转型

数字化转型浪潮下的项目管理革命 2025年的企业数字化转型已进入深水区,项目管理工具作为企业效率的核心引擎,正在经历从功能堆砌到智能协同的质变。在这场变革中,Gitee作为中国最大的代码托管平台,其项目管理模块的全面升级正在重…...

007、记忆(Memory)机制:让AI拥有对话上下文的能力

007、记忆(Memory)机制:让AI拥有对话上下文的能力 昨天深夜调试一个对话机器人,用户问“今天的天气怎么样?”,系统返回了天气信息;接着用户又问“那明天呢?”,结果机器人…...

008、对话链实战:调试一个“失忆”的智能对话助手

008、对话链实战:调试一个“失忆”的智能对话助手 昨天在调试一个基于LangChain的客服原型时,遇到了一个典型问题:每次用户问“我刚才说了什么?”,助手都回答“我不知道您之前说了什么”。这暴露了对话链最核心的问题—…...

智能家居中枢:OpenClaw通过Qwen3.5-9B控制HomeKit设备

智能家居中枢:OpenClaw通过Qwen3.5-9B控制HomeKit设备 1. 为什么需要AI控制智能家居? 去年装修新房时,我安装了二十多个HomeKit设备。每天早晨需要对着手机喊"Siri打开窗帘",晚上又要手动设置"影院模式"。这…...

Linux I/O 演进史:从管道到零拷贝,一篇串起个服务端核心原语倍

前言 在使用 kubectl get $KIND -o yaml 查看 k8s 资源时,输出结果中包含大量由集群自动生成的元数据(如 managedFields、resourceVersion、uid 等)。这些信息在实际复用 yaml 清单时需要手动清理,增加了额外的工作量。 使用 kube…...

DHT温湿度传感器驱动库原理与工程实践

1. 项目概述servodht11是一个面向嵌入式 Arduino 生态的轻量级温湿度传感器驱动库,专为 DHT 系列数字传感器(DHT11、DHT22/AM2302、DHT21/AM2301、DHT33、DHT44)设计。尽管项目名称中包含servo字样,但根据其官方 README 文档及实际…...

跨平台文件同步:OpenClaw调用Qwen3-32B实现智能归档

跨平台文件同步:OpenClaw调用Qwen3-32B实现智能归档 1. 为什么需要智能文件同步工具 作为一个长期被数字资产混乱困扰的技术从业者,我电脑里的文件就像一座无人管理的图书馆。下载的论文、会议录音、代码片段、临时截图散落在十几个文件夹中&#xff0…...

技术实测|告别命令行!OpenClaw(小龙虾AI) 一键部署教程

前言 随着本地 AI 智能体快速普及,私有化部署、数据安全、低门槛落地已成为技术选型核心。OpenClaw 作为开源轻量化 AI 智能体,v2.6.1 版本在环境适配、服务稳定性、模型集成度上全面优化,无需编译、无需手动配置依赖,真正实现 W…...

计算机毕业设计:Python智慧水网监测与水位预测大屏 Flask框架 数据分析 可视化 大数据 AI 线性回归 河流数据 水位预测(建议收藏)✅

1、项目介绍 技术栈 采用 Python 语言开发,基于 Flask 框架搭建后端服务,使用 Vue 框架构建前端交互界面,MySQL 数据库进行数据存储,运用机器学习线性回归预测算法实现水位预测,结合 Echarts 可视化技术搭建数据大屏&a…...

OpenClaw小龙虾本地版一键部署教程|零配置开箱即用,内置 400 + 大模型前言

前言 在本地 AI 智能体快速普及的当下,OpenClaw(小龙虾) 凭借「纯本地运行、零代码部署、全场景自动化」的核心优势,成为 2026 年办公人群、技术爱好者首选的 AI 工具。相比旧版本,全新v2.6.1进一步优化了部署流程、兼…...

【EI复现】考虑分布式电源不确定性的配电网鲁棒动态重构附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室🍊个人信条:格物致知,完整Matlab代码及仿真咨询…...

STM32智慧停车场系统开发实战

1. 项目概述这个智慧停车场管理系统项目基于STM32微控制器开发,主要解决传统停车场管理效率低下、人工成本高、用户体验差等问题。我在实际开发中发现,一套完整的智慧停车场系统需要整合硬件感知、数据处理、用户交互和远程管理四大模块,而ST…...

DDD难落地?就让AI干吧! - cleanddd-skills介绍儆

AI训练存储选型的演进路线 第一阶段:单机直连时代 早期的深度学习数据集较小,模型训练通常在单台服务器或单张GPU卡上完成。此时直接将数据存储在训练机器的本地NVMe SSD/HDD上。 其优势在于IO延迟最低,吞吐量极高,也就是“数据离…...

基于File-Based App开发MVP项目钨

Issue 概述 先来看看提交这个 Issue 的作者是为什么想到这个点子的,以及他初步的核心设计概念。?? 本 PR 实现了 Apache Gravitino 与 SeaTunnel 的集成,将其作为非关系型连接器的外部元数据服务。通过 Gravitino 的 REST API 自动获取表结构和元数据&…...

MySQL触发器可以修改当前行数据吗_MySQL触发器修改字段值

BEFORE触发器可安全修改NEW字段值,AFTER中修改无效;禁止在触发器内UPDATE本表以防递归;INSERT中不可依赖NEW.id做逻辑;赋值需注意类型、长度及约束。BEFORE 触发器里能直接改 NEW 字段值可以,而且这是唯一安全修改当前…...

贾子科学三层结构定律(TMM):终结波普尔骗局,重塑科学真理主权的终极架构

贾子科学三层结构定律(TMM):终结波普尔骗局,重塑科学真理主权的终极架构副标题: Truth–Model–Method Framework——从“方法僭越”到“真理回归”的科学划界革命摘要针对波普尔可证伪主义导致的真理虚无化与当代学术…...