当前位置: 首页 > article >正文

WeKnora:面向深层文档理解与智能检索的 RAG 框架

WeKnora是一个基于大语言模型 (LLM) 的框架专为深层文档理解和语义检索而设计特别擅长处理复杂的异构文档。它采用模块化架构结合了多模态预处理、语义向量索引、智能检索和大模型推理。你可以将它理解为一个为团队量身打造的“超级知识中枢”。✨ 最新动态v0.3.0 亮点共享空间支持成员邀请、共享知识库和 Agent实现租户隔离检索。Agent Skills具备预加载技能的智能推理 Agent 系统提供沙箱执行环境。自定义 Agent支持配置知识库选择模式全部/指定/禁用。数据分析 Agent内置支持 CSV/Excel 分析的 Data Analyst Agent。思考模式支持 LLM 和 Agent 的思考过程展示智能过滤思考内容。更多搜索源新增 Bing 和 Google 搜索支持。API Key 认证提供 Swagger 文档支持的 API Key 安全机制。☸️Helm Chart支持 Kubernetes 完整部署支持 Neo4j GraphRAG。全球化新增韩语 (한국어) 支持。⚡基础架构新增 Qdrant 向量数据库支持优化 Ollama 嵌入。v0.2.0 亮点ReACT Agent 模式通过多次迭代和反思生成综合摘要报告。多类型知识库支持 FAQ 和文档类知识库包含文件夹、URL 导入。MCP 工具集成通过 MCP 扩展 Agent 技能支持 npx/uvx 启动器。️ 架构设计WeKnora 采用现代模块化设计构建完整的文档理解与检索流水线。文档解析多模态预处理从 PDF、Word、图片等提取结构化内容。向量处理语义向量索引。检索引擎结合关键词、向量、知识图谱的混合检索策略。大模型推理基于 RAG 范式提供语境感知的回答。 快速开始 安装步骤克隆仓库git clone https://github.com/Tencent/WeKnora.gitcd WeKnora配置环境变量cp .env.example .env# 编辑 .env 文件设置必要的值如 LLM API Key 等启动服务核心服务docker compose up -d全功能开启docker-compose --profile full up -d启用 Neo4j 知识图谱docker-compose --profile neo4j up -d启用 Minio 存储docker-compose --profile minio up -d一键启动含 Ollamaplaintext./scripts/start_all.sh# 或者make start-all 功能展示 ------ * **知识库管理** 支持拖拽、文件夹、URL 等多种导入方式自动提取核心知识。 * **Agent 模式** ReACT 模式支持调用内置工具、MCP 工具和搜索工具。 * **文档知识图谱** 将文档转化为知识图谱展示段落间的语义关联增强检索精度。 * **微信对话开放平台** WeKnora 是 微信对话开放平台 的核心技术框架。 --- 通过 MCP 服务器访问 -------------- 您可以将 WeKnora 作为 MCP 服务器连接到您的 AI 客户端 plaintext { mcpServers: { weknora: { command: python, args: [path/to/WeKnora/mcp-server/run_server.py], env: { WEKNORA_API_KEY: 您的 API Key (在开发者工具中查看 x-api-key), WEKNORA_BASE_URL: http://your-weknora-address/api/v1 } } }} 开发指南⚡ 快速开发模式如果您需要频繁修改代码无需每次构建 Docker 镜像# 启动基础设施make dev-start# 启动后端 (新终端)make dev-app# 启动前端 (新终端)make dev-frontend优势前端代码热重载后端快速重启5-10s支持 IDE 断点调试。 适用场景WeKnora 的多模态解析和智能 Agent 能力使其在以下场景中表现卓越企业级知识库深度解析复杂的 PDF/Word 规章制度、技术文档提供精准的内部问答。智能客服系统结合微信对话开放平台快速搭建零代码的公众号/小程序 AI 客服。研发辅助助理通过 MCP 协议连接开发环境辅助阅读代码仓文档或项目指南。复杂数据分析利用内置的 Data Analyst Agent直接对上传的 CSV/Excel 报表进行理解与统计。科研/法律文档分析利用知识图谱功能理清长篇法律条文或论文中的复杂引用与逻辑关系。 功能展示学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关文章:

WeKnora:面向深层文档理解与智能检索的 RAG 框架

WeKnora 是一个基于大语言模型 (LLM) 的框架,专为深层文档理解和语义检索而设计,特别擅长处理复杂的异构文档。它采用模块化架构,结合了多模态预处理、语义向量索引、智能检索和大模型推理。 你可以将它理解为一个为团队量身打造的“超级知识…...

3分钟掌握NCM解密:开源工具ncmdump实现网易云音乐跨平台播放自由

3分钟掌握NCM解密:开源工具ncmdump实现网易云音乐跨平台播放自由 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐下载的NCM加密文件无法在其他设备播放而烦恼吗?这款开源工具ncmdump让你快速…...

【亲测】笔记本token免费,window下本地养个龙虾(Openclaw+Ollama)看看?

目录环境检查查看显卡状态检查conda环境跑通OllamaOllama自带API下载模型模型“复读机”问题安装openclaw配置环境浅浅体验一下本人笔记本显卡是GTX1070 8G显存(算是老古董显卡了),cpu是i7-8750H 6核12线程,内存32G,在window下,尝…...

颠覆传统:3倍效率提升的Markdown到PPT智能转换解决方案

颠覆传统:3倍效率提升的Markdown到PPT智能转换解决方案 【免费下载链接】md2pptx Markdown To PowerPoint converter 项目地址: https://gitcode.com/gh_mirrors/md/md2pptx 通过创新解析引擎与模板系统,实现技术文档到演示文稿的自动化转换&…...

洛谷:P5743 【深基7.习8】猴子吃桃

题目描述一只小猴买了若干个桃子。第一天他刚好吃了这些桃子的一半,又贪嘴多吃了一个;接下来的每一天它都会吃剩余的桃子的一半外加一个。第 n 天早上起来一看,只剩下 1 个桃子了。请问小猴买了几个桃子?输入格式输入一个正整数 n…...

Android开发必知:fitsSystemWindows的正确使用姿势(附常见问题排查)

Android开发实战:深度解析fitsSystemWindows的适配艺术 在Android应用开发中,系统UI(状态栏和导航栏)的适配一直是开发者面临的棘手问题之一。特别是当应用需要实现沉浸式体验或全屏显示时,如何正确处理系统窗口的占位…...

【Python】Flask与Django对比详解:教你如何选择最适合你的Web框架

文章目录 引言:为何选择Python Web框架?Flask简介:轻量级的灵活之选 ?? Flask的核心特点 Django简介:全能型的强大框架 ?? Django的核心特点 Flask与Django的详细对比 架构设计功能与扩展性性能与效率模板系统ORM(…...

RAPTOR与C语言实战:经典算法练习精解(附完整代码)

1. RAPTOR与C语言入门:为什么选择这对组合? 刚开始学编程的时候,很多人都会纠结该从哪里入手。我当年也是一样,试过各种工具和语言,最后发现RAPTOR流程图工具配合C语言简直是绝配。RAPTOR的图形化界面能让你直观地看到…...

别再用-O2了!航天级C项目实测:-Og -fno-omit-frame-pointer -mthumb -mfloat-abi=hard 这组参数让故障率下降89.7%(附MISRA-C合规报告)

第一章:C语言边缘编译优化参数的工程必要性在嵌入式系统、物联网终端与实时控制设备等资源受限的边缘场景中,C语言仍是主流开发语言。然而,标准编译流程(如默认 gcc -O0)生成的目标代码往往未针对硬件约束(…...

带标注的麻将识别数据集,六千多张图片,识别率96.7%,可识别麻将的点数和类型,如1条,8萬,2饼東南西北中發白板等,支持yolo,coco json,pascal voc xml格式

带标注的麻将识别数据集,六千多张图片,识别率96.7%,可识别麻将的点数和类型,如1条,8萬,2饼東南西北中發白板等,支持yolo,coco json,pascal voc xml格式 数据集比较大&am…...

Scroll Reverser终极指南:如何让macOS触控板和鼠标滚动方向完美共存

Scroll Reverser终极指南:如何让macOS触控板和鼠标滚动方向完美共存 【免费下载链接】Scroll-Reverser Per-device scrolling prefs on macOS. 项目地址: https://gitcode.com/gh_mirrors/sc/Scroll-Reverser 还在为macOS系统中触控板和鼠标的滚动方向冲突而…...

Fish-Speech-1.5实战教程:从安装到生成,手把手教你制作多语言语音

Fish-Speech-1.5实战教程:从安装到生成,手把手教你制作多语言语音 1. 为什么你需要这个语音合成工具? 想象一下,你正在为一个多语言产品演示视频寻找配音,或者需要为你的在线课程生成不同语言的讲解音频。传统方法要…...

Genshin FPS Unlocker:突破帧率枷锁的技术革新与实战指南

Genshin FPS Unlocker:突破帧率枷锁的技术革新与实战指南 【免费下载链接】genshin-fps-unlock unlocks the 60 fps cap 项目地址: https://gitcode.com/gh_mirrors/ge/genshin-fps-unlock 当144Hz显示器只能输出60fps画面时,就像给跑车装上了限速…...

从零到一:OptimizePI Pre-layout PDN前仿真实战指南

1. OptimizePI入门:电源完整性设计新手指南 刚接触电源完整性(PI)设计时,我和很多新手工程师一样,面对密密麻麻的电路板和复杂的仿真参数一头雾水。直到遇见了OptimizePI这款神器,才发现原来PDN(电源分配网络)前仿真可以如此直观高…...

小白程序员必看:掌握Skills轻松玩转大模型应用与工作流自动化(收藏版)

文章通过面试经历引出Skills在大模型应用中的重要性,阐述了Skills作为延迟加载的sub-agent概念,并详细对比了Skills与Prompt、MCP、Function Calling的区别。文章强调Skills通过自然语言定义专项能力,实现模块化与可复用性,并以代…...

STEM实战指南:短时基因表达谱的聚类分析与GO富集解读

1. STEM工具简介:短时基因表达谱分析的瑞士军刀 STEM(Short Time-series Expression Miner)是一款专为短时间序列基因表达数据分析而设计的Java程序。想象一下,你手上有3-8个时间点的基因表达数据,想要找出哪些基因在特…...

收藏!2026年AI产品经理必备:从需求洞察到模型调优全链路实战指南

文章探讨了腾讯面试中关于AI Agent产品经理能力的关键问题,强调AI应用将从“对话”转向“干活”,要求产品经理具备从需求洞察到模型效果对齐的全链路落地能力。文章详细介绍了腾讯在AI Agent赛道的独特打法,包括利用微信和企业微信构建社交与…...

从阻抗/参数灵敏度到系统诊断:新能源并网系统小干扰稳定性的主导因素挖掘与交互机理剖析

1. 新能源并网系统的小干扰稳定性挑战 去年我在参与一个风电场的并网调试时,遇到了一个奇怪的现象:系统在晴朗天气下运行稳定,但只要风速突然增大,并网点就会出现频率在200Hz左右的电压波动。这种宽频振荡就像电力系统的"过敏…...

halcon 中gen_gauss_filter 的数学原理与高斯加权

gen_gauss_filter 是 生成高斯滤波器的算子,本质上是利用 高斯函数构造卷积核 来实现图像平滑和降噪一、高斯滤波器定义高斯滤波器是一种线性平滑滤波器,二维形式为二、核生成原理 (gen_gauss_filter)在 HALCON 中,gen_gauss_filter 会生成一…...

【实战解析】pyodbc.InterfaceError: IM002 错误的深度排查与多版本Access驱动精准安装指南

1. 错误现象与复现场景 当你在Windows系统上用Python处理Access数据库时,突然蹦出pyodbc.InterfaceError: IM002这个错误,是不是感觉像被泼了一盆冷水?这个报错的核心提示是"未发现数据源名称",但实际背后藏着更复杂的故…...

FlowState Lab快速入门:10分钟完成你的第一个时序数据生成项目

FlowState Lab快速入门:10分钟完成你的第一个时序数据生成项目 1. 前言:为什么选择FlowState Lab 时序数据生成在金融预测、设备监控、商业分析等领域越来越重要。但传统方法要么需要复杂的数学建模,要么依赖大量真实数据。FlowState Lab通…...

CentOS 7上PostgreSQL 14.8源码编译安装与优化指南

CentOS 7上PostgreSQL 14.8源码编译安装与生产级优化实战 在当今数据驱动的商业环境中,PostgreSQL作为最先进的开源关系型数据库之一,凭借其强大的功能集和卓越的稳定性,已成为企业级应用的首选。本文将深入探讨在CentOS 7环境下通过源码编译…...

ECBS多机器人路径规划:从理论到实践的优化策略

1. 多机器人路径规划的核心挑战 想象一下让10个外卖机器人在商场里送餐,或者让50个仓储机器人在仓库搬运货物。每个机器人都有自己的起点和目的地,但通道宽度只够1-2台机器并行。这就是典型的多机器人路径规划(MAPF)问题——既要保证所有机器人按时到达目…...

异步电机参数解析:从铭牌数据到等效电路的公式法实践

1. 异步电机参数计算的基础知识 异步电机作为工业领域最常见的动力设备之一,其性能分析和系统仿真都离不开准确的等效电路参数。传统上,我们通过空载和堵转实验来获取这些参数,但这种方法存在几个明显的缺陷。首先,堵转实验时转子…...

统信UOS外接显示器黑屏?5步搞定NVIDIA驱动配置(附BusID查找技巧)

统信UOS多屏办公实战:NVIDIA显卡驱动配置全指南 当你在统信UOS系统上连接第二块显示器,期待扩展工作空间时,却只看到一个黑屏——这种体验确实令人沮丧。作为一款优秀的国产操作系统,统信UOS在办公场景下表现优异,但遇…...

Kiro AWS Observability Power 配置与使用指南

CloudWatch MCP | Application Signals MCP | CloudTrail MCP | AWS Docs MCP | 一站式排障 概述 痛点 日常排查 AWS 问题需要在多个工具间切换: 工具 维度 局限 CloudWatch Metrics 📊 指标 只看数值,不知道为什么 CloudWatch Logs 📝 日志 海量日志,人工过滤 X-Ray …...

COZE - 3

应用开发与发布 什么是应用? 通过扣子平台构建的 AI 应用具备强大的可扩展性,支持与个性化的用户界面绑定。扣子应用通过工作流或对话流处理复杂的业务逻辑与编排,其内置的丰富节点库提供了逻辑处理、知识写入与检索、大模型服务、会话管理等…...

74HC595避坑指南:LED点阵显示残影消除的3种实战方法

74HC595实战精要:彻底解决LED点阵残影的3大技术方案 LED点阵显示屏在嵌入式系统中应用广泛,但动态扫描时出现的残影问题常常困扰开发者。本文将深入剖析残影成因,并提供三种经过验证的解决方案,帮助您实现专业级的显示效果。 1. 残…...

Power Writer客户端隐藏技巧:用PWLINK 2批量烧录不同型号芯片的实战方案

Power Writer客户端隐藏技巧:用PWLINK 2批量烧录不同型号芯片的实战方案 在中小批量硬件生产环境中,烧录效率往往成为制约产能的关键瓶颈。传统方式需要人工切换不同芯片型号的配置参数,不仅耗时且容易出错。PWLINK 2作为一款支持多架构的调试…...

MLX90614红外测温实战:基于STM32F1软件IIC的寄存器深度解析与高精度应用

1. MLX90614红外测温模块的硬件基础 第一次接触MLX90614这个红外测温模块时,我和大多数开发者一样遇到了不少困惑。市面上能找到的资料要么过于简单,要么就是收费内容,真正实用的技术细节少之又少。经过多次实践,我总结出了这套完…...