当前位置: 首页 > article >正文

AI代码库问答引擎Folda-Scan

在这里插入图片描述

简介

什么是 Folda-Scan ?

Folda-Scan 是一款革命性的智能项目问答工具, 完全在浏览器中本地运行 。它使用高级语义矢量化将您的代码库转变为对话伙伴,使代码理解和 AI 协作变得前所未有的简单和安全。其采用尖端的 Web 技术和 AI 算法构建,可为您提供流畅、高效和安全的本地代码交互体验。

主要亮点

  • 🛡️ 绝对隐私,本地运行:所有数据处理均在浏览器本地完成,代码永不离开您的计算机。
  • 💬 自然语言“聊”代码:像和同事聊天一样向代码库提问,精准获取答案。
  • 🧠 深层语义理解:超越关键词,理解代码的真实意图和复杂逻辑。
  • 🎯 信息秒级定位:模糊描述也能快速定位相关代码片段和文件。
  • 🤖 LLM 协作加速器:一键生成上下文感知的 Markdown,为 AI 助手(ChatGPT, Claude 等)提供完美“食粮”。
  • 💰 Token 成本骤降:优化 LLM 交互,显著降低 API 调用成本和等待时间。
  • 🛠️ 智能配置生成:辅助生成 Dockerfile 等项目配置文件。
  • 🚀 即时上手:清晰的项目运行指导,快速启动您的代码探索之旅。

工作原理

Folda-Scan 的魔法源于其创新的语义向量化引擎

  1. 本地扫描与索引:安全扫描您选定的本地项目,通过语义分析将代码转化为高维向量,在浏览器本地构建知识索引。
  2. 智能自然语言处理 (NLP):理解您的自然语言提问,并将其同样向量化。
  3. 精准语义匹配:在向量空间中高效匹配问题与代码内容,提供最相关的答案。 这一切都在保障您数据隐私的前提下,在浏览器中高效完成。

应用场景

  • 代码理解与学习:适用于新开发者快速了解复杂代码库,提升学习效果。
  • 技术文档生成:便于开发者在与代码互动时,生成清晰的技术文档。
  • 多项目管理:适合需要同时处理多个项目的开发者,快速查找所需信息。
  • AI 辅助开发:为开发者提供强大的工具,优化与 AI 的协作,减少 API 调用成本。

Folda-Scan 通过提供安全、高效的代码交互体验,帮助开发者更好地利用其代码资产。

如果不想自己安装,可以使用官方提供的演示站点( https://file.wen.bar )

构建镜像

如果你不想自己构建,可以跳过,直接阅读下一章节

Dockerfile 没有采用多阶段构建,所以编译出来的镜像有点大

# 使用 Node.js 作为基础镜像  
FROM node:18  # 设置工作目录  
WORKDIR /usr/src/app  # 复制 package.json 和 package-lock.json  
COPY package*.json ./  # 安装依赖
RUN npm install  
# serve 不是项目依赖,需要单独安装:  
RUN npm install serve  # 复制应用代码  
COPY . .  # 构建应用  
RUN npm run build  # 暴露端口  
EXPOSE 3000  # 启动应用  
# 使用 npx (如果 serve 未作为项目依赖安装,npx 会临时下载)  
# CMD ["npx", "serve", "-s", "out", "-l", "3000"]  
# 或者,如果 serve 是项目依赖 (通过 npm install 安装了)  
CMD ["./node_modules/.bin/serve", "-s", "out", "-l", "3000"]

构建镜像和容器运行的基本命令如下👇

# 下载代码
git clone https://github.com/oldjs/web-code-agent.git# 通过代理
git clone https://gh-proxy.com/github.com/oldjs/web-code-agent.git# 进入目录  
cd web-code-agent# 构建镜像
docker build -t wbsu2003/web-code-agent:v1 .# 运行容器
docker run -d \--restart unless-stopped \--name web-code-agent \-p 3250:3000 \wbsu2003/web-code-agent:v1

安装

在群晖上以 Docker 方式安装。

在注册表中搜索 wbsu2003 ,可能要翻到第二页才能找到 wbsu2003/web-code-agent,版本选择 latest

端口

本地端口不冲突就行,不确定的话可以用命令查一下

# 查看端口占用
netstat -tunlp | grep 端口号
本地端口容器端口
32503000

命令行安装

如果你熟悉命令行,可能用 docker cli 更快捷

# 运行容器
docker run -d \--restart unless-stopped \--name web-code-agent \-p 3250:3000 \wbsu2003/web-code-agent

也可以用 docker-compose 安装,将下面的内容保存为 docker-compose.yml 文件

version: '3'services:web-code-agent:image: wbsu2003/web-code-agentcontainer_name: web-code-agentrestart: unless-stoppedports:- 3250:3000

然后执行下面的命令

# 新建文件夹 folda-scan 和 子目录
mkdir -p /volume1/docker/folda-scan# 进入 folda-scan 目录
cd /volume1/docker/folda-scan# 将 docker-compose.yml 放入当前目录# 一键启动
docker-compose up -d 

运行

如果在浏览器中输入 http://群晖IP:3250 ,虽然能看到主界面,但是会有警告提示

其实原因主要是文件系统访问(File System Access API)和 Service Worker 必须使用 https 协议,当然浏览器本身也很重要, FirefoxSafari 可能不支持或部分支持

反向代理

实际访问地址为: https://code.laosu.tech

域名局域网地址备注
code.laosu.techhttp://192.168.0.197:3250Folda-Scan 的访问地址

npm 中的设置

在浏览器中输入 https://code.laosu.tech,这次不会再有警告了

基本用法

  1. 选择文件夹:授权浏览器访问您的本地代码项目。
  2. 等待索引Folda-Scan 将在本地快速构建语义索引。
  3. 开始提问:用自然语言向您的代码库提问,探索其奥秘!

以本项目为例,输入用户名和仓库名之后,可以下载代码

当然前提是你能访问 https://api.github.com

在本机解压之后,点 选择文件夹 导入项目代码

下载的报告是 FS_Report_20250601_1146.txt 这样的文件,包含了项目文件、文件夹、函数、方法以及它们之间的调用关系、可用于 ChatGPTClaude

选择 与代码对话

现在可以直接跟代码库对话了

稍等一会儿,你就会看到答案了

软件本身不需要设置大模型,但是从答案看,会向后端/云端(https://text.pollinations.ai/openai)发送对话信息

你可以将代码库当做知识库,这样就好理解了,虽然不会上传完整的代码,但是代码片段还是会的,这也是为什么会减少 API 调用费用的根本原因

参考文档

oldjs/web-code-agent: Browser-local AI code Q&A engine. Chat with your codebase, ensure privacy, and optimize LLM collaboration.
地址:https://github.com/oldjs/web-code-agent

Folda-Scan - 本地文件夹扫描工具
地址:https://file.wen.bar/

相关文章:

AI代码库问答引擎Folda-Scan

简介 什么是 Folda-Scan ? Folda-Scan 是一款革命性的智能项目问答工具, 完全在浏览器中本地运行 。它使用高级语义矢量化将您的代码库转变为对话伙伴,使代码理解和 AI 协作变得前所未有的简单和安全。其采用尖端的 Web 技术和 AI 算法构建&…...

Kafka深度技术解析:架构、原理与最佳实践

一、 消息队列的本质价值与核心特性 1.1 分布式系统的“解耦器” 异步通信模型 代码列表 graph LRA[生产者] -->|异步推送| B[(消息队列)]B -->|按需拉取| C[消费者1]B -->|按需拉取| D[消费者2] 生产者发送后立即返回,消费者以自己的节奏处理消息。典…...

基于cnn的通用图像分类项目

背景 项目上需要做一个图像分类的工程。本人希望这么一个工程可以帮助学习ai的新同学快速把代码跑起来,快速将自己的数据集投入到实战中! 代码仓库地址:imageClassifier: 图片分类器 数据处理 自己准备的分类图像,按照文件夹分…...

Kotlin-协程

文章目录 什么是协程协程的好处协程的挂起和恢复协程原理 什么是协程 协程是一种用户态的轻量级程序组件,其核心特点是通过协作式调度实现单线程内的伪并发。 协程的好处 传统的线程切换通过回调,Handler各种调度,繁琐,代码不清…...

pycharm 左右箭头 最近编辑

目录 经典界面: 快捷键 经典界面: 如果你使用的是新 UI(新版 PyCharm 默认启用的),导航按钮可能被精简了,你可以: File Settings(齿轮图标)→ UI Appearance 或 New …...

Linux环境管道通信介绍

目录 前言 一、通信的本质 二、匿名管道 1.通信资源——文件缓冲区 2.为什么叫匿名管道? ​编辑 3.匿名管道的创建过程 4.pipe函数 小结 5.一些问题 1)匿名管道为什么要求父子进程将原本的读/写权限只保留一个 2)为什么一开始父进程要以读/写…...

DIC技术助力金属管材全场应变测量:高效解决方案

在石油管道、汽车排气系统、航空航天液压管路等工业场景中,金属管作为关键承力部件,其拉伸性能(如弹性极限、颈缩行为、断裂韧性)直接影响结构安全性和使用寿命。 实际应用中,选用合适的管材非常重要,通过…...

python基础day04

1.两大编程思想的异同点: 面向过程面向对象区别事物比较简单,可以用线性的思维去解决事物比较复杂,使用简单的线性思维无法解决共同点面向过程和面向对象都是解决实际问题的一种思维方式二者相辅相成,并不是对立的解决复杂问题,通…...

嵌入式学习--江协stm32day1

失踪人口回归了,stm32的学习比起51要慢一些,因为涉及插线,可能存在漏插,不牢固等问题。 相对于51直接对寄存器的设置,stm32因为是32位修改起来比较麻烦,江协课程是基于标准库的,是对封装函数进…...

湖北理元理律师事务所:债务化解中的心理重建与法律护航

专业法律顾问视角 一、债务危机的双重属性:法律问题与心理困境 在对173名债务人的调研中发现: 68%存在焦虑引发的决策障碍(如不敢接听银行电话) 42%因羞耻感隐瞒债务导致雪球效应 湖北理元理律师事务所创新采用法律-心理双轨…...

constexpr 是 C++11 引入的关键字

constexpr 是 C11 引入的关键字,用于在编译期进行常量表达式计算,从而提高程序性能和安全性。以下是其核心作用和用法: 一.作用 1编译期 计算 constexpr 变量或函数的值在编译时确定,避免运行时计算开销。例如,数组大…...

【更新中】(文档+代码)基于推荐算法和Springboot+Vue的购物商城

概要设计 本节规划和定义了Woodnet桌游电商平台的软件概要设计说明书,描述了软件的总体设计、接口设计、运行设计、系统数据库结构设计以及系统出错处理设计,从整体上说明了系统设计的结构层次、处理流程、系统用例等。 本系统是一个独立的系统&#x…...

六种高阶微分方程的特解(原创:daode3056)

高阶微分方程的通解是指包含所有可能解的解的表达式。对于一个 n 阶微分方程,其通解通常包含 n 个任意常数。这些任意常数可以通过初始条件或边界条件来确定。高阶微分方程的特解是指在通解中,特定地选择了一组常数,使得解满足给定的初始条件…...

【C++11(上)】—— 我与C++的不解之缘(三十)

一、C11 这里简单了解一下C发展好吧: C11是C的第二个大版本,也是自C98以来最重要的一个版本。 它引入了大量的更改,它曾被人们称为C0x,因为它被期待在2010年之前发布;但在2011年8月12日才被采纳。 C03到C11花了8年时间…...

【多线程初阶】wait() notify()

文章目录 协调多个线程间的执行顺序join 和 wait 区别sleep 和 wait 区别 wait()方法线程饿死调用 wait()唤醒 wait() notify()方法wait() 和 notify() 需对同一对象使用确保先 wait ,后 notify多个线程在同一对象上wait notify随机唤醒一个wait notifyAll()方法应用 wait() 和…...

安全-JAVA开发-第二天

Web资源访问的流程 由此可见 客户访问JAVA开发的应用时 会先通过 监听器(Listener)和 过滤器(Filter) 今天简单的了解下这两个模块的开发过程 监听器(Listener) 主要是监听 我们触发了什么行为 并进行反应…...

Python基础:文件简单操作

🍃引言 手把手带你快速上手Python Python基础专栏 一、🍃文件是什么 变量是把数据保存到内存中. 如果程序重启/主机重启, 内存中的数据就会丢失。 要想能让数据被持久化存储, 就可以把数据存储到硬盘中. 也就是在文件中保存。 通过文件的后缀名, 可以看…...

深度学习项目之RT-DETR训练自己数据集

RT-DETR 1.模型介绍📌 什么是 RT-DETR ?📖 核心改进点📊 结构示意🎯 RT-DETR 优势⚠️ RT-DETR 缺点📈 应用场景📑 论文 & 官方仓库2.模型框架3.Yaml配置文件4.训练脚本5.训练完成截图6.总结…...

以太网帧结构和封装【二】-- IP头部信息

1字节 byte 8比特 bit 【位和比特是同一个概念】 比特/位,字节之间的关系是: 位(Bit) 中文名:位(二进制位)。 英文名:Bit(Binary Digit 的缩写)。 含义&…...

mysql 悲观锁和乐观锁(—悲观锁)

适合悲观锁的使用场景: 悲观锁更适合在,写操作较多、并发冲突高、业务需要强一致性等场景下使用悲观锁。 如何使用悲观锁: 悲观锁主要通过以下两个 SQL语句实现: 1、SELECT...FOR UPDATE; 这个语句会在所查询中的数据行上设置排…...

Promtail采集服务器本地日志存储到Loki

✅ 一、前提条件 已安装 Loki 服务 日志文件目录可访问(如 /var/log) 具备 sudo 权限 🧩 二、下载 Promtail 二进制文件 # 替换为你想要的版本 VERSION"3.5.1"# 创建目录 sudo mkdir -p /opt/promtail cd /opt/promtail# 下载并…...

python第31天打卡

import numpy as np from tensorflow import keras from tensorflow.keras import layers, optimizers, utils, datasets# 数据加载和预处理函数 def load_and_preprocess_data():(x_train, y_train), (x_test, y_test) datasets.mnist.load_data()# 重塑并归一化图像数据x_tr…...

4.1 HarmonyOS NEXT原生AI能力集成:盘古大模型端侧部署与多模态交互实战

HarmonyOS NEXT原生AI能力集成:盘古大模型端侧部署与多模态交互实战 在HarmonyOS NEXT的全场景生态中,原生AI能力成为连接设备、服务与用户的核心纽带。通过盘古大模型端侧轻量化部署、多模态交互技术及环境感知系统,开发者能够构建"主…...

学习STC51单片机27(芯片为STC89C52RCRC)

每日一言 你读过的书、走过的路、流过的汗,终将成就独一无二的你。 硬件:LCD1602液晶显示 非标协议外设 概述 LCD1602(Liquid Crystal Display)是一种工业字符型液晶,能够同时显示 1602 即 32 字符(16列两行) 那我…...

PAT-甲级JAVA题解(更新中...)

使用JAVA语言进行算法练习,但是有些会出现运行超时情况. 题目链接A1001A1001-PAT甲级JAVA题解 AB FormatA1005A1005-PAT甲级JAVA题解 Spell It RightA1006A1006-PAT甲级JAVA题解 Sign In and Sign OutA1011A1011-PAT甲级JAVA题解World Cup BettingA1012A1012 PAT甲级JAVA题解 …...

Deep Chat:重塑人机对话边界的开源智能对话框架—— 让下一代AI交互无缝融入你的应用

在AI助手泛滥的今天,开发体验碎片化、功能扩展性差、多模态支持不足成为行业痛点。由开发者Ovidijus Parsiunas发起的开源项目 Deep Chat(https://github.com/OvidijusParsiunas/deep-chat),正以模块化设计 全栈兼容性颠覆传统聊…...

DA14531_beacon_大小信标设备开发

蓝牙信标是一款通过广播指定蓝牙信号,实现信标信号扫描、识别和获得辅助信息的电子产品。 不同品名的蓝牙信标采用相同的 UUID 和广播信号格式,但在 MAC 地址、工作寿命、体积和广播周期上有所差异。 小武编程巧用DA14531开发一款蓝牙信标....

【算法训练营Day06】哈希表part2

文章目录 四数相加赎金信三数之和四数之和 四数相加 题目链接:454. 四数相加 II 这个题注意它只需要给出次数,而不是元组。所以我们可以分治。将前两个数组的加和情况使用map存储起来,再将后两个数组的加和情况使用map存储起来,ke…...

Word双栏英文论文排版攻略

word写双栏英文论文的注意事项 排版首先改字体添加连字符还没完呢有时候设置了两端对齐会出现这样的情况: 公式文献 等我下学期有时间了,一定要学习Latex啊,word写英文论文,不论是排版还是公式都很麻烦的,而Latex一键就…...

乡村三维建模 | 江苏农田无人机建模案例

测绘是农田建设的基础工作,测绘的质量和效率直接影响农田建设的进度和成果。传统的人工测量、地面测量等测绘手段,存在效率低、精度差、受环境影响大、成本高等缺点,难以满足高标准农田建设的要求。而无人机倾斜摄影技术具有高效、精确、灵活…...