当前位置: 首页 > article >正文

3000行代码打造可自我进化的GenericAgent框架,多场景应用超便捷!

项目简介GenericAgent是一个极简、可自我进化的自主Agent框架。其核心代码仅约3000行借助9个原子工具和大约100行的Agent Loop能让任意大语言模型LLM对本地计算机实现系统级控制涉及浏览器、终端、文件系统、键鼠输入、屏幕视觉以及移动设备ADB。它秉持不预先加载技能通过进化获取技能的设计理念。每次GenericAgent解决新任务时会自动将执行路径固化为一项技能方便后续直接复用。使用时间越长积累的技能越多会形成一棵完全属于你的技能树这棵树从3000行种子代码发展而来。自举实证本仓库中的所有操作从安装Git、执行 git init 到每一条提交信息均由GenericAgent自主完成作者全程未打开过一次终端。核心特性自我进化每次完成任务都会自动沉淀为一项技能随着使用次数增加能力不断提升形成专属技能树。极简架构核心代码约3000行Agent Loop约100行没有复杂依赖部署毫无负担。强执行力可注入真实浏览器保留登录状态9个原子工具能直接控制操作系统。高兼容性支持Claude、Gemini、Kimi、MiniMax等主流模型具备跨平台能力。自我进化机制这是GenericAgent与其他Agent框架的根本区别。具体流程为[新任务] → [自主探索]安装依赖、编写脚本、调试验证 → [将执行路径固化为技能] → [写入记忆层] → [下次遇到类似任务直接调用]。以下是一些示例你说的话第一次执行后续执行“监控股票并提醒我”安装mootdx → 构建选股流程 → 配置定时任务 → 保存技能一句话启动“用Gmail发送这个文件”配置OAuth → 编写发送脚本 → 保存技能直接可用使用几周后你的Agent实例将拥有独一无二的技能树全部源于3000行种子代码。实例展示外卖下单“Order me a milk tea”可自动导航外卖应用选择商品并完成结账。量化选股“Find GEM stocks with EXPMA golden cross, turnover 5%”能按量化条件筛选股票。自主网页探索可自主浏览网页并定期汇总内容。支出追踪“查找近3个月超2000元的支出”可通过ADB驱动支付宝进行查询。最新动态2026年4月11日引入L4会话归档记忆并与scheduler cron调度集成。2026年3月23日支持将个人微信作为Bot前端。2026年3月10日发布百万级技能库。2026年3月8日发布以GenericAgent为核心的“政务龙虾” Dintal Claw。2026年3月1日GenericAgent被机器之心报道。2026年1月16日GenericAgent V1.0公开版本发布。快速开始方法一标准安装克隆仓库git clone https://github.com/lsdefine/GenericAgent.gitcd GenericAgent安装最小依赖pip install streamlit pywebview配置API Keycp mykey_template.py mykey.py编辑 mykey.py填入你的LLM API Key。启动python launch.pyw完整引导流程见 GETTING_STARTED.md。Bot接口可选微信Bot个人微信无需额外配置扫码登录即可pip install pycryptodome qrcode requestspython frontends/wechatapp.py首次启动会弹出二维码用微信扫码完成绑定之后可通过微信消息与Agent交互。QQ Bot使用qq - botpy WebSocket长连接无需公网webhookpip install qq - botpy在 mykey.py 中补充qq_app_id YOUR_APP_IDqq_app_secret YOUR_APP_SECRETqq_allowed_users [YOUR_USER_OPENID] # 或 [*] 公开访问python frontends/qqapp.py在QQ开放平台创建机器人获取AppID / AppSecret。首次消息后用户openid记录于 temp/qqapp.log。飞书Larkpip install lark - oapipython frontends/fsapp.pyfs_app_id cli_xxxfs_app_secret xxxfs_allowed_users [ou_xxx] # 或 [*]入站支持文本、富文本post、图片、文件、音频、media、交互卡片 / 分享卡片出站支持流式进度卡片、图片回传、文件 / media回传视觉模型图片首轮以真正的多模态输入发送给兼容OpenAI Vision的后端。详细配置见 assets/SETUP_FEISHU.md。企业微信WeCompip install wecom_aibot_sdkpython frontends/wecomapp.pywecom_bot_id your_bot_idwecom_secret your_bot_secretwecom_allowed_users [your_user_id]wecom_welcome_message 你好我在线上。钉钉DingTalkpip install dingtalk - streampython frontends/dingtalkapp.pydingtalk_client_id your_app_keydingtalk_client_secret your_app_secretdingtalk_allowed_users [your_staff_id] # 或 [*]其他App前端除默认的Streamlit Web UI外还可尝试不同风格的前端python frontends/qtapp.py # 基于Qt的桌面应用streamlit run frontends/stapp2.py # 另一种Streamlit风格UI与同类产品对比特性GenericAgentOpenClawClaude Code代码量约3000行约530000行已开源体量大-部署方式pip install API Key多服务编排CLI 订阅-浏览器控制注入真实浏览器保留登录态沙箱 / 无头浏览器通过MCP插件OS控制键鼠、视觉、ADB多Agent委派文件 终端自我进化自主生长技能和工具插件生态会话间无状态出厂配置几个核心文件 少量初始技能数百模块丰富CLI工具集工作机制GenericAgent通过分层记忆、最小工具集和自主执行循环来完成复杂任务并在执行过程中不断积累经验。分层记忆系统记忆在任务执行过程中不断沉淀使Agent逐渐形成稳定高效的工作模式。L0 — 元规则Meta RulesAgent的核心行为规则和系统约束。L1 — 记忆索引Insight Index极简索引层用于快速路由和召回。L2 — 全局事实Global Facts长期运行积累的稳定知识。L3 — 任务技能 / SOPs完成特定任务类型的可复用流程。L4 — 会话归档Session Archive从已完成任务中提炼的归档记录用于长程召回。自主执行循环感知环境状态 → 任务推理 → 调用工具执行 → 经验写入记忆 → 循环。整个核心循环仅约100行代码agent_loop.py。最小工具集GenericAgent仅提供9个原子工具构成与外界交互的基础能力工具功能code_run执行任意代码file_read读取文件file_write写入文件file_patch修改文件web_scan感知网页内容web_execute_js控制浏览器行为ask_user人机协作确认此外还有2个记忆管理工具update_working_checkpoint、start_long_term_update可让Agent跨会话积累经验、维持持久上下文。能力扩展机制具备动态创建新工具的能力。通过 code_runGenericAgent可在运行时动态安装Python包、编写新脚本、调用外部API或控制硬件将临时能力固化为永久工具。支持如果这个项目对你有帮助欢迎点一个Star同时也欢迎加入我们的GenericAgent体验交流群一起交流、反馈和共建。友情链接感谢LinuxDo社区的支持许可本项目采用MIT License详见 LICENSE。Star历史[此处可插入Star历史图表]

相关文章:

3000行代码打造可自我进化的GenericAgent框架,多场景应用超便捷!

项目简介GenericAgent是一个极简、可自我进化的自主Agent框架。其核心代码仅约3000行,借助9个原子工具和大约100行的Agent Loop,能让任意大语言模型(LLM)对本地计算机实现系统级控制,涉及浏览器、终端、文件系统、键鼠…...

编程语言性能对比

编程语言性能对比:谁才是效率之王? 在软件开发领域,编程语言的性能直接影响着程序的运行效率、资源消耗和用户体验。不同的语言因其设计理念和底层实现差异,在速度、内存管理、并发处理等方面表现迥异。本文将从执行速度、内存占…...

光纤熔接损耗到底多少算合格?0.08dB还是0.5dB?一次讲清OTDR测试背后的行业标准之争

光纤熔接损耗的合格标准解析:从理论争议到工程实践 光纤通信作为现代信息传输的基石,其性能优劣直接影响着整个通信系统的稳定性与可靠性。而在光纤施工与维护过程中,熔接损耗的评估一直是工程师们争论的焦点——0.08dB还是0.5dB?…...

如何在AWS/GCP/Azure上使用Porter快速部署Kubernetes集群:终极指南

如何在AWS/GCP/Azure上使用Porter快速部署Kubernetes集群:终极指南 【免费下载链接】porter-archive Kubernetes powered PaaS that runs in your own cloud. 项目地址: https://gitcode.com/gh_mirrors/po/porter-archive Porter是一个基于Kubernetes的PaaS…...

STM32F103RET6 + W5500 + mbedTLS 2.24 实现HTTPS访问百度保姆级教程(附完整源码)

STM32F103RET6与W5500模块实现HTTPS安全通信全流程解析 在物联网设备开发中,安全通信已成为基本要求。本文将详细介绍如何基于STM32F103RET6微控制器和W5500以太网模块,通过mbedTLS 2.24实现HTTPS安全通信的全过程。不同于简单的功能验证,我…...

Qwen3.5-9B嵌入式开发新思路:STM32项目智能代码生成

Qwen3.5-9B嵌入式开发新思路:STM32项目智能代码生成 1. 嵌入式开发的痛点与机遇 对于嵌入式开发者来说,STM32项目的开发过程往往伴随着大量重复性工作。从GPIO配置到定时器中断处理,从外设初始化到通信协议实现,这些基础代码占据…...

如何在5MB内实现CJK多语言字体支持:文泉驿微米黑的轻量化设计策略

如何在5MB内实现CJK多语言字体支持:文泉驿微米黑的轻量化设计策略 【免费下载链接】fonts-wqy-microhei Debian package for WenQuanYi Micro Hei (mirror of https://anonscm.debian.org/git/pkg-fonts/fonts-wqy-microhei.git) 项目地址: https://gitcode.com/g…...

Android ContentProvider终极指南:实现数据共享与跨应用通信

Android ContentProvider终极指南:实现数据共享与跨应用通信 【免费下载链接】coursera-android Source Code for Android Course Example Applications 项目地址: https://gitcode.com/gh_mirrors/co/coursera-android 在Android开发中,数据共享…...

STM32 RTC日历功能避坑指南:从寄存器操作到HAL库调用的正确姿势

STM32 RTC日历功能避坑指南:从寄存器操作到HAL库调用的正确姿势 在工业控制、数据记录仪等需要精确时间戳的场景中,STM32的RTC(实时时钟)模块扮演着关键角色。然而,许多开发者在初次接触RTC日历时,常会陷入…...

create-vue开发工作流优化:从项目创建到生产部署的终极指南

create-vue开发工作流优化:从项目创建到生产部署的终极指南 【免费下载链接】create-vue 🛠️ The recommended way to start a Vite-powered Vue project 项目地址: https://gitcode.com/gh_mirrors/cr/create-vue create-vue 是构建 Vite 驱动的…...

G-Helper深度解析:华硕笔记本性能调优的轻量级神器

G-Helper深度解析:华硕笔记本性能调优的轻量级神器 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Scar,…...

用QSerialPortInfo和QSerialPort打造一个跨平台的串口调试助手(Qt/C++)

用QSerialPortInfo和QSerialPort打造跨平台串口调试助手 在嵌入式开发、工业控制和物联网应用中,串口通信是最基础也最常用的通信方式之一。无论是调试单片机程序、与传感器交互还是监控设备状态,一个功能完善的串口调试工具都能极大提升开发效率。本文…...

RS485接口实战指南:从原理到组网全解析

1. RS485接口的核心原理与优势 第一次接触RS485接口时,我被它简单的两线制设计惊艳到了。这种看似简单的接口,却能在工业现场稳定传输上千米距离,背后藏着不少精妙的设计。与老旧的RS232相比,RS485采用了差分传输技术,…...

Coze实战 | 三步打造个性化知识科普短视频

1. 为什么选择Coze制作知识科普短视频? 最近两年知识类短视频爆发式增长,但很多创作者卡在了内容生产环节。传统制作流程需要经历选题、写稿、找素材、剪辑多个环节,一个3分钟视频可能耗费大半天时间。我在尝试过各种AI工具组合后&#xff0c…...

猫抓浏览器扩展:三步解锁网页媒体资源下载的终极指南

猫抓浏览器扩展:三步解锁网页媒体资源下载的终极指南 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否曾为无法下载网页中的精彩视…...

如何高效自定义parallel库Worker与进程管理:Ruby开发者的终极指南

如何高效自定义parallel库Worker与进程管理:Ruby开发者的终极指南 【免费下载链接】parallel Ruby: parallel processing made simple and fast 项目地址: https://gitcode.com/gh_mirrors/pa/parallel parallel库是Ruby生态中一款强大的并行处理工具&#x…...

Chart.js项目实战:智能写作AI系统质量监控

Chart.js项目实战:智能写作AI系统质量监控 【免费下载链接】awesome A curated list of awesome Chart.js resources and libraries 项目地址: https://gitcode.com/GitHub_Trending/awesome/awesome 在当今数字化时代,智能写作AI系统的应用日益广…...

PHP怎么合并数组_array_merge函数指南【指南】

array_merge要求所有参数为数组,传入非数组值会触发警告并返回null;数字键重排、字符串键覆盖;array_merge_recursive对同名键值自动聚合成数组;性能上为O(n2)拷贝操作。array_merge 合并空数组或非数组值会报错吗不会直接报错&am…...

破局与重构:TVA时代,如何从“救火队员”蜕变为“价值创造者”?

技术背景介绍:AI智能体视觉检测系统(TVA,全称为“Transformer-based Vision Agent”),即基于Transformer架构以及“因式智能体”创新理论的高精度视觉智能体,并非传统机器视觉软件或者早期AI视觉技术&#…...

5分钟快速上手g1:打造你的智能推理助手

5分钟快速上手g1:打造你的智能推理助手 【免费下载链接】g1 g1: Using Llama-3.1 70b on Groq to create o1-like reasoning chains 项目地址: https://gitcode.com/gh_mirrors/g1/g1 g1是一款基于Llama-3.1 70b和Groq技术构建的智能推理工具,能像…...

LSUnusedResources:快速清理Xcode项目中未使用资源的终极工具

LSUnusedResources:快速清理Xcode项目中未使用资源的终极工具 【免费下载链接】LSUnusedResources A Mac App to find unused images and resources in Xcode project. 项目地址: https://gitcode.com/gh_mirrors/ls/LSUnusedResources LSUnusedResources是一…...

终极指南:如何用免费开源工具快速制作完美LRC歌词

终极指南:如何用免费开源工具快速制作完美LRC歌词 【免费下载链接】lrc-maker 歌词滚动姬|可能是你所能见到的最好用的歌词制作工具 项目地址: https://gitcode.com/gh_mirrors/lr/lrc-maker 歌词滚动姬(LRC Maker)是一款完…...

TranslucentTB:Windows任务栏透明化与个性化定制的终极解决方案

TranslucentTB:Windows任务栏透明化与个性化定制的终极解决方案 【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB 你是否曾为Wi…...

前端数据存储方案选型

前端数据存储方案选型:如何为项目选择最佳方案 在现代前端开发中,数据存储方案的选择直接影响应用的性能、用户体验和开发效率。随着Web应用的复杂度不断提升,开发者需要根据业务需求、数据规模和安全性等因素,合理选择存储方案。…...

前端模块化的历史演变

前端模块化的历史演变:从混沌到秩序 在Web开发的早期,前端代码往往以全局变量和脚本堆叠的方式组织,随着项目规模扩大,这种模式很快暴露出命名冲突、依赖混乱等问题。模块化的概念应运而生,成为解决复杂性的关键。本文…...

数据库扩展方案

数据库扩展方案:应对海量数据挑战的利器 随着数据量的爆炸式增长,传统数据库架构面临性能瓶颈和存储压力。数据库扩展方案成为解决这一问题的关键,它通过灵活的技术手段提升数据库的处理能力,满足企业高并发、高可用的需求。无论…...

Redis可视化工具新选择 | RESP.app全面评测(2023最新版)

1. 为什么你需要一个更好的Redis可视化工具? 作为开发者,我深知直接操作Redis命令行有多痛苦。想象一下:你正在调试一个复杂的缓存结构,需要在几十个key之间来回切换,还要手动解析各种二进制数据。这种时候&#xff0c…...

7个实用mplfinance实战案例:从零构建专业交易分析系统

7个实用mplfinance实战案例:从零构建专业交易分析系统 【免费下载链接】mplfinance Financial Markets Data Visualization using Matplotlib 项目地址: https://gitcode.com/gh_mirrors/mp/mplfinance mplfinance是基于Matplotlib的金融市场数据可视化库&am…...

从Dify到Neo4j:一份给开发者的Docker容器间通信避坑指南(附Linux配置)

从Dify到Neo4j:一份给开发者的Docker容器间通信避坑指南(附Linux配置) 在微服务架构盛行的今天,Docker已成为开发者部署多服务应用的标配工具。但当你在本地开发环境或生产服务器上同时运行Dify和Neo4j时,可能会遇到一…...

如何用AutoTrain Advanced实现文本命名实体识别:从部署到知识库集成的完整指南

如何用AutoTrain Advanced实现文本命名实体识别:从部署到知识库集成的完整指南 【免费下载链接】autotrain-advanced 🤗 AutoTrain Advanced 项目地址: https://gitcode.com/gh_mirrors/au/autotrain-advanced AutoTrain Advanced是一款功能强大的…...