当前位置: 首页 > article >正文

AI PM | 我做了一个会自己进化的网站

今天早上 6 点我收到一封邮件。标题是SkillForge 每日同步完成内容很简单新增 1 个 Skill质检全部通过0 个需要人工处理。我看了一眼就关了。这封邮件我每天都会收到有时候新增十几个有时候一个没有偶尔会有几个质检不通过需要我看看。但大部分时候我什么都不用做。这个网站已经自己跑了半个月了。8 万个 Skill找不到我想要的skills.sh 是目前最大的 Claude Code Skill 目录上面有好几万个 Skill。东西是真的多但你打开试试就知道了——大多是都是英文没有分类搜索只能靠关键词硬匹配。你想找一个帮产品经理写 PRD 的 Skill搜 PRD 出来相关的搜 product manager 出来几十个长得差不多的得一个个点进去看 README 然后再翻译才知道干什么的。很难从里面找到真正适合自己的。使用 find-skills 也不够直观质量参差不齐。群里也经常有人问有没有好用的前端 Skill推荐一个写文章的 Skill每次都得靠人肉推荐。所以想法很简单做一个中文的 Skill 导航站按职业领域、技能分类。你是产品经理就看产品经理的你想用什么技能就去看对应领域的 Skill。三天后上线了。但上线只是开始。把活交给 AI然后翻车了最初的方案很朴素写个脚本每天自动抓 skills.sh 的新 Skill把 README 丢给大模型让它输出分类、中文描述、标签直接存数据库。听起来没毛病。跑了两天我就知道不行了。有个做 Kubernetes 部署自动化的 Skill模型把它分到了营销领域。我去看了下它的 README里面有一句automate your deployment pipeline模型大概把 pipeline 跟营销漏斗搞混了。我给每个 Skill 设计了一组使用前 vs 使用后的效果对比依照Skill.md\Reademe.md。这个设计到现在我还觉得是对的——用户不关心你怎么实现的只关心装上之后有什么不同。但 AI 生成的对比有些是这样的使用前类似手动分析数据 使用后类似自动分析数据还有更离谱的。一个代码审查 SkillAI 给的对比是使用前代码有 bug使用后代码没有 bug。这些问题让我意识到一件事AI 能理解内容但它的输出不可控。你不能像调函数一样用它——给输入就一定得到正确输出。所以第一版方案推翻了。不信任 AI但让 AI 互相盯着到底该怎么处理AI 不靠谱这个问题。全部手动显然不现实几千个 Skill靠人工分类写描述写到什么时候但全交给 AI 又会出上面那些问题。后来想通了一个原则代码做确定的AI 做不确定的。什么意思呢整个流程可以想象成一条流水线代码和 AI 轮流上场。先是代码干活去 skills.sh 把所有 Skill 的列表抓回来跟数据库比一下哪些是新的再把新 Skill 的说明文档下载下来。这些事情不需要动脑子规则明确代码做又快又准。然后 AI 上场拿到一个 Skill 的说明文档AI 来判断它属于 29 个领域中的哪一个写一段中文描述生成一组使用前 vs 使用后的效果对比再打几个标签。这些事情没有标准答案需要读懂内容才能做只能交给 AI。接着代码再检查一遍 AI 的输出分类结果是不是 29 个领域里的描述是不是中文效果对比的格式能不能正常显示检查通过才存进数据库不通过就打回。到这里还没完。存进去之后另一个 AI 再来审一遍。这是我踩完坑之后加的一步。一开始我让生成内容的 AI 自己检查自己的输出结果它觉得自己写的每条都挺好的。你让一个人自己改自己的作业他当然觉得没问题。所以我把生成和质检拆成了两个独立的 AI。负责生成的那个用能力更强的模型专注把描述和对比写好。负责质检的用另一个模型拿着一套检查标准逐条审核——描述跟原文档对不对得上效果对比有没有具体场景还是像手动做→自动做那种敷衍的质检不通过的第三个 AI 自动修复。但修复 AI 也有限制——它只能改描述和标签不能动效果对比。因为效果对比的质量要求高越自动改越容易跑偏不如留给我手动处理。修了之后质检 AI 再审一遍还是不行的就标记待处理等我来看。相当于一个小团队有人写、有人审、有人改、改完再审。只不过团队成员都是 AI而且互相不知道对方是谁。这套机制跑起来之后数据质量跟第一版比完全是两个东西。上线半个月我基本没管过它现在每天早上 6 点整个流程自动跑一遍。抓新数据、AI 分类和生成描述、代码校验入库、AI 质检、有问题自动修复、发邮件通知我。我定了一条铁律任何失败都必须发邮件通知不允许静默出错。 自动化最怕的不是出错是悄悄出错你不知道。跑了半个月确实没有出过坏了但我不知道的情况。除了每天的同步每周还有一轮存量质检对数据库里已有的 Skill 重新检查一遍。相当于持续保养。另外还做了一个 AI 搜索。普通搜索只能匹配关键词但用户经常用自然语言描述需求比如帮我找一个能自动写单元测试的工具。关键词匹配对这种查询束手无策。AI 搜索的思路是让模型帮用户理解需求然后挑选。但 5000 多个 Skill 的信息量太大不可能一次性全丢给模型让它挑。所以拆成了三步——先缩小范围再粗选最后精挑。第一步AI 判断用户的需求跟哪几个领域相关。写单元测试大概率跟测试和后端有关那就只看这两个领域的 Skill其他领域直接跳过。第二步从这两个领域里快速扫一遍所有 Skill 的名字挑出 30 个最可能相关的。这一步只看名字不看详细描述目的是快速缩小到一个可处理的范围。第三步把这 30 个的名字和描述都给 AI 仔细看最终精选 5-8 个推荐给用户每个都附上推荐理由。从 5000 多个到 30 个到 5 个三步漏斗每一步的工作量都是可控的。整个搜索过程几秒钟完成一个月的 API 成本大概十几块钱。上线之后有个意外收获搜索日志里能看到哪些查询返回了 0 结果。这些空搜索就是用户有需求但我数据库里没有的东西。后来做了个自动补充系统——收集这些搜索词自动去 GitHub 搜对应的项目AI 判断是不是 Skill是的话直接入库。用户的搜索需求反过来驱动数据补充又是一个自己跑的循环。它不只是在跑它在自己进化SkillForge 到现在有 5200 多个 Skill29 个领域支持中英日三语。但让我最意外的不是这些数字本身而是这些数字是怎么来的。上线的时候大概 4000 个 Skill。后面新增的这 1200 多个绝大部分不是我手动加的是系统自己找到的。不只是数据在涨用户也在涨。偶尔在推特上看到有人找 Skill顺手分享一下链接再加上群里口碑传播半个月下来 4000 多个访客1.7 万浏览量。每天的自动同步会从 skills.sh 抓新数据这是基本的。但真正有意思的是另一条线用户搜了什么、搜不到什么系统自己会去补。有人搜金融分析没有结果系统自动去 GitHub 找相关的项目AI 判断是不是 Skill是的话自动入库。下次再有人搜同样的词就能搜到了。每周的存量质检也是类似的逻辑。不是我告诉它这条描述写得不好你去改而是质检 AI 自己扫描、自己发现问题、自己修复修完再自己审一遍。回头看这些功能我发现它已经不只是自动跑了。它在自己进化。数据在变多质量在变好覆盖的需求在变广——这些都不是我在推动的是系统自己在做的。我只是偶尔看看邮件处理一下 AI 修不好的边角问题。甚至最近很火的人物蒸馏skill也是他自己找的在搜索日志中。它发现有一个关键词被反复搜索”同事”于是就回落到候选名单自己去搜一搜就搜到了然后自动走一遍流程后入库。目前人物蒸馏相关的 skill 已经 50 多个了。产品不再是你做完交付的东西而是你搭好骨架之后它自己生长的东西。传统的产品运营是这样的人工采集、人工分类、人工审核、人工发布你停下来网站就停了。你的时间被绑死在上面。但如果产品能自己跑、自己学、自己变好你的角色就变了——不是每天喂数据的运营而是搭骨架、定规则的架构师。做完一个腾出手做下一个。我在公司做的审核 Agent 也是这个思路。以后做个人项目我都会优先想一个问题这个东西做完之后能不能自己跑能不能自己变好如果不能先想想怎么让它能。依照这个思路你也能做一个能自己跑、自己进化的产品。网站地址skills.yangsir.net 往期推荐claude code skillsAI时代的产品经理AI编程效率提升Claude code全系列从小白到专家技术趋势与行业观察AI大模型热点追踪clawdbot实战与玩法飞书社群开源知识库https://my.feishu.cn/wiki/PFJswU0arip563kZbpNccWkIn0f?fromScenespaceOverview今天的文章就到这里啦如果觉得不错可以点个赞、在看、转发三连支持我扫描下方图片中我的微信二维码备注进群拉你进社群一起交流学习

相关文章:

AI PM | 我做了一个会自己进化的网站

今天早上 6 点,我收到一封邮件。 标题是"SkillForge 每日同步完成",内容很简单:新增 1 个 Skill,质检全部通过,0 个需要人工处理。 我看了一眼就关了。这封邮件我每天都会收到,有时候新增十几个…...

手把手教学:用THE LEATHER ARCHIVE快速生成高级感皮革时尚图片

手把手教学:用THE LEATHER ARCHIVE快速生成高级感皮革时尚图片 关键词:AI时尚设计、皮革穿搭、AI图片生成、时尚杂志风格、一键部署 摘要:本文详细介绍如何使用THE LEATHER ARCHIVE镜像快速生成具有高级感的皮革时尚图片。从环境准备到实际生…...

高端局!追觅电视多项首创技术斩获10+国际国内大奖,实力封神

近期,追觅电视交出亮眼业绩成绩单,全球累计出货、专利申请、国际大奖等多项数据表现突出;同时,品牌集中推出五大全球首创及首发技术,将画质、护眼、动态声擎等可感知创新落地为产品体验,完美呼应“技术业绩…...

BepInEx:如何为Unity游戏打造个性化体验的插件框架

BepInEx:如何为Unity游戏打造个性化体验的插件框架 【免费下载链接】BepInEx Unity / XNA game patcher and plugin framework 项目地址: https://gitcode.com/GitHub_Trending/be/BepInEx 你是否曾经想过为喜欢的Unity游戏添加新功能、修改界面或扩展玩法&a…...

c++如何解析二进制协议中的可选字段逻辑实现及其反序列化【进阶】

二进制协议中判断可选字段存在与否需依赖协议明确定义的存在性编码方式,如前置布尔标志位、长度前缀为0或复用保留位,不可用填零或留空;解析时须严格按协议定位起始偏移、处理对齐,并区分“字段不存在”与“解析失败”。二进制协议…...

2026年制造企业必看!工厂布局规划咨询怎么选才不踩坑?

2026年制造企业必看!工厂布局规划咨询怎么选才不踩坑?2026年,制造行业降本增效竞争愈发激烈,新建工厂投建、老厂扩产升级、流程梳理等需求倒逼企业重视工厂布局规划。但布局不合理导致的空间浪费、动线混乱、成本高企等痛点&#…...

MLX‑VLM :Mac本地跑通多模态大模型的开源项目!让图片、音频、视频理解一键上手

目录 一、MLX‑VLM到底是什么? 二、核心亮点:Mac本地多模态自由 1. 全模态支持:看、听、读全都行 2. 性能拉满:苹果芯片深度优化 1) Qwen3.5‑4B‑4bit(128k 上下文) 2) gemma‑4‑31b‑it&#xff0…...

QT+FastDDS实战:手把手教你搭建ROS2风格通信模块(附避坑指南)

QTFastDDS实战:从零构建工业级通信模块的完整指南 在智能驾驶和机器人开发领域,可靠高效的进程间通信是系统设计的核心挑战。本文将带您深入探索如何将FastDDS深度集成到QT项目中,打造一个兼具ROS2通信风格和工业级稳定性的解决方案。 1. 环境…...

基于 Patroni + etcd + HAProxy 的 PostgreSQL 高可用集群实战指南

1. 为什么需要PostgreSQL高可用集群? 数据库作为现代应用的核心组件,其稳定性直接影响整个系统的可靠性。想象一下电商大促时数据库突然宕机,或者医院系统因数据库故障无法挂号——这些场景对业务连续性要求极高。传统的主从复制方案需要人工…...

抖音批量下载终极指南:5分钟掌握无水印视频采集

抖音批量下载终极指南:5分钟掌握无水印视频采集 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖…...

手把手教你用Pollyoyo实现高级图表绘制(含PlantUML和Mermaid教程)

代码驱动图表革命:Pollyoyo深度应用指南 在数据可视化和技术文档编写领域,图表的质量和效率直接影响着信息传递的效果。传统拖拽式绘图工具虽然直观,但对于需要频繁更新、版本控制或批量生成的场景显得力不从心。这正是Pollyoyo这类代码驱动…...

GitHub汉化插件终极指南:3分钟实现GitHub中文界面的完整教程

GitHub汉化插件终极指南:3分钟实现GitHub中文界面的完整教程 【免费下载链接】github-chinese GitHub 汉化插件,GitHub 中文化界面。 (GitHub Translation To Chinese) 项目地址: https://gitcode.com/gh_mirrors/gi/github-chinese 还在为GitHub…...

如何无线地将照片从 iPhone 传输到 PC?

我们经常在 iPhone 上存储大量照片,将它们传输到电脑是备份照片并释放 iPhone 空间的好方法。通常,你会使用 USB 数据线将 iPhone 连接到电脑进行传输。但是,如果你没有 USB 数据线,或者你的电脑无法识别你的 iPhone,该…...

保姆级教程:用Python和OpenCV同时录制RealSense D435i的深度、彩色、红外和IMU数据流

RealSense D435i多模态数据采集实战:从环境配置到自动化脚本的全流程指南 当你第一次拿到RealSense D435i这款强大的深度感知设备时,可能会被它丰富的传感器阵列所震撼——RGB摄像头、立体红外摄像头、深度传感器以及惯性测量单元(IMU)的集成&#xff0c…...

数字孪生赋能智慧校园:三维可视化运维检测平台的创新实践

1. 数字孪生如何重塑智慧校园管理 第一次看到浙江工商大学的数字孪生校园平台时,我完全被震撼到了——整个校园的每栋建筑、每条道路甚至每棵树都以三维形式精确还原在屏幕上,实时数据像血液一样在虚拟校园中流动。这种技术正在彻底改变传统校园管理模式…...

医学影像预处理还有必要吗?从APTOS2019看端到端模型如何‘吃掉’传统步骤

医学影像预处理:从手工优化到端到端学习的范式迁移 在Kaggle APTOS2019糖尿病视网膜病变检测竞赛中,一个有趣的现象引发了计算机视觉领域的讨论:冠亚军团队均未采用传统图像预处理流程。这与2015年同类型竞赛中Ben Graham团队依赖精心设计的预…...

纽约出租车2022年1月-8月完整数据集分析报告-包含黄色出租车绿色出租车全量数据-地理空间信息-时间分布-支付类型分布-交通模式研究-算法训练数据

纽约出租车2022年1月-8月数据集分析报告 引言与背景 纽约市的出租车数据是研究城市交通模式、出行行为和经济活动的重要资源。本数据集包含了2022年1月和8月的黄色出租车和绿色出租车的完整运营记录,以及详细的地理空间信息。这些数据不仅对于交通规划、城市管理和…...

Python Tkinter如何实现组件隐藏与显示_利用pack_forget管理布局

pack_forget() 并未销毁组件,仅临时移除布局;组件对象、事件绑定和属性均保持有效,与 destroy() 的不可逆性有本质区别。pack_forget 后组件真的“消失”了吗?不是销毁,只是从布局管理器中临时移除;组件对象…...

Google Core Web Vitals(核心网页指标)

一、核心三大指标 (Core Web Vitals)1. LCP (Largest Contentful Paint) - 最大内容绘制:含义: 页面中最大的可见内容(如主图、大标题、视频)加载完成并渲染出来的时间。它代表了用户认为“主要内容已加载”的时刻。 目标&#xf…...

Mac option+command+方向键失效问题

optioncommand方向键失效问题 查看mac设置里的调度中心是否设置成功-看看SB网易云是不是有占用快捷键, 把这里的全局快捷键取消掉...

破局35岁:软件测试工程师的职业突围指南

被折叠的黄金十年当自动化脚本以毫秒级速度执行完上千条测试用例,当AI模型开始自动生成边界值分析报告,35岁的软件测试工程师站在技术洪流与职业周期的交汇点。行业数据显示,2025年测试岗位的AI工具渗透率已达67%,而35岁以上从业者…...

10分钟训练AI歌手:Retrieval-based Voice Conversion技术完全指南

10分钟训练AI歌手&#xff1a;Retrieval-based Voice Conversion技术完全指南 【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrieval-based-Vo…...

讯飞有个妹子中了1000万大乐透

讯飞有个妹子中了1000万大乐透。怎么看都不对。&#xff08;1&#xff09;一会说1000万&#xff0c;一会又说1500万。 &#xff08;2&#xff09;离职“不要奖金”基本不可能&#xff0c;这中奖税后也几百万起&#xff0c;不可能立马辞职。 &#xff08;3&#xff09;兑奖、辞职…...

文档解析新选择:Youtu-Parsing双并行加速,快速处理大量文档

文档解析新选择&#xff1a;Youtu-Parsing双并行加速&#xff0c;快速处理大量文档 1. 引言&#xff1a;文档解析的痛点与解决方案 每天&#xff0c;我们都在与各种文档打交道——学术论文、商业合同、财务报表、技术文档。这些文档往往包含复杂的元素&#xff1a;文字、表格…...

AI驱动的运维智能监控:从理论到实践

AI驱动的运维智能监控&#xff1a;从理论到实践 一、AI驱动运维的核心概念 1.1 AI在运维中的应用价值 AI驱动的运维智能监控是指利用人工智能技术提升运维效率和系统可靠性的方法。其核心价值包括&#xff1a; 智能异常检测&#xff1a;自动识别系统异常和潜在问题预测性维护&a…...

体系结构论文(110):MAGE: A Multi-Agent Engine for Automated RTLCode Generation

MAGE: A Multi-Agent Engine for Automated RTL Code Generation 【DAC25】 文章想解决什么问题 现有 LLM 自动写 RTL 的主要问题&#xff0c;不是“能不能生成”&#xff0c;而是生成结果往往语法能过&#xff0c;但功能不一定对。尤其 RTL 设计涉及 Verilog 本体、testbench、…...

三伍微Wi-Fi射频前端芯片全解析:从GaAs/SOI开关到IoT FEM的国产替代方案

1. 三伍微Wi-Fi射频前端芯片的技术突围 在智能家居和物联网设备爆发的今天&#xff0c;Wi-Fi射频前端芯片就像无线信号的"交通警察"&#xff0c;负责指挥数据流的收发和功率调节。三伍微的国产化方案用GaAs&#xff08;砷化镓&#xff09;和SOI&#xff08;绝缘体上硅…...

数据库高可用与灾备方案:从设计到实现

数据库高可用与灾备方案&#xff1a;从设计到实现 一、数据库高可用的核心概念 1.1 高可用的定义与重要性 数据库高可用性是指数据库系统在面对各种故障和挑战时&#xff0c;能够持续提供服务的能力。高可用对于企业级应用至关重要&#xff1a; 业务连续性&#xff1a;确保核心…...

AI工具爱毕业(aibiye)帮助用户高效复现数学建模论文,并优化排版效果

还在为论文写作头痛&#xff1f;特别是数学建模的优秀论文复现与排版&#xff0c;时间紧、任务重&#xff0c;AI工具能帮上大忙吗&#xff1f;今天&#xff0c;我们评测10款热门AI论文写作工具&#xff0c;帮你精准筛选最适合的助手。 aibiye&#xff1a;专注于语法润色与结构…...

爱毕业(aibiye)提供AI驱动的数学建模论文复现和智能排版解决方案

还在为论文写作头痛&#xff1f;特别是数学建模的优秀论文复现与排版&#xff0c;时间紧、任务重&#xff0c;AI工具能帮上大忙吗&#xff1f;今天&#xff0c;我们评测10款热门AI论文写作工具&#xff0c;帮你精准筛选最适合的助手。 aibiye&#xff1a;专注于语法润色与结构…...