当前位置: 首页 > article >正文

【卷卷观察】GitHub Star 造假产业链,以及它是怎么变成 AI 圈融资货币的

结论先说GitHub Trending 上的高星项目有相当比例的星是买来的。这不是小范围的作弊是一个成熟的、面向 VC 融资市场的地下经济。而且 AI 项目是重灾区。上周看到一条 Twitter大意是GitHub Trending 上的项目40% 的 star 是买的你信吗我信。不是因为我对开源社区失望是因为我见过太多这类游戏的玩法——这个世界上但凡有一个指标被广泛认可为成功信号就一定会有人花钱去买它。GitHub star 就是这样。研究数据六百万个假 starAI 项目是重灾区这个结论不是哪个博主拍脑袋得出的是 CMU、NC State 和 Socket 三家联合做的学术研究用的工具叫 StarScout分析了 2019 到 2024 年间 67 亿条 GitHub 事件和 3.26 亿个 star。论文发表在 ICSE 2026是软件工程领域的顶会。结论大约六百万个疑似假 star来自约 30 万个账号分布在 18617 个仓库里。到了 2024 年 7 月50 星以上的仓库里有 16.66% 涉及假 star 活动——而 2022 年之前这个比例接近零。也就是说这事不是一直都有的是 2023 年开始规模化2024 年彻底失控的。最讽刺的一个数据研究里发现了 78 个被检测到假 star 活动的仓库成功登上了 GitHub Trending。平台自己的推荐算法被假货骗了——买的 star 越多Trending 排名越高自然流量越大真实 star 越多。这是个自我强化的循环起点是钱不是代码质量。一条成熟的地下产业链这个产业链的成熟程度超过我的预期。有专职网站卖 starSocialPlug.io、Buy.fans、Boost-Like.store、GitHubPromoter.com、Vurike.com……至少十二个活跃平台明码标价。Fiverr 上有 24 个合法 gig 在卖 GitHub 推广甚至有德国注册公司 GitHub24Moller und Ringauf GbR公开经营收费 0.85 欧元一个 star承诺一个月后全部存活。定价体系也分层了低级一次性账号$0.03-$0.10/个几天内交付全新空账号中级有历史记录$0.20-$0.50/个一到两周交付有一定活跃历史高级老账号$0.80-$0.90/个渐进式交付账号有多年的活跃记录和真实项目高级账号的意思是你拿到的是看起来完全正常的 GitHub 账号有多年的提交记录有自己的项目有真实的社交关系。VC 就是被这种看起来很正常的账号骗过去的。Star 怎么变成了融资货币问题来了谁在买为什么买VC 们真的在看 star 数量。Redpoint 投资的一个数据他们在 seed 轮看项目时star 数量的中位数是 2850 个。有些 VC 直接写爬虫抓 GitHub Trending 上增长最快的仓库写进自己的 deal sourcing 流程。Star 高 项目热 值得看。这是很多投资人的筛选逻辑。一个 GitHub star 最低 $0.06。一个 seed 轮融资 $1M 到 $10M。这个数学太清楚了你花 $500 买 star上了 Trending获得了自然流量和曝光如果因此拿到一个 $2M 的 seed这个 ROI 是 400 倍。研究里特别指出AI 和 LLM 相关仓库是假 star 的最大非恶意接收方。什么意思这些项目不是存心想去骗钱但它们的 star 里掺了最多的假货。原因也不复杂AI 赛道的项目天然缺乏其他 legitimacy 信号。一个做 AI 的新项目没有收入、没有用户数据、没有老牌投资机构背书GitHub star 是少数几个可以快速获得的证明之一。所以 AI 项目买 star 的动机最强AI 项目也是假 star 产业最大的客户群。GitHub 自己知道吗知道。研究者用 StarScout 标记的仓库GitHub 后来删了 90.42%标记的账号删了 57.07%。说明平台自己也认这个检测结果也在清理。但清理的速度永远追不上产业链成熟的速度。买 star 的需求就摆在那里供给侧有专业的服务商有分级定价体系有售后存活承诺。这是一个完全合规的地下市场——它不违法因为 GitHub 的服务条款里没有禁止给自己买 star至少在研究发表的 2026 年初还没有明文规定。对 AI 圈的影响如果你现在在评估一个 AI 项目看到它有 5000 star你可能需要重新校准你的判断基准。按照研究的分布AI 项目平均掺假比例可能相当高。不是说 star 高的 AI 项目都是假的而是说GitHub star 作为项目质量的信号在 AI 赛道已经开始系统性失真了。这对投资人的尽调提出了新的要求不能只看 star 数量要看 star 的质量——账号年龄、提交频率、issue 互动、真实的代码贡献者。但这些数据都在 GitHub 上谁来做一个可信的star 质量评分同时这个现象也揭示了一个更深层的问题AI 领域的评估体系还没有建立起来。大家还在用 GitHub star 这种粗糙的指标是因为没有更好的替代品。Star 的问题不是它被买走了是整个行业在用错误的指标评估 AI 项目——Star 只是这个问题的症状。最后说一句这件事最让我有感触的不是造假本身是造假的激励结构。GitHub star 这个指标本来是给开发者用的——看看哪些项目被同行认可。但当 VC 开始把 star 作为 sourcing 信号的那一刻这个指标的目标函数就变了。开发者想要 star 是因为同行认可VC 们想要 star 是因为它代表项目热度两种需求的叠加把一个纯粹的技术指标变成了融资工具。指标被工具化的速度永远快于监管反应的速度。GitHub 现在清理也好VC 们开始警觉也好都是事后补救。真正的问题在于什么时候 AI 领域才能建立起真正有效的评估体系不是靠 star不是靠 paper 引用数而是真正能反映项目价值和团队能力的信号。这个问题没有简单的答案。但至少从现在开始看到高 star 的 AI 项目心里要打个折扣。

相关文章:

【卷卷观察】GitHub Star 造假产业链,以及它是怎么变成 AI 圈融资货币的

结论先说:GitHub Trending 上的高星项目,有相当比例的星是买来的。这不是小范围的作弊,是一个成熟的、面向 VC 融资市场的地下经济。而且 AI 项目是重灾区。上周看到一条 Twitter,大意是:"GitHub Trending 上的项…...

Dify金融问答合规配置实战指南:从0到1通过银保监AI问答备案的7个关键配置项

第一章:Dify金融问答合规配置的监管背景与备案逻辑近年来,金融领域人工智能应用加速落地,监管框架同步趋严。《生成式人工智能服务管理暂行办法》《金融行业大模型应用安全指引(试行)》及《银行保险机构数据安全管理办…...

Magnet2Torrent高效转换指南:磁力链接永久保存的智能解决方案

Magnet2Torrent高效转换指南:磁力链接永久保存的智能解决方案 【免费下载链接】Magnet2Torrent This will convert a magnet link into a .torrent file 项目地址: https://gitcode.com/gh_mirrors/ma/Magnet2Torrent 你有没有这样的经历?辛辛苦苦…...

二、linux目录编辑

二、linux目录编辑1.指令1.1echo基本语法echo 【选项】 【字符串/变量】重定向:把默认输出的方向进行修改>>:重定向追加 >:重定向覆盖例子:以追加的方式将“abc”写入index.html文件中echo "abc" >> index.html进阶案例&#x…...

2026届学术党必备的降重复率方案推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 知网 AI 检测系统,在学术审查这个领域,已经获得了广泛的运用。为了切…...

图的基本遍历DFS与BFS

1. 引言 图是一种非常重要的数据结构,广泛应用于社交网络、地图导航、网页链接分析等领域。图的遍历是最基础的操作之一,主要有两种方式: 深度优先搜索 (Depth First Search, DFS) —— 沿着一条路径走到底,再回溯。广度优先搜索 …...

Dify如何通过合规配置规避AI幻觉导致的销售误导?监管处罚案例倒推的4层校验机制

第一章:Dify如何通过合规配置规避AI幻觉导致的销售误导?监管处罚案例倒推的4层校验机制在金融、保险及SaaS销售场景中,AI生成话术若未经严格约束,极易因幻觉输出虚构产品条款、夸大收益或隐瞒免责条件,引发监管处罚。2…...

别再只调printf了!手把手教你用HI3861的UART1和PC串口助手通信(附完整代码)

HI3861实战:从日志打印到双向通信的UART1深度开发指南 在物联网设备开发中,UART串口通信就像设备间的"普通话"——简单、通用且无处不在。但很多开发者对它的认知停留在printf调试阶段,这就像只学会了用"你好"打招呼&…...

2026届必备的AI科研助手推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 人工智能在帮人们写论文这事上,已然成了做学术时很重要的工具,它的关…...

Nginx配置踩坑实录:从403 Forbidden到优雅重定向,我的半天调试经历

Nginx配置踩坑实录:从403 Forbidden到优雅重定向的调试之旅 那天下午的阳光透过窗户斜射进来,我正对着屏幕上那个刺眼的403 Forbidden错误发呆。这已经是第三次部署Vue项目时遇到这个问题了——明明本地开发环境一切正常,为什么一到Nginx就频…...

从轨迹抖动到稳定抓取:MuJoCo物理仿真中的三大核心挑战与解决方案

从轨迹抖动到稳定抓取:MuJoCo物理仿真中的三大核心挑战与解决方案 【免费下载链接】mujoco Multi-Joint dynamics with Contact. A general purpose physics simulator. 项目地址: https://gitcode.com/GitHub_Trending/mu/mujoco 你是否曾在机械臂控制中遇到…...

Gin:自定义日志、验证器与中间件全指南

前言在使用 Gin 开发 Web 服务时,默认的功能已经能覆盖大部分场景,但在生产环境中我们往往需要更精细的控制——比如定制日志格式以便于 ELK 采集、增加业务专属的参数校验规则、或者编写通用的请求拦截中间件。Gin 本身提供了非常优雅的扩展机制&#x…...

新消费进入下半场:情绪消费成为新的增长引擎

如果把过去几年新消费的发展放在一条时间线上看,会有一个很明显的分水岭。前一阶段,品牌增长主要靠三件事:渠道红利、流量效率、供应链能力。谁更快铺渠道,谁更会投放,谁更能把成本打下来,谁就更容易跑出来…...

Degrees of Lewdity中文汉化版:完整安装指南与终极教程

Degrees of Lewdity中文汉化版:完整安装指南与终极教程 【免费下载链接】Degrees-of-Lewdity-Chinese-Localization Degrees of Lewdity 游戏的授权中文社区本地化版本 项目地址: https://gitcode.com/gh_mirrors/de/Degrees-of-Lewdity-Chinese-Localization …...

MATLAB代码:双层优化微电网系统规划设计方法——多电源容量优化配置与最佳运行策略研究

MATLAB代码:基于双层优化的的微电网系统规划设计方法 关键词:双层优化 容量配置 参考文档:《基于双层优化的的微电网系统规划设计方法》基本复现 仿真平台:MATLABCPLEX 与目前大部分的微网优化调度代码不同,本代码主…...

[特殊字符] Meixiong Niannian画图引擎效果实测:1024×1024输出在印刷级DPI下的表现

Meixiong Niannian画图引擎效果实测:10241024输出在印刷级DPI下的表现 1. 项目概述 Meixiong Niannian画图引擎是一款专为个人GPU设计的轻量化文本生成图像系统。该系统基于Z-Image-Turbo底座,深度融合了Niannian专属Turbo LoRA微调权重,针…...

Cadence Allegro 17.4 建库避坑指南:从PAD丢失到Pin One属性,新手常踩的5个雷

Cadence Allegro 17.4 建库避坑指南:从PAD丢失到Pin One属性,新手常踩的5个雷 刚接触Cadence Allegro的硬件工程师,在建库过程中总会遇到各种"坑"。这些看似简单的问题,往往让人耗费数小时却找不到解决方案。本文将针对…...

手把手教你用网线搞定华为S5735S交换机堆叠(iStack实战避坑)

华为S5735S交换机零成本堆叠实战:用网线搭建高可靠网络 在中小企业网络升级过程中,端口扩展和链路冗余往往是刚需,但专用堆叠模块和光模块的高成本常常让预算有限的网管望而却步。华为S5735S系列交换机支持通过普通以太网电口(即R…...

SeanLib系列函数库-MyTimer

查看其它库函数说明,请点击此处跳转到SeanLib主页 1. 本篇内容 本篇讲MyTimer,是一个轻量级的软件定时器/计数器库,基于链表实现,支持动态创建和销毁定时器。适用于嵌入式系统(如 STM32、AVR、ESP32 等平台&#xff…...

VS2019下OpenCV C++环境配置保姆级教程(附4.4.0版本动态库文件清单)

VS2019与OpenCV C环境配置:从避坑到精通的完整指南 在计算机视觉开发领域,OpenCV无疑是最受欢迎的库之一。然而对于刚接触C开发的初学者来说,配置开发环境往往成为第一道门槛。本文将深入剖析VS2019下OpenCV C环境配置的关键细节,…...

图论——拓扑排序(python)

思路:统计节点的入度,将入度为0的节点放入队列中,循环出队。对于出队元素,找到它指向的所有元素,将所指向的元素的入度减一。#拓扑排序 from collections import deque def topologicalOrder(graph,indegree,n):qdeque…...

训练时train loss和val loss的‘爱恨情仇’:从曲线看懂模型到底在干嘛(附调参实战)

训练时train loss和val loss的‘爱恨情仇’:从曲线看懂模型到底在干嘛(附调参实战) 盯着训练日志里两条纠缠不清的loss曲线,是不是像在看一场情感大戏?train loss像热情似火的追求者,val loss则像若即若离的…...

保姆级教程:用VMware Workstation Pro搭建CFS三层靶场(附宝塔面板配置与网络排错)

零基础搭建CFS三层靶场:从VMware配置到宝塔面板全攻略 在网络安全学习过程中,环境搭建往往是新手遇到的第一个"拦路虎"。很多初学者满怀热情下载了靶机镜像,却在VMware网卡配置、IP设置、服务访问等环节频频受阻,最终连…...

树莓派PICO的‘Hello World’:用MicroPython和Thonny让板载LED闪起来(含代码详解)

树莓派PICO的‘Hello World’:用MicroPython和Thonny让板载LED闪起来(含代码详解) 当你第一次拿到树莓派PICO这块小巧的开发板时,最令人兴奋的莫过于让它"活"起来——而让板载LED闪烁就是嵌入式世界的"Hello World…...

Dify企业权限配置避坑指南(2024最新LTS版实测):92%团队踩过的5个ACL配置陷阱全复盘

第一章:Dify企业级权限管控配置概览Dify 作为开源大模型应用开发平台,其企业版提供了细粒度、可扩展的权限管控体系,覆盖组织、团队、应用、数据集及知识库等多个维度。权限模型基于 RBAC(基于角色的访问控制)设计&…...

深入理解传输中二层PW和三层BFD之间的关系

这段输出已经把 PW BFD 的关系展示得比较典型了,可以直接帮你把结构“还原出来”。一、先看 PW(业务层) 命令: show mpls l2transport vc vl1关键结果: DestAddress: 3.13.77.14 VCID: 32008578 Status: up S VCI…...

通过dis dev pic看板卡的门道

这个命令: display device pic-status是查看设备 PIC 板卡(接口子卡)运行状态 的,用来确认板卡是否识别正常、初始化是否成功、端口逻辑状态是否正常。一、命令作用 display device pic-status查看内容: 设备各槽位接口…...

EF Core 10 + ChromaDB/Weaviate双模式接入方案(轻量嵌入式vs分布式向量库),企业级选型决策树首次披露

第一章:EF Core 10 向量搜索扩展的核心定位与演进脉络EF Core 10 向量搜索扩展并非孤立的功能补丁,而是微软在 .NET 生态中构建 AI 原生数据访问层的关键落子。它将传统关系型查询能力与现代向量相似性检索深度融合,使开发者能在同一 ORM 抽象…...

PolarloTS个人挑战赛第一季 个人WP

简单locke-treasure逆向狂喜void __fastcall decrypt_flag_to_buf(const unsigned __int8 *enc,int enc_len,const char *key,char *out_buf,int out_buf_len) {int key_len; // [rsp24h] [rbp4h]int i; // [rsp44h] [rbp24h]j___CheckForDebuggerJustMyCode(&_68090DB3_ca…...

别再只盯着压差了!手把手教你从PSRR、噪声到环路补偿,全面评估一颗LDO芯片

从PSRR到环路稳定性:LDO芯片的深度评估指南 在电子系统设计中,低压差稳压器(LDO)的选择往往被简化为"压差越低越好"的单一标准。这种认知偏差导致许多工程师在电源设计上踩坑——噪声干扰、系统振荡、效率低下等问题频发。本文将打破常规认知框…...