拓展 Coco AI 功能 - 智能检索 Hexo 博客
在之前的文章中,我们成功让 Coco AI 检索 Hugo 博客,这对于博客作者来说是一大福音。然而,从 Hexo 迁移到 Hugo 的成本不容小觑,毕竟大多数开发者对 Node.js 更熟悉,而 Golang 相对陌生。那么,既然 Coco AI 官方尚未支持 Hexo,是否有办法让它兼容 Hexo 呢?
当然可以!💡 既然 Coco AI 依赖的是 Hugo 生成的 index.json 进行检索,那我们干脆在 Hexo 中实现 相同结构的 index.json,这样就可以直接复用 Hugo 的数据结构,避免字段不兼容导致的潜在 Bug。
接下来,我们将从 0 到 1 实现 Hexo 的智能检索功能! 🚀
📌 1. 安装 Hexo 并切换到 Next 主题
首先,我们需要安装 Hexo 并设置 Next 主题。
安装 Hexo
pnpm install -g hexo-cli
hexo init my-blog
cd my-blog
pnpm install
启动本地服务器:
pnpm hexo s
访问 http://localhost:4000/,确保 Hexo 站点运行正常。
安装 Next 主题
pnpm add hexo-theme-next
修改 _config.yml:
theme: next
然后运行:
pnpm hexo clean && pnpm hexo s
访问 http://localhost:4000/,确认 Next 主题已生效。
📌 2. 安装 hexo-generator-json-content
我们需要安装 JSON 生成插件,用于输出博客文章数据:
pnpm add hexo-generator-json-content
这些添加到 _config.yml,确保 Hexo 生成完整的 JSON 数据:
jsonContent:meta: falsepages: falseposts:title: truedate: truepath: falsepermalink: trueexcerpt: truecontent: truecategories: truetags: true
运行:
pnpm hexo clean && pnpm hexo generate
然后检查 public/index.json:
cat public/index.json
此时 JSON 已经生成,但 url 不是 Hugo 风格的,我们需要进一步优化。
**📌 3. 自定义 index.json **
默认情况下,Hexo 不会生成 /YYYY/MM/DD/slug/ 格式的 URL,因此我们需要手动调整。
📌 创建 scripts/generate_index_json.js
在 Hexo 站点目录 下,创建 scripts/generate_index_json.js:
hexo.extend.generator.register("index_json", function (locals) {let posts = locals.posts.sort("-date").map(post => {let category = post.categories && post.categories.length > 0 ? post.categories.data[0].name : null;let subcategory = post.categories && post.categories.length > 1 ? post.categories.data[1].name : null;let tags = post.tags ? post.tags.map(tag => tag.name) : null;// 解析发布日期let date = post.date;let formattedDate = `${date.year()}/${String(date.month() + 1).padStart(2, "0")}/${String(date.date()).padStart(2, "0")}`;// 生成 Hugo 风格 URL: `/YYYY/MM/DD/slug/`let postUrl = `/${formattedDate}/${post.slug || post.title.replace(/\s+/g, "-").toLowerCase()}/`;return {category: category,subcategory: subcategory,content: post.content.replace(/(<([^>]+)>)/gi, ""), // 去除 HTML 标签created: post.date.toISOString(),updated: post.updated ? post.updated.toISOString() : post.date.toISOString(),lang: "en", // 你可以修改为动态语言检测summary: post.excerpt || post.content.substring(0, 150) + "...",tags: tags,title: post.title,url: postUrl // 确保符合 Hugo 格式};});return {path: "index.json",data: JSON.stringify(posts, null, 2)};
});
📌 4. 重新生成 index.json
运行:
pnpm hexo clean && pnpm hexo generate
然后检查 public/index.json:
cat public/index.json
你应该会看到 JSON 变成:
[{"category": "Technology","subcategory": "Web Development","content": "This is a test post.","created": "2025-03-20T12:00:00+08:00","updated": "2025-03-20T12:00:00+08:00","lang": "en","summary": "This is a test post.","tags": ["Hexo", "Static Site"],"title": "Hello World","url": "/2025/03/20/hello-world/"}
]
✅ 成功让 URL 变成 /YYYY/MM/DD/slug/ 格式!

📌 5. 让 Coco AI 识别 Hexo 博客
既然 index.json 已经生成,我们可以像 Hugo 那样,在 Coco AI 里添加 Hexo 博客的检索。
在 Coco AI 里,点击 添加 Hugo Site,然后输入:
http://host.docker.internal:4000/index.json
如果想测试数据同步,我们可以修改同步时间为 1 秒,以便实时观察更新情况。

📌 6. 观察数据同步情况
过了一会,我们可以在 Coco AI 界面看到博客数据已经同步,但前提是需要先添加模型! ✅
Coco AI 的 KNN(近邻搜索) 会按照相关性对内容进行智能排序,使检索更高效!

🎯 总结
| 步骤 | 命令 |
|---|---|
| 安装 Hexo 并切换到 Next 主题 | pnpm install -g hexo-cli && hexo init my-blog |
安装 hexo-generator-json-content | pnpm add hexo-generator-json-content |
修改 _config.yml | 让 Hexo 生成 index.json |
创建 scripts/generate_index_json.js | 确保 URL 变成 Hugo 风格 |
| 生成 JSON | pnpm hexo clean && pnpm hexo generate |
| 在 Coco AI 里添加 Hexo 站点 | 输入 http://host.docker.internal:4000/index.json |
🚀 结论
🎉 通过本教程,你已经成功:
✅ 让 Coco AI 兼容 Hexo 博客,实现智能检索
✅ 复用 Hugo 的 index.json 结构,避免迁移成本
✅ 让 URL 变成 /YYYY/MM/DD/slug/ 以适配 Hugo Connector
✅ 在 Coco AI 里成功同步 Hexo 博客数据,并进行智能查询
💡 现在,你可以愉快地使用 Hexo + Coco AI 进行智能检索了!如果有 更多定制需求(如 author、word count),可以继续优化 generate_index_json.js!🔥🚀
相关文章:
拓展 Coco AI 功能 - 智能检索 Hexo 博客
在之前的文章中,我们成功让 Coco AI 检索 Hugo 博客,这对于博客作者来说是一大福音。然而,从 Hexo 迁移到 Hugo 的成本不容小觑,毕竟大多数开发者对 Node.js 更熟悉,而 Golang 相对陌生。那么,既然 Coco AI…...
爬虫基础之爬取猫眼Top100 可视化
网站: TOP100榜 - 猫眼电影 - 一网打尽好电影 本次案例所需用到的模块 requests (发送HTTP请求) pandas(数据处理和分析 保存数据) parsel(解析HTML数据) pyecharts(数据可视化图表) pymysql(连接和操作MySQL数据库) lxml(数据解析模块) 确定爬取的内容: 电影名称 电影主演…...
ffmpeg库视频硬解码使用流程
FFmpeg 的硬解码(Hardware Decoding)通过调用 GPU 或专用硬件的编解码能力实现,能显著降低 CPU 占用率。 一、FFmpeg 支持的硬件解码类型 FFmpeg 原生支持多种硬件加速类型,具体由 AVHWDeviceType 定义,包括&…...
LS-NET-006-思科MDS 9148S 查看内存
LS-NET-006-思科MDS 9148S 查看内存 方法一:使用 show version 命令 该命令可显示设备的基本系统信息,包括内存总量。 登录交换机的CLI(通过控制台或SSH连接)。输入命令: show version 在输出中查找类似以下内容…...
小程序API —— 54 路由与通信 - 编程式导航
在小程序中实现页面的跳转,有两种方式: 声明式导航:navigator 组件编程式导航:使用小程序提供的 API 编程式导航 API 提供了五个常用的 API 方法: wx.navigateTo():保留当前页面,跳转到应用内…...
关于金融开发领域的一些专业知识总结
目录 1. 交易生命周期 1.1 证券交易所 1.1.1 交易前 1) 订单生成(Order Generation) 2) 订单管理(Order Management) 1.1.2 交易执行 3) 交易匹配(Trade Matching) 1.1.3 交易后 4) 交易确认&…...
使用 `pytest` 框架时,可以通过极限封装将 YAML 文件的读取、解析
在使用 pytest 框架时,可以通过极限封装将 YAML 文件的读取、解析和测试用例的通用逻辑封装成共享的方法或 fixture,从而减少重复代码。以下是详细的实现步骤和示例。 1. 封装 YAML 文件读取和解析 将 YAML 文件的读取和解析逻辑封装到一个工具函数中,供所有测试用例调用。…...
蓝桥杯练习day3:反转字符串
一、题意 写一个函数,其作用是将输入的字符串反转过来。输入字符串以字符数组 s 的形式给出。 不要给另外的数组分配额外的空间,你必须原地修改输入数组、使用 O(1) 的额外空间解决这一问题。 示例 1: 输入:s [“h”,“e”,“…...
DeepSeek-R1深度解读
deepseek提出了一种通过强化学习(RL)激励大语言模型(LLMs)推理能力的方法,个人认为最让人兴奋的点是:通过RL发现了一个叫“Aha Moment”的现象,这个时刻发生在模型的中间版本中。在这个阶段&…...
15-双链表-双链表基本操作
题目 来源 827. 双链表 - AcWing题库 思路 此题我只想说,千万千万别漏了头结点和尾结点,不然根本查不出来是哪里出了问题,因为传入的k会有问题;最左边插入,相当于是在头结点的右边插入(也就是0号节点的右…...
正则表达式详解(regular expression)
💡 正则表达式(Regular Expression, regex)知识点总结 💡 正则表达式是一种用于匹配字符串的模式,广泛用于搜索、替换、验证等操作。 📌 正则表达式的主要作用 1️⃣ 字符串匹配 🧐 检查一个…...
经典面试题:C/C++中static关键字的三大核心作用与实战应用
一、修饰局部变量:改变生命周期,保留跨调用状态 核心作用: 延长生命周期:将局部变量从栈区移至静态存储区(数据段或BSS段),生命周期与程序一致保留状态:变量在函数多次调用间保…...
笔记:代码随想录算法训练营day57:99.岛屿数量 深搜、岛屿数量 广搜、100.岛屿的最大面积
学习资料:代码随想录 注:文中含大模型生成内容 99. 岛屿数量 卡码网题目链接(ACM模式) 先看深搜方法:找到未标标记过的说明找到一片陆地的或者一片陆地的一个角落,dfs搜索是寻找相连接的陆地其余部分并…...
【小也的Java之旅系列】01 分布式、集群、微服务的区别
前言 做Java开发多年,一直以来都有想把Java做成一个系列的想法,最近整理自己的笔记发现有很多值得写的内容,但这些内容又往往杂乱不堪。CSDN上有很多高质量的Java博客,但大多不是从一个人成长的角度去写的。而我们——一个技术人…...
基于视觉的核桃分级与套膜装置研究(大纲)
基于视觉的核桃分级与套膜装置研究:从设计到实现的完整指南 (SolidWorks、OpenCV、STM32开发实践) 🌟 项目背景与目标 1.1 为什么选择视觉分级与套膜? 产业痛点: 中国核桃年产量全球第一,但…...
JimuReport与deepseek结合,颠覆现有BI模式
在数字化转型的浪潮中,企业对数据的依赖程度越来越高,如何高效地分析和利用数据成为关键。JimuReport凭借其强大的报表设计能力和灵活的数据处理功能,已经成为众多企业的首选工具。如今,它即将与DeepSeek深度结合,为企…...
大白话详细解读函数之柯里化
1. 函数柯里化是什么? 函数柯里化是一种将多参数函数转换成一系列单参数函数的技术。简单来说,就是把一个接收多个参数的函数,变成每次只接收一个参数,并返回一个新函数,直到所有参数都接收完毕,最后返回结…...
11、STL中的set使用方法
一、了解 set 是 C 标准模板库(STL)中提供的有序关联容器之一。基于红黑树(Red-Black Tree)实现,用于存储一组唯一的元素,并按照元素的值进行排序。 set的特性 唯一性 键是唯一的。无重复。 有序性 按升序…...
git 子模块的使用
1. 子模块的核心概念 独立性:子模块是一个独立的 Git 仓库,有自己的提交历史和分支。 指针机制:主仓库仅记录子模块的特定提交(而不是分支),确保代码版本可控。 适用场景:依赖第三方库、多项目…...
vsftpd服务权限配置
主配置文件:/etc/vsftpd/vsftpd.conf anonymous_enableYES #是否启用匿名用户 no_anon_passwordYES #匿名用户login时不询问口令 anon_upload_enableyes | no # 匿名用户对文件(非目录)上传权限。 anon_world_readable_onlyyes | …...
遥感数据获取、处理、分析到模型搭建全流程学习!DeepSeek、Python、OpenCV驱动空天地遥感数据分析
【扔进数据,直接出结果】在科技飞速发展的时代,遥感数据的精准分析已经成为推动各行业智能决策的关键工具。从无人机监测农田到卫星数据支持气候研究,空天地遥感数据正以前所未有的方式为科研和商业带来深刻变革。然而,对于许多专…...
操作系统——(管程、线程、进程通信)
目录 一、管程机制 (1)管程定义 (2)特点: 二、进程通信 (1)概念 (2)高级通信机制 三、线程 (1)概念 (2)与进程比较…...
Sqlserver安全篇之_启用和禁用Named Pipes的案列介绍
https://learn.microsoft.com/zh-cn/sql/tools/configuration-manager/named-pipes-properties?viewsql-server-ver16 https://learn.microsoft.com/zh-cn/sql/tools/configuration-manager/client-protocols-named-pipes-properties-protocol-tab?viewsql-server-ver16 默认…...
Redis 本地安装
首先安装: https://redis.io/docs/latest/operate/oss_and_stack/install/install-redis/install-redis-from-source/ 进入root目录 tar -xzvf redis-stable.tar.gz cd redis-stable make然后 install sudo make install最后可以直接启动 redis-server但是此时启…...
外卖订单如何教会我变量与数据类型?
目录 前言一、现实场景1.1 你点的每一碗,都是程序员的KPI1.2 关键数据角色扮演 二、技术映射三、知识点呈现3.1 变量——你的数字日记本3.2 数据类型——数值的「职业规划」3.3 运算符——数学老师的黑板擦 四、代码实现4.1 基础版:计算器の复仇4.2 进阶…...
HOW - 平时如何保持学习和成长?
目录 前言数字时代的系统性学习方法论一、场景驱动的实战学习:从工具赋能到知识沉淀二、结构化的系统学习:构建知识体系的方法论(一)精准学习策略(二)学习成效评估体系(三)专项研究 …...
Web开发-JS应用原生代码前端数据加密CryptoJS库jsencrypt库代码混淆
知识点: 1、安全开发-原生JS-数据加密&代码混淆 2、安全开发-原生JS-数据解密安全案例 一、演示案例-WEB开发-原生JS&第三方库-数据加密 前端技术JS实现: 1、非加密数据大致流程: 客户端发送->明文数据传输-服务端接受数据->…...
手动集成sqlite的方法
注意到sqlite有backup方法(https://www.sqlite.org/backup.html)。 也注意到android中sysroot下,没有sqlite3的库,也没有相关头文件。 如果要使用 sqlite 的backup,那么就需要手动集成sqlite代码到项目中。可以如下操…...
比特币牛市还在不在
在加密货币的风云世界里,比特币的一举一动始终牵动着投资者们的神经。近期比特币的涨幅动作,再次引发了市场对于牛市是否仍在延续的激烈讨论。 在深入探索比特币市场的过程中,获取全面且及时的资讯至关重要。您可以通过访问Techub News&#…...
Python、MATLAB和PPT完成数学建模竞赛中的地图绘制
参加数学建模比赛时,很多题目——诸如统计类、数据挖掘类、环保类、建议类的题目总会涉及到地理相关的情景,往往要求我们制作与地图相关的可视化内容。如下图,这是21年亚太赛的那道塞罕坝的题目,期间涉及到温度、降水和森林覆盖率…...
