当前位置: 首页 > article >正文

OpenClaw技能共享:将自研的Phi-3-vision-128k-instruct图表分析模块发布到ClawHub

OpenClaw技能共享将自研的Phi-3-vision-128k-instruct图表分析模块发布到ClawHub1. 为什么需要共享技能去年我在处理一批市场分析报告时发现手动从PDF中提取图表数据再制作可视化报表的效率极低。当时用OpenClawPhi-3-vision模型搭建了一个自动化分析模块没想到这个小工具后来成了团队里最受欢迎的秘密武器。这个经历让我意识到OpenClaw生态的真正价值不在于单个工具多强大而在于开发者们能否像乐高积木一样自由组合彼此的能力。今天我就以这个图表分析模块为例分享如何将一个本地开发的技能打包发布到ClawHub社区。2. 技能开发前的准备工作2.1 环境配置检查在开始前请确保已具备以下环境运行中的OpenClaw网关服务openclaw gateway status验证本机安装的Phi-3-vision-128k-instruct模型或可访问的API端点Node.js 18环境用于技能包管理建议先创建一个干净的开发目录mkdir phi3-chart-analyzer cd phi3-chart-analyzer npm init -y2.2 技能功能规划我的图表分析模块主要解决三个痛点图表数据提取从PDF/PPT中识别并提取图表数据智能分析基于Phi-3-vision的多模态理解生成分析结论可视化重建自动生成可交互的Altair/Vega-Lite图表对应的技能API设计为interface ChartAnalyzer { extractFromFile(filePath: string): PromiseChartData; analyzeTrends(data: ChartData): PromiseAnalysisResult; generateVisualization(data: ChartData): PromiseVisualization; }3. 技能打包实战3.1 编写manifest文件在项目根目录创建clawpack.json这是技能包的身份证{ name: phi3-chart-analyzer, version: 0.1.0, description: 基于Phi-3-vision的智能图表分析工具, author: yourname, license: MIT, dependencies: { m1heng-clawd/core: ^1.2.0, pdf-lib: ^1.17.1, altair: ^5.0.0 }, claw: { type: model-tool, modelRequirements: [phi-3-vision], entry: ./dist/index.js, permissions: [file.read, file.write] } }关键字段说明modelRequirements声明需要Phi-3-vision模型支持permissions申请文件读写权限处理PDF必须entry指向编译后的入口文件3.2 实现核心功能模块创建src/analyzer.ts实现主要逻辑import { Phi3Vision } from m1heng-clawd/core; export class ChartAnalyzer { private model: Phi3Vision; constructor(modelEndpoint: string) { this.model new Phi3Vision(modelEndpoint); } async extractFromFile(filePath: string) { // PDF解析与图表区域检测逻辑 const imageBytes await extractChartImage(filePath); const prompt 提取图中数据按{label: string, value: number}格式返回JSON; const result await this.model.multimodalQuery({ image: imageBytes, prompt: prompt }); return JSON.parse(result); } }3.3 本地测试验证通过OpenClaw CLI注册本地技能进行测试# 编译TypeScript tsc # 注册技能 openclaw skills add ./ --local # 测试调用 openclaw skills test phi3-chart-analyzer extractFromFile ./sample.pdf测试时建议使用包含柱状图/折线图的简单PDF观察模型返回的数据结构是否合规。4. 发布到ClawHub社区4.1 准备发布材料除了代码本身还需要准备README.md使用说明、参数说明、示例screenshots/技能运行效果截图examples/示例PDF和对应分析结果目录结构最终如下. ├── clawpack.json ├── README.md ├── src/ ├── dist/ ├── examples/ │ ├── sales-report.pdf │ └── analysis-result.json └── screenshots/ ├── extract-demo.png └── visualize-demo.png4.2 提交到ClawHub首先安装ClawHub CLI工具npm install -g clawhub然后执行发布流程# 登录账号需提前注册 clawhub login # 初始化仓库 clawhub init # 添加所有文件 clawhub add . # 提交并发布 clawhub commit -m Initial release of chart analyzer clawhub push origin main发布成功后你会收到包含技能主页链接的邮件例如https://clawhub.ai/yourname/phi3-chart-analyzer5. 技能维护与迭代5.1 处理用户反馈发布后我收到了几个典型问题精度问题复杂图表数据提取不准解决方案在manifest中增加modelRequirements.minVersion限制权限担忧部分用户对文件读写权限敏感解决方案拆分技能为analyzer-core和file-plugin两个包5.2 版本更新流程当需要发布新版本时修改clawpack.json中的版本号添加变更日志到CHANGELOG.md重新执行发布命令clawhub bump-version minor clawhub push origin main6. 给开发者的建议通过这次技能发布我总结了三点经验第一明确技能边界不要试图做一个万能图表工具我的0.1版就因过度设计导致API复杂。后来聚焦在PDF图表→结构化数据这个核心点反而获得更多用户。第二做好错误处理模型对模糊图表的响应可能不稳定要在代码中加入重试和降级逻辑。我的extractFromFile方法现在支持三种回退策略。第三文档即产品最初版本的文档只有简单API说明后来增加了场景化示例后使用量提升了3倍。特别推荐在README中加入5分钟快速入门章节。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

OpenClaw技能共享:将自研的Phi-3-vision-128k-instruct图表分析模块发布到ClawHub

OpenClaw技能共享:将自研的Phi-3-vision-128k-instruct图表分析模块发布到ClawHub 1. 为什么需要共享技能 去年我在处理一批市场分析报告时,发现手动从PDF中提取图表数据再制作可视化报表的效率极低。当时用OpenClawPhi-3-vision模型搭建了一个自动化分…...

关于统好 AI可持续发展三大趋势

问:如何理解统好 AI 的可持续发展趋势?答:统好 AI 的可持续发展,核心是技术、业务与运营长期适配,不追求短期迭代,而是围绕企业全生命周期需求构建稳定演进路径。绵阳统好软件有限公司以一体化底座为基础&a…...

零基础鸿蒙应用开发第二十二节:类的继承与多态入门

【学习目标】 理解继承的核心意义,掌握ArkTS中extends关键字的使用规则,区分“单继承”特性在鸿蒙开发中的适配场景;掌握super关键字的核心作用(调用父类构造函数、调用父类方法),规避继承中的常见语法错误…...

Phi-4-mini-reasoning vLLM参数详解:context_length=131072配置与性能调优

Phi-4-mini-reasoning vLLM参数详解:context_length131072配置与性能调优 1. 模型概述 Phi-4-mini-reasoning 是一个基于合成数据构建的轻量级开源模型,专注于高质量、密集推理的数据处理能力。作为Phi-4模型家族的一员,它特别针对数学推理…...

告别重复编码:用快马AI自动化实现UI设计,释放创意效率

作为一名经常需要快速产出UI原型的设计师,我深刻体会到从设计稿到可交互代码的转换过程有多耗时。特别是电商类页面,既要考虑视觉表现力,又要兼顾响应式布局和基础交互逻辑。最近尝试用InsCode(快马)平台的AI辅助功能后,发现它能大…...

利用快马平台自动化生成contextmenumanager提升前端开发效率

最近在开发一个后台管理系统时,遇到了一个很常见的需求:需要为表格、图表等元素添加右键菜单功能。这种需求看似简单,但实际开发中却要花费不少时间在重复的配置工作上。经过一番摸索,我发现利用InsCode(快马)平台可以大幅提升这类…...

实战应用:基于快马平台构建支持实时协作的团队版pencil设计工具

今天想和大家分享一个实战项目:基于InsCode(快马)平台构建团队协作版pencil设计工具的经历。这个工具最终成为了我们产品团队的需求沟通神器,特别适合中小团队快速搭建轻量级设计协作环境。 为什么需要这个工具 我们团队经常遇到设计稿反复修改、版本混乱…...

快马平台十分钟速成:用AI大模型构建你的第一个智能客服对话Agent原型

最近在尝试用AI大模型构建智能客服对话系统,发现InsCode(快马)平台特别适合快速验证这类原型。花十分钟就能搭建出具备基础功能的对话agent,和大家分享下具体实现思路: 界面设计 先用HTML搭建基础框架,主要包含三个部分&#xff1…...

利用快马平台AI能力,十分钟快速生成qoderwork官网原型

最近在尝试为AI代码生成工具qoderwork设计官网原型时,发现用传统方式从零开始写代码特别耗时。正好体验了InsCode(快马)平台的AI生成功能,十分钟就做出了可交互的响应式单页原型,分享下这个高效的工作流: 明确核心模块 官网原型需…...

ai辅助开发新体验:在快马平台用对话创建智能天气应用

最近在做一个天气应用的小项目时,遇到了一个很实际的问题:GitHub经常打不开,导致想参考的开源代码库无法访问。这时候,我发现InsCode(快马)平台的AI辅助开发功能简直是个救星,完全改变了我的开发方式。 需求分析阶段 以…...

构建稳定爬虫服务:基于快马ai生成openclaw的windows生产级部署实战

构建稳定爬虫服务:基于快马AI生成OpenClaw的Windows生产级部署实战 最近在做一个数据采集项目,需要将OpenClaw爬虫部署到Windows服务器上长期运行。经过一番折腾,终于通过InsCode(快马)平台生成了一个完整的生产级部署方案,这里分…...

为什么要做 GeoPipeAgent

如果有多个供应商,你也可以使用 [[CC-Switch]] 来可视化管理这些API key,以及claude code 的skills。 # 多平台安装指令 curl -fsSL https://claude.ai/install.sh | bash ## Claude Code 配置 GLM Coding Plan curl -O "https://cdn.bigmodel.cn/i…...

终极指南:如何在macOS上使用Applite轻松管理Homebrew Cask应用

终极指南:如何在macOS上使用Applite轻松管理Homebrew Cask应用 【免费下载链接】Applite User-friendly GUI macOS application for Homebrew Casks 项目地址: https://gitcode.com/gh_mirrors/ap/Applite Homebrew Cask是macOS用户安装第三方应用的高效工具…...

利用trl库实现DeepSeek-R1的GRPO训练:从数据处理到模型验证全流程解析

1. 理解GRPO训练与trl库的核心价值 GRPO(Generalized Reinforcement Policy Optimization)是近年来在强化学习领域兴起的一种训练方法,它通过多维度奖励机制来优化大语言模型的输出质量。我在实际项目中发现,相比传统的PPO&#x…...

5分钟掌握gdrivedl:突破Google Drive下载限制的高效工具

5分钟掌握gdrivedl:突破Google Drive下载限制的高效工具 【免费下载链接】gdrivedl Google Drive Download Python Script 项目地址: https://gitcode.com/gh_mirrors/gd/gdrivedl 解决云存储下载痛点:为什么你需要这款工具? 作为经常…...

大模型开发避坑:彻底理清 Skill(技能)与 MCP(模型 上下文协议)的本质区别与协同

在目前的 AI 应用开发圈子里,各种新名词层出不穷:Skill(技能)、Plugin(插件)、Function Calling(函数调用)、Tool(工具)、MCP(模型上下文协议&…...

FanControl完全攻略:智能风扇控制的动态平衡技术与多场景应用

FanControl完全攻略:智能风扇控制的动态平衡技术与多场景应用 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Tren…...

Mac 安装 Java JDK 完整教程:一篇文章讲透安装、配置、多版本管理

一、Java JDK 详解1.1 什么是 JDK?JDK(Java Development Kit,Java 开发工具包)是 Oracle 公司提供的用于 Java 程序开发的完整软件包。它是 Java 开发者不可或缺的核心工具,包含了编写、编译、调试和运行 Java 程序所需…...

G-Helper风扇控制完全指南:轻松解决华硕笔记本散热异常问题

G-Helper风扇控制完全指南:轻松解决华硕笔记本散热异常问题 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Stri…...

森利威尔SL3041B替换LM5018 100V降压3.3V5V12V恒压芯片

在工业、汽车及电池供电的电子系统中,高压降压转换器的选择往往需要在性能、可靠性与成本之间取得平衡。传统上,LM5018等进口芯片凭借其高输入电压范围和稳定的性能占据一定市场,但随着国内半导体技术的成熟,国产替代方案已具备与…...

VASP表面建模进阶:利用现代脚本工具实现Slab模型原子选择性固定(POSCAR高效处理)

1. 为什么需要自动化处理POSCAR文件 在计算材料学领域,VASP作为第一性原理计算的黄金标准工具,其输入文件POSCAR的准确性直接决定了计算结果的可靠性。传统手动处理方式存在几个致命缺陷:首先,用Excel手工标记原子固定状态极易出错…...

Clawdbot 是如何实现永久记忆的?

下文是如何构建的在深入探讨记忆之前,我们先来理解模型在每次请求时能看到什么:[0] 系统提示词(静态指令 条件指令) [1] 项目上下文(引导文件:AGENTS.md、SOUL.md 等) [2] 对话历史&#xff08…...

notepad-- Markdown实时预览功能高效使用全攻略

notepad-- Markdown实时预览功能高效使用全攻略 【免费下载链接】notepad-- 一个支持windows/linux/mac的文本编辑器,目标是做中国人自己的编辑器,来自中国。 项目地址: https://gitcode.com/GitHub_Trending/no/notepad-- 作为一款支持Windows、…...

FanControl终极指南:如何免费掌控电脑风扇,告别噪音困扰

FanControl终极指南:如何免费掌控电脑风扇,告别噪音困扰 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHu…...

客服机器人系统会不会发生宕机?Agent开放平台保障有哪些,数据安全不过关能赔?

在电商和数字化服务高速发展的今天,企业每天面对海量客户咨询。传统人工客服难以应对高峰期压力,而智能客服机器人系统成为重要解决方案。许多商家关心一个核心问题:客服机器人系统会不会发生宕机?一旦系统出现故障,是…...

昇腾910B分布式微调避坑指南:从SSH免密到权重合并的5个常见问题

昇腾910B分布式微调实战避坑手册:5个关键环节的深度解析 当你在深夜的机房盯着屏幕上闪烁的错误日志,第八次尝试启动分布式微调任务却依然卡在SSH认证环节时,那种混合着焦虑与挫败的感受,我太熟悉了。这不是又一篇按部就班的操作手…...

将大疆无人机GPS数据接入ROS:一份从PSDK C++示例到sensor_msgs/NavSatFix话题的完整改造指南

大疆无人机GPS数据与ROS深度集成实战指南 1. 系统架构设计与环境准备 在机器人导航系统中,高精度定位数据是核心要素之一。大疆Matrice 350 RTK无人机搭载的GPS/RTK模块能够提供厘米级定位精度,而ROS(Robot Operating System)作为…...

大学物理电磁场公式

1,毕奥-萨伐尔定律 2,安培定律(电流连续性) 3,库伦定律 如果两个电荷电量为q1和q2,距离为r,它们受到相互间作用力F 同种电荷互相吸引,不同电荷相互排斥; 电荷作用力大小与电荷大小成正比,与距离平方成反比; 作用力方向与电荷连线方向相反或一致 4,法拉第定律 5…...

别再被芯片手册吓到!用74HC595手把手教你读懂时序图(附示波器实测波形)

从零破解74HC595时序图:示波器实战与代码调优指南 第一次翻开74HC595的数据手册时,那些纵横交错的箭头、虚线、时间参数让我彻底懵了。作为电子爱好者,我们常被告知"要严格按照时序图操作",但没人告诉我们这些符号究竟对…...

快速验证dify部署方案:用快马生成环境检查与部署脚本原型

最近在折腾dify的本地部署,发现环境配置这块特别容易踩坑。作为一个开源AI应用开发平台,dify的部署涉及Python版本、Docker环境、端口占用等一系列依赖项检查,手动操作既繁琐又容易遗漏步骤。正好发现InsCode(快马)平台能快速生成这类工具的原…...