当前位置：首页 > article >正文

LFM2.5-VL-1.6B开源大模型教程：支持Function Calling的纯文本扩展能力

article 2026/5/5 18:14:46

LFM2.5-VL-1.6B开源大模型教程支持Function Calling的纯文本扩展能力1. 项目概述LFM2.5-VL-1.6B是由Liquid AI开发的轻量级多模态大模型专为端侧和边缘设备设计。这个1.6B参数的视觉语言模型1.2B语言400M视觉在保持轻量化的同时提供了强大的图文理解和生成能力。项目值模型名称LFM2.5-VL-1.6B开发商Liquid AI参数量1.6B类型视觉语言模型 (Vision-Language)模型路径/root/ai-models/LiquidAI/LFM2___5-VL-1___6BWebUI 地址http://localhost:78602. 环境准备与快速部署2.1 硬件要求LFM2.5-VL-1.6B对硬件要求相对友好适合在资源有限的设备上运行组件要求GPUNVIDIA GPU (推荐 8GB 显存)当前配置RTX 4090 D, 22.15 GB 可用内存占用~3 GB GPU2.2 快速启动方式WebUI方式推荐模型已配置为开机自启动服务可以通过以下命令管理# 查看服务状态 supervisorctl status lfm-vl # 重启服务 supervisorctl restart lfm-vl # 查看日志 tail -f /var/log/lfm-vl.out.log启动后访问 http://localhost:7860 即可使用Web界面。命令行方式如需手动启动可以运行cd /root/LFM2.5-VL-1.6B python webui.py3. 核心功能与使用示例3.1 基础图文对话功能LFM2.5-VL-1.6B支持上传图片并进行对话以下是Python调用示例import warnings warnings.filterwarnings(ignore) import torch from PIL import Image from transformers import AutoProcessor, AutoModelForImageTextToText # 加载模型 MODEL_PATH /root/ai-models/LiquidAI/LFM2___5-VL-1___6B processor AutoProcessor.from_pretrained(MODEL_PATH, trust_remote_codeTrue) model AutoModelForImageTextToText.from_pretrained( MODEL_PATH, device_mapauto, dtypetorch.bfloat16, trust_remote_codeTrue ) model.eval() # 准备图片并提问 image Image.open(your_image.jpg).convert(RGB) conversation [ { role: user, content: [ {type: image, image: image}, {type: text, text: 描述这张图片} ] } ] # 生成回复 text processor.apply_chat_template(conversation, add_generation_promptTrue, tokenizeFalse) inputs processor.tokenizer(text, return_tensorspt, paddingTrue, truncationTrue, max_length2048) inputs {k: v.to(model.device) for k, v in inputs.items()} with torch.no_grad(): outputs model.generate( **inputs, max_new_tokens256, temperature0.1, min_p0.15, do_sampleTrue, ) response processor.batch_decode(outputs, skip_special_tokensTrue)[0].strip() print(response)3.2 使用URL图片模型支持直接处理网络图片from transformers.image_utils import load_image url https://cdn.britannica.com/61/93061-050-99147DCE/Statue-of-Liberty-Island-New-York-Bay.jpg image load_image(url)4. 高级功能与参数调优4.1 Function Calling支持LFM2.5-VL-1.6B支持纯文本Function Calling功能可以通过自然语言描述触发预设功能。这是该模型区别于其他轻量级模型的重要特性。4.2 推荐生成参数根据不同任务类型建议调整以下参数以获得最佳效果任务temperaturemin_pmax_new_tokens事实问答0.10.15256创意描述0.70.15512代码生成0.10.110245. 项目结构与维护5.1 项目目录结构/root/LFM2.5-VL-1.6B/ ├── webui.py # Gradio WebUI 入口 ├── webui.log # 运行日志 └── ... /root/ai-models/LiquidAI/LFM2___5-VL-1___6B/ ├── model.safetensors # 模型权重 (3.1 GB) ├── config.json # 模型配置 ├── processor_config.json # 处理器配置 ├── tokenizer.json # 分词器 ├── chat_template.jinja # 对话模板 ├── README.md # 官方文档 └── ...5.2 开机自启配置服务已通过Supervisor配置为开机自启动[program:lfm-vl] command/opt/miniconda3/envs/torch28/bin/python /root/LFM2.5-VL-1.6B/webui.py directory/root/LFM2.5-VL-1.6B userroot autostarttrue autorestarttrue stderr_logfile/var/log/lfm-vl.err.log stdout_logfile/var/log/lfm-vl.out.log6. 常见问题解决6.1 WebUI启动问题如果遇到端口占用问题# 检查端口占用 lsof -i :7860 # 重启服务 supervisorctl restart lfm-vl6.2 模型加载失败检查模型文件和GPU状态# 检查模型文件 ls -la /root/ai-models/LiquidAI/LFM2___5-VL-1___6B/ # 检查GPU nvidia-smi6.3 常见报错处理遇到str object has no attribute to错误时请确保使用正确的调用方式# 错误方式 (会报错) inputs processor.apply_chat_template(...).to(device) # 正确方式 text processor.apply_chat_template(..., tokenizeFalse) inputs processor.tokenizer(text, return_tensorspt) inputs {k: v.to(model.device) for k, v in inputs.items()}7. 总结与资源LFM2.5-VL-1.6B作为一款轻量级多模态模型在边缘设备上表现出色特别适合需要离线运行的场景。其Function Calling功能为开发者提供了更多可能性。官方资源模型主页官方文档PlaygroundDiscord 社区获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

LFM2.5-VL-1.6B开源大模型教程：支持Function Calling的纯文本扩展能力

相关文章：

LFM2.5-VL-1.6B开源大模型教程：支持Function Calling的纯文本扩展能力

计算机视觉与物理仿真：从视频中提取力场的技术解析

Streamlit应用也能‘绿色便携’：PyInstaller单文件打包实战与避坑指南

【RK3506实战-03】Linux eMMC 实战全攻略

别再乱设CUDA_VISIBLE_DEVICES了！PyTorch多GPU分配的3种正确姿势（附避坑清单）

5分钟快速上手：BLiveChat打造B站直播弹幕的终极解决方案

Dify工作流无缝接入Claude：MCP协议桥接与实战配置指南

Windows风扇控制革命：Fan Control三步实现完美散热平衡

ubuntu 使用samba与windows共享文件

20_AI视频创作实战课：仙侠短剧运镜提示词完全手册

HiveWE：魔兽争霸III地图编辑器的终极性能革命

深度学习篇---docker迁移深度学习项目至linux平台

保姆级教程：在Windows上用VS2019+CMake编译ncnn，搞定ONNX模型转换（附protobuf编译避坑指南）

SkillNet：AI驱动的技能评估与人才发展系统

深度解析：基于LCU API的英雄联盟自动化工具集架构设计与实战

保姆级教程：在RK3588上从零封装一个C++ MPP解码器类（附完整源码）

揭秘LeRobot机器人控制框架：5步快速掌握AI机器人开发实战

别瞎熬了！Paperxie 本科论文终稿，按这几步走直接躺过

中文BERT全词掩码技术：为什么它能让你的NLP任务效果提升3-6个百分点？

生产环境Dify API突然被刷垮？资深SRE教你用Envoy+OpenPolicyAgent实现动态熔断加固

为什么 % 的 AI 开发项目都死在了“提示词工程”的幻觉里？

基于BP-NSGAⅡ的办公建筑围护结构能耗及成本机器学习【附代码】

高效Gofile文件下载终极指南：Python自动化下载工具完全解析

Taotoken用量看板与成本管理功能带来的预算控制体验

观察Taotoken API在持续一周调用中的稳定性与账单准确性

Windows 11系统深度优化实战指南：Win11Debloat架构解析与高效配置

蓝桥杯单片机备赛：用NE555和STC15F2K60S2做个简易频率计（附完整代码）

【AI Agent通识九课】03 · AI 的菜单 vs 暗号 — 工具怎么设计

英飞凌TC275芯片CAN FD实战：从ADS例程到电机控制数据收发（附完整代码解析）

避坑指南：MTK芯片备份分区时，驱动、BROM模式和DA文件这些坑你踩过吗？