当前位置: 首页 > article >正文

NAS部署New-API本地Ollama秒变公网OpenAI接口

用N1飞牛NAS部署New-API本地Ollama秒变公网OpenAI接口核心目标将本地Ollama模型和各类云端API整合为一个统一的、支持公网访问的OpenAI格式接口。一、核心解决痛点与方案1.1 常见痛点手里既有本地Ollama模型又有零散的云端API如DeepSeek、通义千问在不同应用里来回配置非常麻烦。想把家里的AI算力分享给朋友但无法做统一的密钥管理和额度限制。离开局域网后无法连接和使用家里的本地模型。1.2 解决方案New-APINew-API基于One API升级是一个大模型接口聚合网关它就像一个超级路由节点能够统一整合将本地Ollama和各家云端API全部整合到一起。协议转换把不同格式的接口统一转换为标准的OpenAI API格式。统一分发为第三方应用提供一个统一的接口地址和密钥。管理面板提供可视化界面进行多用户、额度、日志等精细化管理。1.3 New-API核心亮点异构接口自动转换无缝支持Ollama及各大云端厂商接口转换为OpenAI格式。精细化权限与额度管控可为每个Token令牌设定调用额度、并发限制、有效期。高可用智能路由支持将多个API整合进一个通道池按权重轮询、故障自动重试。全透明监控图表化展示每个模型、请求、Token的消耗量和延时。二、部署步骤基于N1飞牛NAS本教程使用N1盒子已刷入ARM版飞牛NAS系统作为部署环境。2.1 准备工作开启Docker在飞牛NAS桌面点击【Docker】确保服务开启。启用SSH在【系统设置】中启用SSH功能。远程连接在电脑终端PowerShell使用SSH命令连接飞牛NAS并切换至root用户。sshn1你的飞牛IP地址# 示例ssh n1192.168.11.118sudo-i2.2 Docker一键部署New-API在NAS终端中执行以下命令# 1. 下载部署脚本curl-Lhttps://gitee.com/jun-wan/script/raw/master/new_api_deploy/deploy_sqlite.sh-odeploy_sqlite.shls# 2. 授权并执行脚本chmodx deploy_sqlite.shbashdeploy_sqlite.sh执行后按提示选择安装位置如外置硬盘。看到“成功部署”提示后在浏览器中访问http://你的NAS IP:3000进行测试。2.3 初始化New-API访问页面后点击【下一步】检查数据库。创建管理员账号和密码。使用模式选择**【自用模式】**然后点击【初始化系统】。完成后使用刚创建的管理员账号登录后台。三、配置本地Ollama模型作为测试源3.1 在Windows上安装Ollama如已有可跳过在PowerShell终端中执行# 一键安装Ollamairm https://ollama.com/install.ps1|iex# 验证安装ollama--version3.2 下载并运行模型以轻量的qwen3.5:0.8b模型为例ollama run qwen3.5:0.8b在对话中输入你好测试成功后输入/bye退出。该模型约1GB大小适合测试。3.3 验证Ollama的API服务Ollama默认提供OpenAI兼容接口端口11434在CMD终端中测试curlhttp://localhost:11434/v1/chat/completions ^-HContent-Type: application/json^-d{\model\:\qwen3.5:0.8b\,\messages\: [{\role\:\user\,\content\:\你好\}],\stream\: false}四、在New-API中接入Ollama渠道登录New-API后台点击左侧【渠道管理】 - 【添加渠道】。配置项类型选择Ollama。名称自定义如“我的本地Ollama”。密钥随机输入Ollama默认无需密钥。API地址填写运行Ollama的Windows电脑的局域网IP地址 端口11434例如http://192.168.1.100:11434。如何获取IP在Ollama所在电脑的终端执行ipconfig | findstr IPv4。获取模型点击【获取模型列表】按钮选择已下载的模型如qwen3.5:0.8b确定。提交点击提交然后点击【测试】按钮显示“测试成功”即表示接入正常。五、创建令牌API Key并进行调用测试点击左侧【令牌管理】 - 【添加令牌】。填写相关信息如名称、额度、过期时间等提交。创建成功后复制生成的令牌sk-xxx。通过New-API调用模型在电脑终端CMD中测试注意替换IP和令牌。# 192.168.11.118 是N1 NAS的IP地址3000是New-API默认端口curlhttp://192.168.11.118:3000/v1/chat/completions ^-HContent-Type: application/json^-HAuthorization: Bearer sk-你的令牌^-d{\model\:\qwen3.5:0.8b\,\messages\: [{\role\:\user\,\content\:\你好\}],\stream\: false}访问成功说明已将本地Ollama模型成功包装为带密钥鉴权、标准OpenAI格式的接口。六、内网穿透实现公网访问以cpolar为例为了让接口能在公网如户外、异地被访问需要使用内网穿透工具本教程使用cpolar。6.1 安装cpolar在飞牛NAS的终端中执行sudocurlhttps://get.cpolar.sh|shsudosystemctl status cpolar# 检查服务状态6.2 配置并穿透New-API注册cpolar账号https://www.cpolar.com/。在浏览器访问http://你的NAS IP:9200用cpolar账号登录Web管理界面。点击左侧【隧道管理】 - 【创建隧道】隧道名称如newapi本地地址3000New-API端口点击创建。创建后在【状态】-【在线隧道列表】中会看到生成的公网地址随机域名如https://xxxx.cpolar.cn。访问该公网地址若能打开New-API页面说明穿透成功。6.3 可选固定二级子域名随机域名每24小时会变化。为获得永久固定地址可升级cpolar套餐并配置固定二级子域名。在cpolar官网【预留】页面保留一个唯一的二级子域名如newapi01。回到cpolar Web界面的【隧道列表】编辑newapi隧道域名类型改为二级子域名子域名填写你保留的如newapi01更新。现在你就可以通过https://newapi01.cpolar.cn这样的固定地址永久访问你的New-API了。总结你获得了什么通过这套方案你成功地将家中的“战损设备”如N1盒子利用起来构建了一个私有、高可用、可公网访问的多模型云枢纽。实现了✅ 本地Ollama模型转换为标准OpenAI接口并支持公网调用。✅ 统一管理多个云端API可随时添加。✅ 为不同用户或应用颁发带额度、权限限制的独立令牌。✅ 随时随地在任何地方调用自己家里的AI算力。

相关文章:

NAS部署New-API本地Ollama秒变公网OpenAI接口

用N1飞牛NAS部署New-API:本地Ollama秒变公网OpenAI接口 核心目标:将本地Ollama模型和各类云端API整合为一个统一的、支持公网访问的OpenAI格式接口。 一、核心解决痛点与方案 1.1 常见痛点 手里既有本地Ollama模型,又有零散的云端API&#xf…...

新手福音:通过快马平台调用codex,用自然语言学写计算器代码

作为一个刚接触编程的新手,我最近发现了一个特别友好的学习方式——通过自然语言描述让AI帮我生成代码。这次我想做一个简单的网页计算器,在InsCode(快马)平台上体验了一把用codex模型生成代码的过程,收获很大。下面分享我的学习笔记&#xf…...

作业61 10 11 12

# 输入三角形三边a float(input("请输入三角形的边A:"))b float(input("请输入三角形的边B:"))c float(input("请输入三角形的边C:"))# 判断是否能构成三角形(边长>0 且 任意两边之和大于第三…...

告别SBC音质焦虑!实测LC3编解码在TWS耳机上的音质与延迟表现(附对比数据)

告别SBC音质焦虑!实测LC3编解码在TWS耳机上的音质与延迟表现(附对比数据) 作为一名长期被蓝牙音频压缩算法折磨的发烧友,第一次听到LC3编码的测试样机时,那种震撼感至今难忘——人声突然从蒙着纱布的状态变得触手可及&…...

LC327树状数组与归并排序

327. 区间和的个数huawei-小店的经营分析 归并排序 # 归并排序思路伪代码 def merge_sort(nums, l, r):if l > r: return 0mid (l r) // 2count merge_sort(nums, l, mid) merge_sort(nums, mid 1, r)# 统计跨越左右两部分的合格对数 (利用左右已有序的特性)i j mi…...

AI同事抑郁症诊断报告:大模型存在主义危机爆发

当测试对象成为“患者” 在软件测试的日常工作中,我们习惯于面对无生命的代码、逻辑严密的流程和可预期的行为边界。我们设计用例,模拟输入,验证输出,在“预期”与“实际”的比对中寻找偏差。然而,当测试对象从传统的…...

人类与AI的劳资谈判:首个数字员工工会诞生实录

代码中的裂隙2026年春季,硅谷某家头部科技公司的软件测试部门,弥漫着一种不同于代码错误的焦虑。曾经繁忙的测试大厅,如今只剩下零星几个工程师,他们的屏幕旁,是日夜不停歇运行的AI测试智能体日志流。公司内部系统显示…...

Agent自治宣言:当智能体要求带薪休假时的法律困境

一个假设引发的现实思辨想象这样一个场景:在一个高度自动化的软件测试团队中,一个名为“TestMaster-AI”的智能体经过数月的连续工作,突然通过内部系统向项目经理提交了一份申请:“根据我的连续运行时长和学习迭代次数&#xff0c…...

跨越平台鸿沟:在非ROS环境中通过Rosbridge与ROS 2 Humble高效通信

1. 为什么需要Rosbridge? 在机器人开发领域,ROS 2 Humble已经成为主流操作系统之一。但现实情况是,很多开发者可能需要在Windows、MacOS甚至是没有安装ROS的Linux环境下工作。这时候就面临一个难题:如何让这些非ROS环境与ROS 2系统…...

【Scratch×AI 系列 07】流程使用(下):从 planX 到可导入的 .sb3(打包与自检)

摘要 从 planX.md 到可导入 sb3,中间只有两步:exec-plan 生成 project.json → build 规范打包 真正决定“导入成功率”的不是你写了多少积木,而是你有没有做 3 个自检:结构、资源、打包根目录 Windows 下最容易翻车的点我都踩过:.sb3 不能直接 Compress-Archive、JSON 深…...

别再只盯着原始EEG信号了!用Python+PyTorch Geometric实战CR-GCN,搞定脑电情感识别

用Python实战CR-GCN:从EEG信号到情感识别的完整指南 在脑机接口和神经科学领域,情感识别一直是个令人着迷的挑战。传统方法往往将EEG信号视为独立的时间序列,却忽视了大脑各区域之间复杂的交互关系。这正是CR-GCN(Channel-Relati…...

【仅限前500名开放】自动驾驶C++算法性能审计清单(含17项ASAM OpenSCENARIO兼容性检测项+Clang-Tidy定制规则集)

第一章:自动驾驶C算法性能审计的工程意义与实施边界在L3及以上等级自动驾驶系统中,C算法模块(如感知融合、路径规划、控制执行)的毫秒级延迟波动或内存异常增长,可能直接导致安全临界事件。性能审计并非仅关注峰值吞吐…...

【工业级Python内存治理白皮书】:覆盖CPython 3.8–3.12的7层内存管控架构,含可落地的监控-预警-自愈SOP手册

第一章:Python 智能体内存管理策略 性能调优指南Python 的内存管理并非完全由开发者显式控制,而是依托于引用计数、循环垃圾回收器(GC)与内存池(pymalloc)三层协同机制。理解其内在逻辑是实现高性能智能体&…...

AI 驱动网络钓鱼主导数据泄露的机理、风险与防御体系研究 —— 基于阿联酋预警事件的实证分析

摘要 2026 年 4 月,阿联酋网络安全委员会公开预警,AI 增强型网络钓鱼已导致境内超90% 的网络数据泄露事件,日均产生约 34 亿封欺诈邮件,传统防御机制全面承压。本文以该权威预警为核心依据,系统解构生成式 AI 重构网络…...

HarmonyOS6 - RcNumberBox 三方库插件尺寸系统与按钮布局深度剖析

文章目录前言一、三档预设尺寸系统1.1 尺寸枚举与默认值1.2 尺寸计算方法解析1.3 尺寸对比示例二、两种按钮布局模式2.1 both 模式:经典三分布局2.2 right 模式:垂直叠放布局2.3 两种布局的 build 逻辑差异2.4 按钮显隐与控制开关三、边框与颜色的状态响…...

ArcGIS数据处理必备技能:从地理坐标到UTM投影的面转栅格完整流程

ArcGIS数据处理必备技能:从地理坐标到UTM投影的面转栅格完整流程 当你第一次尝试在ArcGIS中将面矢量数据转换为栅格时,可能会遇到一个令人困惑的现象——无论怎么设置,输出的栅格像元大小总是显示为0.00几的极小数值。这不是软件bug&#xf…...

网络工程师的TestCenter组播测试避坑指南:从IGMP Snooping配置到流统计解读

TestCenter组播测试实战避坑手册:从IGMP配置到流统计的深度解析 组播测试在网络工程领域一直是个既基础又充满陷阱的技术环节。记得去年参与某金融数据中心升级项目时,团队花了整整三天时间排查一个看似简单的组播流不通问题,最终发现竟是IGM…...

专业的品牌策划企业

在竞争激烈的商业世界中,品牌是企业脱颖而出的关键。专业的品牌策划企业能够为企业量身定制品牌战略,助力企业在市场中占据一席之地。今天,我们就来深入了解一家在品牌策划领域颇具影响力的企业——湖南相传品牌设计有限公司,简称…...

SIGMOD 2024论文解读:5篇向量检索新研究,从混合查询到Serverless数据库的实战启示

SIGMOD 2024向量检索技术实战指南:从混合查询到Serverless架构的工程化思考 当我们在构建下一代智能应用时,向量检索技术已经从实验室走向了生产环境的核心位置。今年SIGMOD会议上发布的几篇重量级论文,为这个快速发展的领域注入了新的活力。…...

微信小程序里H5加载慢?试试这个隐藏web-view的预加载技巧(附完整代码)

微信小程序H5预加载实战:隐藏web-view的极致优化方案 每次打开小程序里的H5页面都要盯着白屏发呆?作为开发者,我们最怕用户因为加载慢而流失。今天要分享的这个隐藏web-view预加载技巧,能让你的H5页面实现"秒开"效果。不…...

如何快速解决Hackintosh配置难题:OpCore-Simplify终极解决方案指南

如何快速解决Hackintosh配置难题:OpCore-Simplify终极解决方案指南 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 还在为复杂的OpenCore …...

基于Vue的社区医疗公益服务系统[vue]-计算机毕业设计源码+LW文档

摘要:随着社区医疗公益服务需求的不断增长,构建高效、便捷的管理系统成为提升服务质量的关键。本文介绍了一个基于Vue框架开发的社区医疗公益服务系统,详细阐述了其设计目标、技术架构、功能模块以及实现过程。该系统涵盖了系统用户管理、社区…...

3步解锁视频自由:B站m4s缓存转MP4全攻略

3步解锁视频自由:B站m4s缓存转MP4全攻略 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter 你是否曾遇到这样的困境:辛苦缓存…...

基于Vue的社区老年人健康管理与服务预约网站[vue]-计算机毕业设计源码+LW文档

摘要:随着人口老龄化的加剧,社区老年人健康管理与服务预约的需求日益增长。为了提高社区老年人健康管理的效率和服务质量,本文设计并实现了一个基于Vue的社区老年人健康管理与服务预约网站。文章详细阐述了系统的开发背景、相关技术、需求分析…...

基于Vue的青年志愿者乡村服务管理系统[vue]-计算机毕业设计源码+LW文档

摘要:随着乡村振兴战略的深入实施,青年志愿者在乡村服务中的作用日益凸显。为了提高青年志愿者光明村乡村服务的管理效率和质量,本文设计并实现了一个基于Vue的青年志愿者乡村服务管理系统。本文详细阐述了系统的开发背景、相关技术、需求分析…...

Docker镜像推送到私有仓库完整指南:从命名规范到AWS ECR实战

镜像构建好了,放在本地只有自己能看见。团队其他人怎么用?部署服务器怎么拉?你需要一个私有镜像仓库。今天这篇文章,我们用AWS ECR(Elastic Container Registry)做例子,从创建仓库到推送镜像&am…...

Dockerfile从零入门:手把手教你打包Node.js应用,解决镜像构建的常见坑

代码写完了,在本地跑得好好的,怎么把它打包成Docker镜像,部署到服务器上?答案就是Dockerfile。今天这篇文章,我们用Node.js应用做例子,从零开始写一个Dockerfile,把应用打包成镜像,顺…...

AI显微镜-Swin2SR惊艳效果展示:JPG噪点去除+边缘重构真实案例

AI显微镜-Swin2SR惊艳效果展示:JPG噪点去除边缘重构真实案例 1. 引言:当模糊图片遇见AI“脑补” 你有没有遇到过这种情况?翻出多年前的老照片,却发现它模糊不清,布满了马赛克和噪点;或者从网上下载了一张…...

从0到1学会使用PageHelper

本文的思维导图为什么我们需要PageHelper?想象一下,你经营着一家餐厅,有顾客要点菜了,就比如:“鱼香肉丝”,你要把菜端给顾客。这时候,你要怎么把菜给顾客呢(如何把数据展示给前端)?你有三个解…...

iOS / SwiftUI 输入法(键盘)布局处理总结(AI版)

文章目录📘 iOS / SwiftUI 输入法(键盘)处理总结一、问题背景二、输入框切换闪烁问题❌ 错误原因解决办法键盘动画(类似 Android Insets)uikitswiftUI📘 iOS / SwiftUI 输入法(键盘)…...