当前位置：首页 > news >正文

h2oGPT

news 2025/7/8 18:02:22

文章目录

- 一、关于 h2oGPT
- 二、现场演示
- - 特点
- 三、开始行动
- - 安装h2oGPT
  - 拼贴画演示
  - 资源
  - 文档指南
  - 开发
  - 致谢
  - 为什么选择 H2O.ai？
  - 免责声明

一、关于 h2oGPT

使用文档、图像、视频等与本地GPT进行私人聊天。100%私人，Apache 2.0。支持oLLaMa、Mixtral、llama. cpp等。演示：https://gpt.h2o.ai/ https://gpt-docs.h2o.ai/

喜欢项目就把★变成⭐（右上角）！

使用h2oGPT（一个Apache V2开源项目）查询和总结您的文档或与本地私有GPT LLM聊天。

查看一个长CoT Open-o1开放🍓草莓🍓项目：https://github.com/pseudotensor/open-strawberry

二、现场演示

https://private-user-images.githubusercontent.com/2249614/253246405-2f805035-2c85-42fb-807f-fd0bca79abc6.mp4

YouTube4K视频 : https://www.youtube.com/watch?v=_iktbj4obAI

特点

任何文档的离线私有数据库（PDF、Excel、Word、图像、视频帧、YouTube、音频、代码、文本、MarkDown等）
- 使用准确嵌入的持久数据库（Chroma、Weaviate或内存FAISS）（讲师大、all-MiniLM-L6-v2等）
- 使用指示调整的LLM有效使用上下文（不需要LangChain的少镜头方法）
- 并行汇总和提取，使用13BLLaMa2模型达到每秒80个令牌的输出
- 基于LLM响应的增强检索的HYDE（假设文档嵌入）
- 用于更好文档拆分的语义分块（需要GPU）
支持各种模型（LLaMa2, Mistral, Falcon, Vicuna, WizardLM. With AutoGPTQ, 4-bit/8-bit, LORA, 等）
- 来自HF和LLaMa. cpp GGML模型的GPU支持，以及使用HF、LLaMa.cpp和GPT4ALL模型的CPU支持
- 任意长的注意力汇生成（LLaMa-2，米斯特拉尔，MPT，皮提亚，猎鹰等）
Gradio UI或CLI，可流式传输所有型号
- 通过UI上传和查看文档（控制多个协作或个人收藏）
- 视觉型号LLaVa， Claude-3，Jiony-Pro-Vision，GPT-4-Vision
- 图像生成稳定扩散（sdxl-turbo、sdxl、SD3）、Playground AI（playv2）和Flux
- 使用带有流式音频转换的Whisper的语音STT
- 使用MIT许可的Microsoft Speech T5的语音TTS，具有多种语音和流式音频转换
- 使用MPL2许可TTS的语音TTS，包括语音克隆和流式音频转换
- AI Assistant语音控制模式，免提控制h2oGPT聊天
- 同时针对多个模型的烘烤UI模式
- 通过UI轻松下载模型工件并控制LLaMa. cpp等模型
- 通过Native或Google OAuth通过用户/密码在UI中进行身份验证
- 用户/密码在UI中的状态保存
Open Web UI 和 h2oGPT 通过 OpenAI Proxy 作为后端
- 请参见启动文档。
- 通过流媒体完成聊天
- 使用DocTR的高级OCR使用h2oGPT摄取进行文档Q/A
- 视觉模型
- 音频转录（STT）
- 音频生成（TTS）
- 图像生成
- 认证
- 国家保全
Linux、Docker、macOS和Windows支持
推理服务器 支持oLLaMa、HF TGI服务器、vLLM、Gradio、ExLLaMa、复制、Together.ai、OpenAI、Azure OpenAI、Anrowpic、MistralAI、Google和Groq
兼容OpenAI
- 服务器代理API（h2oGPT充当OpenAI服务器的直接替代品）
- 聊天和文本完成（流式和非流式）
- 音频转录（STT）
- 音频生成（TTS）
- 图像生成
- 嵌入
- 带自动工具选择的功能工具调用
- AutoGen代码执行代理
JSON模式
- 通过使用大纲对vLLM进行严格的模式控制
- OpenAI、Anthropic、Google Double、MistralAI模型的严格模式控制
- JSON模式适用于一些较旧的带有模式控制的OpenAI或双子座模型，如果模型足够智能（例如双子座1.5闪存）
- 通过代码块提取的任何模型
网络搜索与聊天和文档问答的集成
代理商
- 通过单独端口上的OpenAI代理服务器提供高质量代理
- 代码优先代理，通过视觉模型等生成绘图、研究、评估图像（客户端代码openai_server/openai_client.py）。
- 没有UI，只有API
使用奖励模型评估绩效
通过超过1000个单元和超过24个GPU小时的集成测试保持质量

三、开始行动

GitHub license : ttps://github.com/h2oai/h2ogpt/blob/main/LICENSE
Linux : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_LINUX.md
macOS : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_MACOS.md
Windows : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_WINDOWS.md
Docker : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_DOCKER.md

安装h2oGPT

Docker推荐用于Linux、Windows和MAC以获得完整功能。Linux脚本也具有完整功能，而Windows和MAC脚本的功能不如使用Docker。

Docker构建和运行文档（Linux、Windows、MAC）
Linux安装和运行文档
Windows 10/11安装脚本
MAC安装和运行文档
在任何平台上快速入门

拼贴画演示

https://colab.research.google.com/drive/13RiBdAFZ6xqDwDKfW6BG_-tXfXiqPNQe?usp=sharing
https://colab.research.google.com/drive/143-KFHs2iCqXTQLI2pFCDiR69z0dR8iE?usp=sharing

资源

常见问题解答
LangChain自述文件
Discord
模型（LLaMa-2、Falcon 40等）🤗
YouTube： 100%离线ChatGPT替代方案？
YouTube：终极开源LLM摊牌（测试了6个模型）-令人惊讶的结果！
YouTube：快速猎鹰40b🚀未经审查，开源，完全托管，与您的文档聊天
技术论文：https://arxiv.org/pdf/2306.08161.pdf

文档指南

开始行动
- Linux（CPU或CUDA）
- macOS（CPU或M1/M2）
- Windows 10/11（CPU或CUDA）
- GPU（CUDA、AutoGPTQ、exllama）运行详情
- CPU运行详情
- CLI聊天
- 等级UI
- 客户端API（Gradio，符合OpenAI）
- 推理服务器（oLLaMa、HF TGI服务器、vLLM、Groq、Anrowpic、Google、Mistral、Gradio、ExLLaMa、Replate、OpenAI、Azure OpenAI）
- 构建Python轮
- 离线安装
- 低内存
- Docker
LangChain文档支持
与Private ateGPT等人相比。
路线图
发展
帮助
- 支持的LangChain文件类型
- CLI数据库控件
- 常见问题解答
  - 型号使用说明
  - 添加LLM模型（包括使用GGUF和注意力接收器）
  - 添加嵌入模型
  - 添加提示
  - 语境学习
  - 多个GPU
  - 低内存使用
  - 环境变量
  - 服务器和客户端的HTTPS访问
- 有用链接
- 微调
- 海卫一
- 商业可行性
致谢
为什么H2O.ai？
免责声明

开发

要为训练和生成创建开发环境，请遵循安装说明。
要对数据微调任何LLM模型，请按照微调说明进行。
运行 h2oGPT 测试：

pip install requirements-parser pytest-instafail pytest-random-order playsound==1.3.0
conda install -c conda-forge gst-python -y
sudo apt-get install gstreamer-1.0
pip install pygame
GPT_H2O_AI=0 CONCURRENCY_COUNT=1 pytest --instafail -s -v tests
# for openai server test on already-running local server
pytest -s -v -n 4 openai_server/test_openai_server.py::test_openai_client

或运行下面代码并行测试

tests/test4gpus.sh

致谢

一些训练代码基于3月24日版本的羊驼-洛拉。
使用OpenAssistant创建的高质量数据。
使用EleutherAI的基本模型。
使用LAION创建的OIG数据。

为什么选择 H2O.ai？

我们创客的H2O.ai已经建立了几个世界级的机器学习、深度学习和人工智能平台：

#1企业开源机器学习平台H2O-3
世界上最好的AutoML（自动机器学习）与H2O无人驾驶AI
无代码深度学习与H2O氢炬
文档AI中的深度学习文档处理

我们还构建了用于部署和监控以及数据处理和治理的平台：

H2O MLOps可大规模部署和监控模型
H2O功能商店与AT&T合作
开源低代码AI应用程序开发框架Wave和Nitro
开源Python数据化（H2O无人驾驶AI特征工程引擎）

我们的许多客户正在创建模型，并在H2O AI Cloud中大规模部署它们：

多云或本地
托管云（SaaS）
混合云
AI应用商店

我们很自豪有超过25位（世界280位）Kaggle大师将H2O称为家，其中包括三位进入世界第一的Kaggle大师。

免责声明

在使用本存储库中提供的大型语言模型之前，请仔细阅读本免责声明。您使用该模型表示您同意以下条款和条件。

偏见和冒犯性：大型语言模型在各种互联网文本数据上进行训练，这些数据可能包含偏见、种族主义、冒犯性或其他不适当的内容。通过使用此模型，您承认并接受生成的内容有时可能会表现出偏见或产生冒犯性或不适当的内容。本存储库的开发人员不认可、支持或推广任何此类内容或观点。
限制：大型语言模型是基于人工智能的工具，而不是人类。它可能会产生不正确、无意义或不相关的响应。用户有责任批判性地评估生成的内容并自行决定使用它。
使用风险自负：此大型语言模型的用户必须对其使用该工具可能产生的任何后果承担全部责任。本存储库的开发人员和贡献者不对因使用或滥用所提供的模型而导致的任何损害、损失或伤害承担任何责任。
道德考虑：鼓励用户负责任和合乎道德地使用大语言模型。通过使用此模型，您同意不将其用于促进仇恨言论、歧视、骚扰或任何形式的非法或有害活动的目的。
报告问题：如果您遇到大型语言模型生成的任何有偏见的、令人反感的或其他不适当的内容，请通过提供的渠道向存储库维护人员报告，您的反馈将有助于改进模型并缓解潜在问题。
此免责声明的更改：此存储库的开发人员保留权力随时修改或更新此免责声明，恕不另行通知。用户有责任定期查看免责声明以随时了解任何更改。

通过使用本存储库中提供的大型语言模型，您同意接受并遵守本免责声明中概述的条款和条件。如果您不同意本免责声明的任何部分，您应该避免使用模型及其生成的任何内容。

2025-01-27（一）

h2oGPT

文章目录一、关于 h2oGPT二、现场演示特点三、开始行动安装h2oGPT拼贴画演示资源文档指南开发致谢为什么选择 H2O.ai？免责声明一、关于 h2oGPT 使用文档、图像、视频等与本地GPT进行私人聊天。100%私人，Apache 2.0。支持oLLaMa、Mixtral、llama. cpp…...

编程日记 2025/2/1 20:41:36

Win10安装MySQL、Pycharm连接MySQL，Pycharm中运行Django

一、Windows系统mysql相关操作 1、检查系统是否安装mysql 按住win r （调出运行窗口） 输入service.msc，点击【确定】 image.png 打开服务列表-检查是否有mysql服务 （compmgmt.msc） image.png 2、 Windows安装MySQL …...

编程日记 2025/2/1 20:40:36

使用Pygame制作“俄罗斯方块”游戏

1. 前言俄罗斯方块（Tetris） 是一款由方块下落、行消除等核心规则构成的经典益智游戏： 每次从屏幕顶部出现一个随机的方块（由若干小方格组成），玩家可以左右移动或旋转该方块，让它合适地堆叠在…...

编程日记 2025/2/1 20:39:34

【Block总结】ODConv动态卷积，适用于CV任务|即插即用

一、论文信息论文标题：Omni-Dimensional Dynamic Convolution作者：Chao Li, Aojun Zhou, Anbang Yao发表会议：ICLR 2022论文链接：https://arxiv.org/pdf/2209.07947GitHub链接：https://github.com/OSVAI/ODConv 二…...

编程日记 2025/2/1 20:38:32

RK3568 opencv播放视频

文章目录一、opencv相关视频播放类1. `cv::VideoCapture` 类主要构造方法：主要方法：2. 视频播放基本流程代码示例：3. 获取和设置视频属性4. 结合 FFmpeg 使用5. OpenCV 视频播放的局限性6. 结合 Qt 实现更高级的视频播放总结二、QT中的代码实现一、opencv相关视频播放类在…...

编程日记 2025/2/1 20:37:30

《LLM大语言模型+RAG实战+Langchain+ChatGLM-4+Transformer》

文章目录 Langchain的定义Langchain的组成三个核心组件实现整个核心组成部分为什么要使用LangchainLangchain的底层原理Langchain实战操作LangSmithLangChain调用LLM安装openAI库-国内镜像源代码运行结果小结使用Langchain的提示模板部署Langchain程序安装langserve代码请求格…...

编程日记 2025/2/1 20:35:25

【搜索回溯算法篇】：拓宽算法视野--BFS如何解决拓扑排序问题

✨感谢您阅读本篇文章，文章内容是个人学习笔记的整理，如果哪里有误的话还请您指正噢✨ ✨ 个人主页：余辉zmh–CSDN博客 ✨ 文章所属专栏：搜索回溯算法篇–CSDN博客文章目录一.广度优先搜索（BFS）解决拓扑排…...

编程日记 2025/2/1 20:34:23

计算机网络（61）移动IP

前言移动IP（Mobile IP）是由Internet工程任务小组（Internet Engineering Task Force，IETF）提出的一个协议，旨在解决移动设备在不同网络间切换时的通信问题，确保移动设备可以在离开原有网络或子网…...

编程日记 2025/2/1 20:29:16

Elasticsearch+kibana安装(简单易上手）

下载ES( Download Elasticsearch | Elastic ) 将ES安装包解压缩解压后目录如下: 修改ES服务端口（可以不修改） 启动ES 记住这些内容验证ES是否启动成功下载kibana( Download Kibana Free | Get Started Now | Elastic ) 解压后的kibana目…...

编程日记 2025/2/1 20:27:12

音视频多媒体编解码器基础-codec

如果要从事编解码多媒体的工作，需要准备哪些更为基础的内容，这里帮你总结完。因为数据类型不同所以编解码算法不同，分为图像、视频和音频三大类；因为流程不同，可以分为编码和解码两部分；因为编码器实现不…...

编程日记 2025/2/1 20:26:11

【算法与数据结构】动态规划

目录基本概念最长递增子序列（中等） 最大子数组和（中等） 基本概念重叠子问题一个问题可以被分解为多个子问题，并且这些子问题在求解过程中会被多次重复计算。例如，在计算斐波那契数列时，…...

编程日记 2025/2/1 20:24:09

DeepSeekMoE：迈向混合专家语言模型的终极专业化

一、结论写在前面论文提出了MoE语言模型的DeepSeekMoE架构，目的是实现终极的专家专业化(expert specialization)。通过细粒度的专家分割和共享专家隔离，DeepSeekMoE相比主流的MoE架构实现了显著更高的专家专业化和性能。从较小的2B参数规模开始&#x…...

编程日记 2025/2/1 20:22:05

什么是Maxscript？为什么要学习Maxscript？

MAXScript是Autodesk 3ds Max的内置脚本语言，它是一种与3dsMax对话并使3dsMax执行某些操作的编程语言。它是一种脚本语言，这意味着您不需要编译代码即可运行。通过使用一系列基于文本的命令而不是使用UI操作，您可以完成许多使用UI操作无法完成的任务。 Maxscript是一种专有…...

编程日记 2025/2/1 20:19:00

HyperLogLog 近似累计去重技术解析：大数据场景下的高效基数统计

目录引言一、HyperLogLog 核心原理 1.1 算法思想 1.2 误差特性二、SQL 实现详解（PostgreSQL 示例）...

编程日记 2025/2/1 20:17:58

LabVIEW透镜多参数自动检测系统

在现代制造业中，提升产品质量检测的自动化水平是提高生产效率和准确性的关键。本文介绍了一个基于LabVIEW的透镜多参数自动检测系统，该系统能够在单一工位上完成透镜的多项质量参数检测，并实现透镜的自动搬运与分选，极大地提升了检…...

编程日记 2025/2/1 20:16:55

MySQL数据库（二）- SQL

目录编辑一 DDL (一数据库操作 1 查询-数据库（所有/当前） 2 创建-数据库 3 删除-数据库 4 使用-数据库 (二表操作 1 创建-表结构 2 查询-所有表结构名称 3 查询-表结构内容 4 查询-建表语句 5 添加-字段名数据类型 6 修改-字段数据类…...

编程日记 2025/2/1 20:15:53

【Block总结】HiLo注意力，局部自注意力捕获细粒度的高频信息，通过全局注意力捕获低频信息|即插即用

一、论文信息标题: Fast Vision Transformers with HiLo AttentionGitHub链接: https://github.com/ziplab/LITv2论文链接: arXiv 二、创新点 HiLo注意力机制: 本文提出了一种新的自注意力机制——HiLo注意力，旨在同时捕捉图像中的高频和低频特征。该机制通过将…...

编程日记 2025/2/1 20:11:49

python 使用Whisper模型进行语音翻译

目录一、Whisper 是什么？二、Whisper 的基本命令行用法三、代码实践四、是否保留Token标记五、翻译长度问题六、性能分析一、Whisper 是什么？ Whisper 是由 OpenAI 开源的一个自动语音识别（Automatic Speech Recognition, ASR）系统。它的主要特点是：多语言…...

编程日记 2025/2/1 20:05:41

1.关联按钮上的Key事件按钮上的keypress，keydown，keyup事件随便一个即可private void textBox1_KeyDown(object sender, KeyEventArgs e){if (e.KeyCode Keys.Enter){this.textBox2.Focus();}}2.窗体上的事件private void textBox2_KeyPress(object sen…...

编程日记 2025/2/1 20:04:40

Github 2025-01-30 Go开源项目日报 Top10

根据Github Trendings的统计，今日(2025-01-30统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Go项目10Ollama: 本地大型语言模型设置与运行创建周期：248 天开发语言：Go协议类型：MIT LicenseStar数量：42421 个Fork数量：2724 次关注人…...

编程日记 2025/2/1 20:03:38

stm32G473的flash模式是单bank还是双bank？

今天突然有人stm32G473的flash模式是单bank还是双bank？由于时间太久，我真忘记了。搜搜发现，还真有人和我一样。见下面的链接：https://shequ.stmicroelectronics.cn/forum.php?modviewthread&tid644563 根据STM32G4系列参考手…...

编程新知 2025/7/8 7:08:25

＜6＞-MySQL表的增删查改

目录一，create（创建表） 二，retrieve（查询表） 1，select列 2，where条件三，update（更新表） 四，delete（删除表&#xf…...

编程新知 2025/7/7 8:38:21

Qt/C++开发监控GB28181系统/取流协议/同时支持udp/tcp被动/tcp主动

一、前言说明在2011版本的gb28181协议中，拉取视频流只要求udp方式，从2016开始要求新增支持tcp被动和tcp主动两种方式，udp理论上会丢包的，所以实际使用过程可能会出现画面花屏的情况，而tcp肯定不丢包，起码…...

编程新知 2025/7/8 9:59:33

k8s从入门到放弃之Ingress七层负载

k8s从入门到放弃之Ingress七层负载在Kubernetes（简称K8s）中，Ingress是一个API对象，它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress，你可…...

编程新知 2025/6/18 13:47:59

可靠性+灵活性：电力载波技术在楼宇自控中的核心价值

可靠性灵活性：电力载波技术在楼宇自控中的核心价值在智能楼宇的自动化控制中，电力载波技术（PLC）凭借其独特的优势，正成为构建高效、稳定、灵活系统的核心解决方案。它利用现有电力线路传输数据，无需额外布…...

编程新知 2025/7/5 23:31:25

STM32标准库-DMA直接存储器存取

文章目录一、DMA1.1简介1.2存储器映像1.3DMA框图1.4DMA基本结构1.5DMA请求1.6数据宽度与对齐1.7数据转运DMA1.8ADC扫描模式DMA 二、数据转运DMA2.1接线图2.2代码2.3相关API 一、DMA 1.1简介 DMA（Direct Memory Access）直接存储器存取 DMA可以提供外设…...

编程新知 2025/7/8 8:47:34

Caliper 配置文件解析：config.yaml

Caliper 是一个区块链性能基准测试工具，用于评估不同区块链平台的性能。下面我将详细解释你提供的 fisco-bcos.json 文件结构，并说明它与 config.yaml 文件的关系。 fisco-bcos.json 文件解析这个文件是针对 FISCO-BCOS 区块链网络的 Caliper 配置文件，主要包含以下几个部…...

编程新知 2025/7/7 17:01:50

OpenLayers 分屏对比(地图联动)

注：当前使用的是 ol 5.3.0 版本，天地图使用的key请到天地图官网申请，并替换为自己的key 地图分屏对比在WebGIS开发中是很常见的功能，和卷帘图层不一样的是，分屏对比是在各个地图中添加相同或者不同的图层进行对比查看。…...

编程新知 2025/6/21 8:18:07

CMake控制VS2022项目文件分组

我们可以通过 CMake 控制源文件的组织结构，使它们在 VS 解决方案资源管理器中以“组”（Filter）的形式进行分类展示。 🎯 目标通过 CMake 脚本将 .cpp、.h 等源文件分组显示在 Visual Studio 2022 的解决方案资源管理器中。 ✅ 支持的方法汇总（共4种）方法描述是否推荐…...

编程新知 2025/7/5 12:54:36

HDFS分布式存储 zookeeper

hadoop介绍狭义上hadoop是指apache的一款开源软件用java语言实现开源框架，允许使用简单的变成模型跨计算机对大型集群进行分布式处理（1.海量的数据存储 2.海量数据的计算）Hadoop核心组件 hdfs（分布式文件存储系统）&a…...

编程新知 2025/7/7 5:44:33