h2oGPT
文章目录
- 一、关于 h2oGPT
- 二、现场演示
- 特点
- 三、开始行动
- 安装h2oGPT
- 拼贴画演示
- 资源
- 文档指南
- 开发
- 致谢
- 为什么选择 H2O.ai?
- 免责声明
一、关于 h2oGPT
使用文档、图像、视频等与本地GPT进行私人聊天。100%私人,Apache 2.0。支持oLLaMa、Mixtral、llama. cpp等。演示:https://gpt.h2o.ai/ https://gpt-docs.h2o.ai/
喜欢项目就把★变成⭐(右上角)!
使用h2oGPT(一个Apache V2开源项目)查询和总结您的文档或与本地私有GPT LLM聊天。
查看一个长CoT Open-o1开放🍓草莓🍓项目:https://github.com/pseudotensor/open-strawberry
二、现场演示
https://private-user-images.githubusercontent.com/2249614/253246405-2f805035-2c85-42fb-807f-fd0bca79abc6.mp4
YouTube4K视频 : https://www.youtube.com/watch?v=_iktbj4obAI
特点
- 任何文档的离线私有数据库(PDF、Excel、Word、图像、视频帧、YouTube、音频、代码、文本、MarkDown等)
- 使用准确嵌入的持久数据库(Chroma、Weaviate或内存FAISS)(讲师大、all-MiniLM-L6-v2等)
- 使用指示调整的LLM有效使用上下文(不需要LangChain的少镜头方法)
- 并行汇总和提取,使用13BLLaMa2模型达到每秒80个令牌的输出
- 基于LLM响应的增强检索的HYDE(假设文档嵌入)
- 用于更好文档拆分的语义分块(需要GPU)
- 支持各种模型(LLaMa2, Mistral, Falcon, Vicuna, WizardLM. With AutoGPTQ, 4-bit/8-bit, LORA, 等)
- 来自HF和LLaMa. cpp GGML模型的GPU支持,以及使用HF、LLaMa.cpp和GPT4ALL模型的CPU支持
- 任意长的注意力汇生成(LLaMa-2,米斯特拉尔,MPT,皮提亚,猎鹰等)
- Gradio UI或CLI,可流式传输所有型号
- 通过UI上传和查看文档(控制多个协作或个人收藏)
- 视觉型号LLaVa, Claude-3,Jiony-Pro-Vision,GPT-4-Vision
- 图像生成稳定扩散(sdxl-turbo、sdxl、SD3)、Playground AI(playv2)和Flux
- 使用带有流式音频转换的Whisper的语音STT
- 使用MIT许可的Microsoft Speech T5的语音TTS,具有多种语音和流式音频转换
- 使用MPL2许可TTS的语音TTS,包括语音克隆和流式音频转换
- AI Assistant语音控制模式,免提控制h2oGPT聊天
- 同时针对多个模型的烘烤UI模式
- 通过UI轻松下载模型工件并控制LLaMa. cpp等模型
- 通过Native或Google OAuth通过用户/密码在UI中进行身份验证
- 用户/密码在UI中的状态保存
- Open Web UI 和 h2oGPT 通过 OpenAI Proxy 作为后端
- 请参见启动文档。
- 通过流媒体完成聊天
- 使用DocTR的高级OCR使用h2oGPT摄取进行文档Q/A
- 视觉模型
- 音频转录(STT)
- 音频生成(TTS)
- 图像生成
- 认证
- 国家保全
- Linux、Docker、macOS和Windows支持
- 推理服务器 支持oLLaMa、HF TGI服务器、vLLM、Gradio、ExLLaMa、复制、Together.ai、OpenAI、Azure OpenAI、Anrowpic、MistralAI、Google和Groq
- 兼容OpenAI
- 服务器代理API(h2oGPT充当OpenAI服务器的直接替代品)
- 聊天和文本完成(流式和非流式)
- 音频转录(STT)
- 音频生成(TTS)
- 图像生成
- 嵌入
- 带自动工具选择的功能工具调用
- AutoGen代码执行代理
- JSON模式
- 通过使用大纲对vLLM进行严格的模式控制
- OpenAI、Anthropic、Google Double、MistralAI模型的严格模式控制
- JSON模式适用于一些较旧的带有模式控制的OpenAI或双子座模型,如果模型足够智能(例如双子座1.5闪存)
- 通过代码块提取的任何模型
- 网络搜索与聊天和文档问答的集成
- 代理商
- 通过单独端口上的OpenAI代理服务器提供高质量代理
- 代码优先代理,通过视觉模型等生成绘图、研究、评估图像(客户端代码openai_server/openai_client.py)。
- 没有UI,只有API
- 使用奖励模型评估绩效
- 通过超过1000个单元和超过24个GPU小时的集成测试保持质量
三、开始行动
- GitHub license : ttps://github.com/h2oai/h2ogpt/blob/main/LICENSE
- Linux : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_LINUX.md
- macOS : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_MACOS.md
- Windows : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_WINDOWS.md
- Docker : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_DOCKER.md
安装h2oGPT
Docker推荐用于Linux、Windows和MAC以获得完整功能。Linux脚本也具有完整功能,而Windows和MAC脚本的功能不如使用Docker。
- Docker构建和运行文档(Linux、Windows、MAC)
- Linux安装和运行文档
- Windows 10/11安装脚本
- MAC安装和运行文档
- 在任何平台上快速入门
拼贴画演示
- https://colab.research.google.com/drive/13RiBdAFZ6xqDwDKfW6BG_-tXfXiqPNQe?usp=sharing
- https://colab.research.google.com/drive/143-KFHs2iCqXTQLI2pFCDiR69z0dR8iE?usp=sharing
资源
- 常见问题解答
- LangChain自述文件
- Discord
- 模型(LLaMa-2、Falcon 40等)🤗
- YouTube: 100%离线ChatGPT替代方案?
- YouTube:终极开源LLM摊牌(测试了6个模型)-令人惊讶的结果!
- YouTube:快速猎鹰40b🚀未经审查,开源,完全托管,与您的文档聊天
- 技术论文:https://arxiv.org/pdf/2306.08161.pdf
文档指南
- 开始行动
- Linux(CPU或CUDA)
- macOS(CPU或M1/M2)
- Windows 10/11(CPU或CUDA)
- GPU(CUDA、AutoGPTQ、exllama)运行详情
- CPU运行详情
- CLI聊天
- 等级UI
- 客户端API(Gradio,符合OpenAI)
- 推理服务器(oLLaMa、HF TGI服务器、vLLM、Groq、Anrowpic、Google、Mistral、Gradio、ExLLaMa、Replate、OpenAI、Azure OpenAI)
- 构建Python轮
- 离线安装
- 低内存
- Docker
- LangChain文档支持
- 与Private ateGPT等人相比。
- 路线图
- 发展
- 帮助
- 支持的LangChain文件类型
- CLI数据库控件
- 常见问题解答
- 型号使用说明
- 添加LLM模型(包括使用GGUF和注意力接收器)
- 添加嵌入模型
- 添加提示
- 语境学习
- 多个GPU
- 低内存使用
- 环境变量
- 服务器和客户端的HTTPS访问
- 有用链接
- 微调
- 海卫一
- 商业可行性
- 致谢
- 为什么H2O.ai?
- 免责声明
开发
-
要为训练和生成创建开发环境,请遵循安装说明。
-
要对数据微调任何LLM模型,请按照微调说明进行。
-
运行 h2oGPT 测试:
pip install requirements-parser pytest-instafail pytest-random-order playsound==1.3.0
conda install -c conda-forge gst-python -y
sudo apt-get install gstreamer-1.0
pip install pygame
GPT_H2O_AI=0 CONCURRENCY_COUNT=1 pytest --instafail -s -v tests
# for openai server test on already-running local server
pytest -s -v -n 4 openai_server/test_openai_server.py::test_openai_client
或运行下面代码 并行测试
tests/test4gpus.sh
致谢
- 一些训练代码基于3月24日版本的羊驼-洛拉。
- 使用OpenAssistant创建的高质量数据。
- 使用EleutherAI的基本模型。
- 使用LAION创建的OIG数据。
为什么选择 H2O.ai?
我们创客的H2O.ai已经建立了几个世界级的机器学习、深度学习和人工智能平台:
- #1企业开源机器学习平台H2O-3
- 世界上最好的AutoML(自动机器学习)与H2O无人驾驶AI
- 无代码深度学习与H2O氢炬
- 文档AI中的深度学习文档处理
我们还构建了用于部署和监控以及数据处理和治理的平台:
- H2O MLOps可大规模部署和监控模型
- H2O功能商店与AT&T合作
- 开源低代码AI应用程序开发框架Wave和Nitro
- 开源Python数据化(H2O无人驾驶AI特征工程引擎)
我们的许多客户正在创建模型,并在H2O AI Cloud中大规模部署它们:
- 多云或本地
- 托管云(SaaS)
- 混合云
- AI应用商店
我们很自豪有超过25位(世界280位)Kaggle大师将H2O称为家,其中包括三位进入世界第一的Kaggle大师。
免责声明
在使用本存储库中提供的大型语言模型之前,请仔细阅读本免责声明。您使用该模型表示您同意以下条款和条件。
- 偏见和冒犯性:大型语言模型在各种互联网文本数据上进行训练,这些数据可能包含偏见、种族主义、冒犯性或其他不适当的内容。通过使用此模型,您承认并接受生成的内容有时可能会表现出偏见或产生冒犯性或不适当的内容。本存储库的开发人员不认可、支持或推广任何此类内容或观点。
- 限制:大型语言模型是基于人工智能的工具,而不是人类。它可能会产生不正确、无意义或不相关的响应。用户有责任批判性地评估生成的内容并自行决定使用它。
- 使用风险自负:此大型语言模型的用户必须对其使用该工具可能产生的任何后果承担全部责任。本存储库的开发人员和贡献者不对因使用或滥用所提供的模型而导致的任何损害、损失或伤害承担任何责任。
- 道德考虑:鼓励用户负责任和合乎道德地使用大语言模型。通过使用此模型,您同意不将其用于促进仇恨言论、歧视、骚扰或任何形式的非法或有害活动的目的。
- 报告问题:如果您遇到大型语言模型生成的任何有偏见的、令人反感的或其他不适当的内容,请通过提供的渠道向存储库维护人员报告,您的反馈将有助于改进模型并缓解潜在问题。
- 此免责声明的更改:此存储库的开发人员保留权力随时修改或更新此免责声明,恕不另行通知。用户有责任定期查看免责声明以随时了解任何更改。
通过使用本存储库中提供的大型语言模型,您同意接受并遵守本免责声明中概述的条款和条件。如果您不同意本免责声明的任何部分,您应该避免使用模型及其生成的任何内容。
2025-01-27(一)
相关文章:

h2oGPT
文章目录 一、关于 h2oGPT二、现场演示特点 三、开始行动安装h2oGPT拼贴画演示资源文档指南开发致谢为什么选择 H2O.ai?免责声明 一、关于 h2oGPT 使用文档、图像、视频等与本地GPT进行私人聊天。100%私人,Apache 2.0。支持oLLaMa、Mixtral、llama. cpp…...

Win10安装MySQL、Pycharm连接MySQL,Pycharm中运行Django
一、Windows系统mysql相关操作 1、 检查系统是否安装mysql 按住win r (调出运行窗口) 输入service.msc,点击【确定】 image.png 打开服务列表-检查是否有mysql服务 (compmgmt.msc) image.png 2、 Windows安装MySQL …...

使用Pygame制作“俄罗斯方块”游戏
1. 前言 俄罗斯方块(Tetris) 是一款由方块下落、行消除等核心规则构成的经典益智游戏: 每次从屏幕顶部出现一个随机的方块(由若干小方格组成),玩家可以左右移动或旋转该方块,让它合适地堆叠在…...

【Block总结】ODConv动态卷积,适用于CV任务|即插即用
一、论文信息 论文标题:Omni-Dimensional Dynamic Convolution作者:Chao Li, Aojun Zhou, Anbang Yao发表会议:ICLR 2022论文链接:https://arxiv.org/pdf/2209.07947GitHub链接:https://github.com/OSVAI/ODConv 二…...

RK3568 opencv播放视频
文章目录 一、opencv相关视频播放类1. `cv::VideoCapture` 类主要构造方法:主要方法:2. 视频播放基本流程代码示例:3. 获取和设置视频属性4. 结合 FFmpeg 使用5. OpenCV 视频播放的局限性6. 结合 Qt 实现更高级的视频播放总结二、QT中的代码实现一、opencv相关视频播放类 在…...

《LLM大语言模型+RAG实战+Langchain+ChatGLM-4+Transformer》
文章目录 Langchain的定义Langchain的组成三个核心组件实现整个核心组成部分 为什么要使用LangchainLangchain的底层原理Langchain实战操作LangSmithLangChain调用LLM安装openAI库-国内镜像源代码运行结果小结 使用Langchain的提示模板部署Langchain程序安装langserve代码请求格…...

【搜索回溯算法篇】:拓宽算法视野--BFS如何解决拓扑排序问题
✨感谢您阅读本篇文章,文章内容是个人学习笔记的整理,如果哪里有误的话还请您指正噢✨ ✨ 个人主页:余辉zmh–CSDN博客 ✨ 文章所属专栏:搜索回溯算法篇–CSDN博客 文章目录 一.广度优先搜索(BFS)解决拓扑排…...

计算机网络 (61)移动IP
前言 移动IP(Mobile IP)是由Internet工程任务小组(Internet Engineering Task Force,IETF)提出的一个协议,旨在解决移动设备在不同网络间切换时的通信问题,确保移动设备可以在离开原有网络或子网…...

Elasticsearch+kibana安装(简单易上手)
下载ES( Download Elasticsearch | Elastic ) 将ES安装包解压缩 解压后目录如下: 修改ES服务端口(可以不修改) 启动ES 记住这些内容 验证ES是否启动成功 下载kibana( Download Kibana Free | Get Started Now | Elastic ) 解压后的kibana目…...

音视频多媒体编解码器基础-codec
如果要从事编解码多媒体的工作,需要准备哪些更为基础的内容,这里帮你总结完。 因为数据类型不同所以编解码算法不同,分为图像、视频和音频三大类;因为流程不同,可以分为编码和解码两部分;因为编码器实现不…...

【算法与数据结构】动态规划
目录 基本概念 最长递增子序列(中等) 最大子数组和(中等) 基本概念 重叠子问题 一个问题可以被分解为多个子问题,并且这些子问题在求解过程中会被多次重复计算。例如,在计算斐波那契数列时,…...

DeepSeekMoE:迈向混合专家语言模型的终极专业化
一、结论写在前面 论文提出了MoE语言模型的DeepSeekMoE架构,目的是实现终极的专家专业化(expert specialization)。通过细粒度的专家分割和共享专家隔离,DeepSeekMoE相比主流的MoE架构实现了显著更高的专家专业化和性能。从较小的2B参数规模开始&#x…...

什么是Maxscript?为什么要学习Maxscript?
MAXScript是Autodesk 3ds Max的内置脚本语言,它是一种与3dsMax对话并使3dsMax执行某些操作的编程语言。它是一种脚本语言,这意味着您不需要编译代码即可运行。通过使用一系列基于文本的命令而不是使用UI操作,您可以完成许多使用UI操作无法完成的任务。 Maxscript是一种专有…...

HyperLogLog 近似累计去重技术解析:大数据场景下的高效基数统计
目录 引言 一、HyperLogLog 核心原理 1.1 算法思想 1.2 误差特性 二、SQL 实现详解(PostgreSQL 示例)...

LabVIEW透镜多参数自动检测系统
在现代制造业中,提升产品质量检测的自动化水平是提高生产效率和准确性的关键。本文介绍了一个基于LabVIEW的透镜多参数自动检测系统,该系统能够在单一工位上完成透镜的多项质量参数检测,并实现透镜的自动搬运与分选,极大地提升了检…...

MySQL数据库(二)- SQL
目录 编辑 一 DDL (一 数据库操作 1 查询-数据库(所有/当前) 2 创建-数据库 3 删除-数据库 4 使用-数据库 (二 表操作 1 创建-表结构 2 查询-所有表结构名称 3 查询-表结构内容 4 查询-建表语句 5 添加-字段名数据类型 6 修改-字段数据类…...

【Block总结】HiLo注意力,局部自注意力捕获细粒度的高频信息,通过全局注意力捕获低频信息|即插即用
一、论文信息 标题: Fast Vision Transformers with HiLo AttentionGitHub链接: https://github.com/ziplab/LITv2论文链接: arXiv 二、创新点 HiLo注意力机制: 本文提出了一种新的自注意力机制——HiLo注意力,旨在同时捕捉图像中的高频和低频特征。该机制通过将…...

python 使用Whisper模型进行语音翻译
目录 一、Whisper 是什么? 二、Whisper 的基本命令行用法 三、代码实践 四、是否保留Token标记 五、翻译长度问题 六、性能分析 一、Whisper 是什么? Whisper 是由 OpenAI 开源的一个自动语音识别(Automatic Speech Recognition, ASR)系统。它的主要特点是: 多语言…...

C# Winform enter键怎么去关联button
1.关联按钮上的Key事件按钮上的keypress,keydown,keyup事件随便一个即可private void textBox1_KeyDown(object sender, KeyEventArgs e){if (e.KeyCode Keys.Enter){this.textBox2.Focus();}}2.窗体上的事件private void textBox2_KeyPress(object sen…...

Github 2025-01-30 Go开源项目日报 Top10
根据Github Trendings的统计,今日(2025-01-30统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Go项目10Ollama: 本地大型语言模型设置与运行 创建周期:248 天开发语言:Go协议类型:MIT LicenseStar数量:42421 个Fork数量:2724 次关注人…...

电路研究9.2.6——合宙Air780EP中HTTP——HTTP GET 相关命令使用方法研究
这个也是一种协议类型: 14.16 使用方法举例 根据之前多种类似的协议的相关信息: HTTP/HTTPS:超文本传输协议(HTTP)用于Web数据的传输,而HTTPS是HTTP的安全版本,使用SSL/TLS进行加密。与FTP相比&…...

Java手写简单Merkle树
Java手写Merkle树代码 package com.blockchain.qgy.component;import com.blockchain.qgy.model.MerkleTreeNode; import com.blockchain.qgy.util.SHAUtil;import java.util.*;public class MerkleTree<T> {//merkle树private List<MerkleTreeNode<T>> lis…...

DeepSeek的使用技巧介绍
DeepSeek是一款由杭州深度求索人工智能技术有限公司开发的AI工具,结合了自然语言处理和深度学习技术,能够完成多种任务,如知识问答、数据分析、文案创作、代码开发等。以下将从使用技巧、核心功能及注意事项等方面详细介绍DeepSeek的使用方法…...

19 压测和常用的接口优化方案
高并发的平台应用,项目上线前离不开一个重要步骤就是压测,压测对于编码中的资源是否问题的排查,性能的调优都是离不开的。测试还要做测试报告,出具了测试报告给到运维团队才能上线。 压测的测试报告主要有以下几个方面:1.响应时间…...

AI应用部署——streamlit
如何把项目部署到一个具有公网ip地址的服务器上,让他人看到? 可以利用 streamlit 的社区云免费部署 1、生成requirements.txt文件 终端输入pip freeze > requirements.txt即可 requirements.txt里既包括自己安装过的库,也包括这些库的…...

NLP自然语言处理通识
目录 ELMO 一、ELMo的核心设计理念 1. 静态词向量的局限性 2. 动态上下文嵌入的核心思想 3. 层次化特征提取 二、ELMo的模型结构与技术逻辑 1. 双向语言模型(BiLM) 2. 多层LSTM的层次化表示 三、ELMo的运行过程 1. 预训练阶段 2. 下游任务微调 四、ELMo的…...

C++ 6
C构造函数有几种,分别什么作用 在C中,构造函数有几种不同的类型,每种都有其特定的作用: 默认构造函数:没有参数的构造函数,用于创建对象的默认实例。参数化构造函数:带参数的构造函数…...

使用QSqlQueryModel创建交替背景色的表格模型
class UserModel(QSqlQueryModel):def __init__(self):super().__init__()self._query "SELECT name, age FROM users"self.refresh()def refresh(self):self.setQuery(self._query)# 重新定义data()方法def data(self, index, role): if role Qt.BackgroundRole…...

jinfo命令详解
jinfo [option]option 有以下这些选项参数 -flag : 打印 指定名称的 jvm 参数值;-flag [|-] : 启动或禁用指定名称的 jvm参数;-flag : 设置指定名称的 jvm 参数值;-sysprops: 打印 java 系统属性-h | -help: 打印 jinfo 命令帮助信息 1&…...

如何在 ACP 中建模复合罐
概括 本篇博文介绍了 ANSYS Composite PrepPost (ACP) 缠绕向导。此工具允许仅使用几个条目自动定义高压罐中常见的悬垂复合结构。 ACP 绕线向导 将必要的信息输入到绕组向导中。重要的是要注意“参考半径”,它代表圆柱截面的半径,以及“轴向”&#x…...