当前位置: 首页 > news >正文

h2oGPT

文章目录

    • 一、关于 h2oGPT
    • 二、现场演示
      • 特点
    • 三、开始行动
      • 安装h2oGPT
      • 拼贴画演示
      • 资源
      • 文档指南
      • 开发
      • 致谢
      • 为什么选择 H2O.ai?
      • 免责声明


一、关于 h2oGPT

使用文档、图像、视频等与本地GPT进行私人聊天。100%私人,Apache 2.0。支持oLLaMa、Mixtral、llama. cpp等。演示:https://gpt.h2o.ai/ https://gpt-docs.h2o.ai/

喜欢项目就把★变成⭐(右上角)!

使用h2oGPT(一个Apache V2开源项目)查询和总结您的文档或与本地私有GPT LLM聊天。

查看一个长CoT Open-o1开放🍓草莓🍓项目:https://github.com/pseudotensor/open-strawberry


二、现场演示

https://private-user-images.githubusercontent.com/2249614/253246405-2f805035-2c85-42fb-807f-fd0bca79abc6.mp4

YouTube4K视频 : https://www.youtube.com/watch?v=_iktbj4obAI


特点

  • 任何文档的离线私有数据库(PDF、Excel、Word、图像、视频帧、YouTube、音频、代码、文本、MarkDown等)
    • 使用准确嵌入的持久数据库(Chroma、Weaviate或内存FAISS)(讲师大、all-MiniLM-L6-v2等)
    • 使用指示调整的LLM有效使用上下文(不需要LangChain的少镜头方法)
    • 并行汇总和提取,使用13BLLaMa2模型达到每秒80个令牌的输出
    • 基于LLM响应的增强检索的HYDE(假设文档嵌入)
    • 用于更好文档拆分的语义分块(需要GPU)
  • 支持各种模型(LLaMa2, Mistral, Falcon, Vicuna, WizardLM. With AutoGPTQ, 4-bit/8-bit, LORA, 等)
    • 来自HF和LLaMa. cpp GGML模型的GPU支持,以及使用HF、LLaMa.cpp和GPT4ALL模型的CPU支持
    • 任意长的注意力汇生成(LLaMa-2,米斯特拉尔,MPT,皮提亚,猎鹰等)
  • Gradio UI或CLI,可流式传输所有型号
    • 通过UI上传和查看文档(控制多个协作或个人收藏)
    • 视觉型号LLaVa, Claude-3,Jiony-Pro-Vision,GPT-4-Vision
    • 图像生成稳定扩散(sdxl-turbo、sdxl、SD3)、Playground AI(playv2)和Flux
    • 使用带有流式音频转换的Whisper的语音STT
    • 使用MIT许可的Microsoft Speech T5的语音TTS,具有多种语音和流式音频转换
    • 使用MPL2许可TTS的语音TTS,包括语音克隆和流式音频转换
    • AI Assistant语音控制模式,免提控制h2oGPT聊天
    • 同时针对多个模型的烘烤UI模式
    • 通过UI轻松下载模型工件并控制LLaMa. cpp等模型
    • 通过Native或Google OAuth通过用户/密码在UI中进行身份验证
    • 用户/密码在UI中的状态保存
  • Open Web UI 和 h2oGPT 通过 OpenAI Proxy 作为后端
    • 请参见启动文档。
    • 通过流媒体完成聊天
    • 使用DocTR的高级OCR使用h2oGPT摄取进行文档Q/A
    • 视觉模型
    • 音频转录(STT)
    • 音频生成(TTS)
    • 图像生成
    • 认证
    • 国家保全
  • Linux、Docker、macOS和Windows支持
  • 推理服务器 支持oLLaMa、HF TGI服务器、vLLM、Gradio、ExLLaMa、复制、Together.ai、OpenAI、Azure OpenAI、Anrowpic、MistralAI、Google和Groq
  • 兼容OpenAI
    • 服务器代理API(h2oGPT充当OpenAI服务器的直接替代品)
    • 聊天和文本完成(流式和非流式)
    • 音频转录(STT)
    • 音频生成(TTS)
    • 图像生成
    • 嵌入
    • 带自动工具选择的功能工具调用
    • AutoGen代码执行代理
  • JSON模式
    • 通过使用大纲对vLLM进行严格的模式控制
    • OpenAI、Anthropic、Google Double、MistralAI模型的严格模式控制
    • JSON模式适用于一些较旧的带有模式控制的OpenAI或双子座模型,如果模型足够智能(例如双子座1.5闪存)
    • 通过代码块提取的任何模型
  • 网络搜索与聊天和文档问答的集成
  • 代理商
    • 通过单独端口上的OpenAI代理服务器提供高质量代理
    • 代码优先代理,通过视觉模型等生成绘图、研究、评估图像(客户端代码openai_server/openai_client.py)。
    • 没有UI,只有API
  • 使用奖励模型评估绩效
  • 通过超过1000个单元和超过24个GPU小时的集成测试保持质量

三、开始行动

  • GitHub license : ttps://github.com/h2oai/h2ogpt/blob/main/LICENSE
  • Linux : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_LINUX.md
  • macOS : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_MACOS.md
  • Windows : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_WINDOWS.md
  • Docker : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_DOCKER.md

安装h2oGPT

Docker推荐用于Linux、Windows和MAC以获得完整功能。Linux脚本也具有完整功能,而Windows和MAC脚本的功能不如使用Docker。

  • Docker构建和运行文档(Linux、Windows、MAC)
  • Linux安装和运行文档
  • Windows 10/11安装脚本
  • MAC安装和运行文档
  • 在任何平台上快速入门

拼贴画演示

  • https://colab.research.google.com/drive/13RiBdAFZ6xqDwDKfW6BG_-tXfXiqPNQe?usp=sharing
  • https://colab.research.google.com/drive/143-KFHs2iCqXTQLI2pFCDiR69z0dR8iE?usp=sharing

资源

  • 常见问题解答
  • LangChain自述文件
  • Discord
  • 模型(LLaMa-2、Falcon 40等)🤗
  • YouTube: 100%离线ChatGPT替代方案?
  • YouTube:终极开源LLM摊牌(测试了6个模型)-令人惊讶的结果!
  • YouTube:快速猎鹰40b🚀未经审查,开源,完全托管,与您的文档聊天
  • 技术论文:https://arxiv.org/pdf/2306.08161.pdf

文档指南

  • 开始行动
    • Linux(CPU或CUDA)
    • macOS(CPU或M1/M2)
    • Windows 10/11(CPU或CUDA)
    • GPU(CUDA、AutoGPTQ、exllama)运行详情
    • CPU运行详情
    • CLI聊天
    • 等级UI
    • 客户端API(Gradio,符合OpenAI)
    • 推理服务器(oLLaMa、HF TGI服务器、vLLM、Groq、Anrowpic、Google、Mistral、Gradio、ExLLaMa、Replate、OpenAI、Azure OpenAI)
    • 构建Python轮
    • 离线安装
    • 低内存
    • Docker
  • LangChain文档支持
  • 与Private ateGPT等人相比。
  • 路线图
  • 发展
  • 帮助
    • 支持的LangChain文件类型
    • CLI数据库控件
    • 常见问题解答
      • 型号使用说明
      • 添加LLM模型(包括使用GGUF和注意力接收器)
      • 添加嵌入模型
      • 添加提示
      • 语境学习
      • 多个GPU
      • 低内存使用
      • 环境变量
      • 服务器和客户端的HTTPS访问
    • 有用链接
    • 微调
    • 海卫一
    • 商业可行性
  • 致谢
  • 为什么H2O.ai?
  • 免责声明

开发

  • 要为训练和生成创建开发环境,请遵循安装说明。

  • 要对数据微调任何LLM模型,请按照微调说明进行。

  • 运行 h2oGPT 测试:

pip install requirements-parser pytest-instafail pytest-random-order playsound==1.3.0
conda install -c conda-forge gst-python -y
sudo apt-get install gstreamer-1.0
pip install pygame
GPT_H2O_AI=0 CONCURRENCY_COUNT=1 pytest --instafail -s -v tests
# for openai server test on already-running local server
pytest -s -v -n 4 openai_server/test_openai_server.py::test_openai_client

或运行下面代码 并行测试

tests/test4gpus.sh

致谢

  • 一些训练代码基于3月24日版本的羊驼-洛拉。
  • 使用OpenAssistant创建的高质量数据。
  • 使用EleutherAI的基本模型。
  • 使用LAION创建的OIG数据。

为什么选择 H2O.ai?

我们创客的H2O.ai已经建立了几个世界级的机器学习、深度学习和人工智能平台:

  • #1企业开源机器学习平台H2O-3
  • 世界上最好的AutoML(自动机器学习)与H2O无人驾驶AI
  • 无代码深度学习与H2O氢炬
  • 文档AI中的深度学习文档处理

我们还构建了用于部署和监控以及数据处理和治理的平台:

  • H2O MLOps可大规模部署和监控模型
  • H2O功能商店与AT&T合作
  • 开源低代码AI应用程序开发框架Wave和Nitro
  • 开源Python数据化(H2O无人驾驶AI特征工程引擎)

我们的许多客户正在创建模型,并在H2O AI Cloud中大规模部署它们:

  • 多云或本地
  • 托管云(SaaS)
  • 混合云
  • AI应用商店

我们很自豪有超过25位(世界280位)Kaggle大师将H2O称为家,其中包括三位进入世界第一的Kaggle大师。


免责声明

在使用本存储库中提供的大型语言模型之前,请仔细阅读本免责声明。您使用该模型表示您同意以下条款和条件。

  • 偏见和冒犯性:大型语言模型在各种互联网文本数据上进行训练,这些数据可能包含偏见、种族主义、冒犯性或其他不适当的内容。通过使用此模型,您承认并接受生成的内容有时可能会表现出偏见或产生冒犯性或不适当的内容。本存储库的开发人员不认可、支持或推广任何此类内容或观点。
  • 限制:大型语言模型是基于人工智能的工具,而不是人类。它可能会产生不正确、无意义或不相关的响应。用户有责任批判性地评估生成的内容并自行决定使用它。
  • 使用风险自负:此大型语言模型的用户必须对其使用该工具可能产生的任何后果承担全部责任。本存储库的开发人员和贡献者不对因使用或滥用所提供的模型而导致的任何损害、损失或伤害承担任何责任。
  • 道德考虑:鼓励用户负责任和合乎道德地使用大语言模型。通过使用此模型,您同意不将其用于促进仇恨言论、歧视、骚扰或任何形式的非法或有害活动的目的。
  • 报告问题:如果您遇到大型语言模型生成的任何有偏见的、令人反感的或其他不适当的内容,请通过提供的渠道向存储库维护人员报告,您的反馈将有助于改进模型并缓解潜在问题。
  • 此免责声明的更改:此存储库的开发人员保留权力随时修改或更新此免责声明,恕不另行通知。用户有责任定期查看免责声明以随时了解任何更改。

通过使用本存储库中提供的大型语言模型,您同意接受并遵守本免责声明中概述的条款和条件。如果您不同意本免责声明的任何部分,您应该避免使用模型及其生成的任何内容。


2025-01-27(一)

相关文章:

h2oGPT

文章目录 一、关于 h2oGPT二、现场演示特点 三、开始行动安装h2oGPT拼贴画演示资源文档指南开发致谢为什么选择 H2O.ai?免责声明 一、关于 h2oGPT 使用文档、图像、视频等与本地GPT进行私人聊天。100%私人,Apache 2.0。支持oLLaMa、Mixtral、llama. cpp…...

Win10安装MySQL、Pycharm连接MySQL,Pycharm中运行Django

一、Windows系统mysql相关操作 1、 检查系统是否安装mysql 按住win r (调出运行窗口) 输入service.msc,点击【确定】 image.png 打开服务列表-检查是否有mysql服务 (compmgmt.msc) image.png 2、 Windows安装MySQL …...

使用Pygame制作“俄罗斯方块”游戏

1. 前言 俄罗斯方块(Tetris) 是一款由方块下落、行消除等核心规则构成的经典益智游戏: 每次从屏幕顶部出现一个随机的方块(由若干小方格组成),玩家可以左右移动或旋转该方块,让它合适地堆叠在…...

【Block总结】ODConv动态卷积,适用于CV任务|即插即用

一、论文信息 论文标题:Omni-Dimensional Dynamic Convolution作者:Chao Li, Aojun Zhou, Anbang Yao发表会议:ICLR 2022论文链接:https://arxiv.org/pdf/2209.07947GitHub链接:https://github.com/OSVAI/ODConv 二…...

RK3568 opencv播放视频

文章目录 一、opencv相关视频播放类1. `cv::VideoCapture` 类主要构造方法:主要方法:2. 视频播放基本流程代码示例:3. 获取和设置视频属性4. 结合 FFmpeg 使用5. OpenCV 视频播放的局限性6. 结合 Qt 实现更高级的视频播放总结二、QT中的代码实现一、opencv相关视频播放类 在…...

《LLM大语言模型+RAG实战+Langchain+ChatGLM-4+Transformer》

文章目录 Langchain的定义Langchain的组成三个核心组件实现整个核心组成部分 为什么要使用LangchainLangchain的底层原理Langchain实战操作LangSmithLangChain调用LLM安装openAI库-国内镜像源代码运行结果小结 使用Langchain的提示模板部署Langchain程序安装langserve代码请求格…...

【搜索回溯算法篇】:拓宽算法视野--BFS如何解决拓扑排序问题

✨感谢您阅读本篇文章,文章内容是个人学习笔记的整理,如果哪里有误的话还请您指正噢✨ ✨ 个人主页:余辉zmh–CSDN博客 ✨ 文章所属专栏:搜索回溯算法篇–CSDN博客 文章目录 一.广度优先搜索(BFS)解决拓扑排…...

计算机网络 (61)移动IP

前言 移动IP(Mobile IP)是由Internet工程任务小组(Internet Engineering Task Force,IETF)提出的一个协议,旨在解决移动设备在不同网络间切换时的通信问题,确保移动设备可以在离开原有网络或子网…...

Elasticsearch+kibana安装(简单易上手)

下载ES( Download Elasticsearch | Elastic ) 将ES安装包解压缩 解压后目录如下: 修改ES服务端口(可以不修改) 启动ES 记住这些内容 验证ES是否启动成功 下载kibana( Download Kibana Free | Get Started Now | Elastic ) 解压后的kibana目…...

音视频多媒体编解码器基础-codec

如果要从事编解码多媒体的工作,需要准备哪些更为基础的内容,这里帮你总结完。 因为数据类型不同所以编解码算法不同,分为图像、视频和音频三大类;因为流程不同,可以分为编码和解码两部分;因为编码器实现不…...

【算法与数据结构】动态规划

目录 基本概念 最长递增子序列(中等) 最大子数组和(中等) 基本概念 重叠子问题 一个问题可以被分解为多个子问题,并且这些子问题在求解过程中会被多次重复计算。例如,在计算斐波那契数列时,…...

DeepSeekMoE:迈向混合专家语言模型的终极专业化

一、结论写在前面 论文提出了MoE语言模型的DeepSeekMoE架构,目的是实现终极的专家专业化(expert specialization)。通过细粒度的专家分割和共享专家隔离,DeepSeekMoE相比主流的MoE架构实现了显著更高的专家专业化和性能。从较小的2B参数规模开始&#x…...

什么是Maxscript?为什么要学习Maxscript?

MAXScript是Autodesk 3ds Max的内置脚本语言,它是一种与3dsMax对话并使3dsMax执行某些操作的编程语言。它是一种脚本语言,这意味着您不需要编译代码即可运行。通过使用一系列基于文本的命令而不是使用UI操作,您可以完成许多使用UI操作无法完成的任务。 Maxscript是一种专有…...

HyperLogLog 近似累计去重技术解析:大数据场景下的高效基数统计

目录 引言 一、HyperLogLog 核心原理 1.1 算法思想 1.2 误差特性 二、SQL 实现详解(PostgreSQL 示例)...

LabVIEW透镜多参数自动检测系统

在现代制造业中,提升产品质量检测的自动化水平是提高生产效率和准确性的关键。本文介绍了一个基于LabVIEW的透镜多参数自动检测系统,该系统能够在单一工位上完成透镜的多项质量参数检测,并实现透镜的自动搬运与分选,极大地提升了检…...

MySQL数据库(二)- SQL

目录 ​编辑 一 DDL (一 数据库操作 1 查询-数据库(所有/当前) 2 创建-数据库 3 删除-数据库 4 使用-数据库 (二 表操作 1 创建-表结构 2 查询-所有表结构名称 3 查询-表结构内容 4 查询-建表语句 5 添加-字段名数据类型 6 修改-字段数据类…...

【Block总结】HiLo注意力,局部自注意力捕获细粒度的高频信息,通过全局注意力捕获低频信息|即插即用

一、论文信息 标题: Fast Vision Transformers with HiLo AttentionGitHub链接: https://github.com/ziplab/LITv2论文链接: arXiv 二、创新点 HiLo注意力机制: 本文提出了一种新的自注意力机制——HiLo注意力,旨在同时捕捉图像中的高频和低频特征。该机制通过将…...

python 使用Whisper模型进行语音翻译

目录 一、Whisper 是什么? 二、Whisper 的基本命令行用法 三、代码实践 四、是否保留Token标记 五、翻译长度问题 六、性能分析 一、Whisper 是什么? Whisper 是由 OpenAI 开源的一个自动语音识别(Automatic Speech Recognition, ASR)系统。它的主要特点是: 多语言…...

C# Winform enter键怎么去关联button

1.关联按钮上的Key事件按钮上的keypress,keydown,keyup事件随便一个即可private void textBox1_KeyDown(object sender, KeyEventArgs e){if (e.KeyCode Keys.Enter){this.textBox2.Focus();}}2.窗体上的事件private void textBox2_KeyPress(object sen…...

Github 2025-01-30 Go开源项目日报 Top10

根据Github Trendings的统计,今日(2025-01-30统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Go项目10Ollama: 本地大型语言模型设置与运行 创建周期:248 天开发语言:Go协议类型:MIT LicenseStar数量:42421 个Fork数量:2724 次关注人…...

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞!!! 抽象 现代智能交通系统 (ITS) 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 (…...

spring:实例工厂方法获取bean

spring处理使用静态工厂方法获取bean实例,也可以通过实例工厂方法获取bean实例。 实例工厂方法步骤如下: 定义实例工厂类(Java代码),定义实例工厂(xml),定义调用实例工厂&#xff…...

学习STC51单片机32(芯片为STC89C52RCRC)OLED显示屏2

每日一言 今天的每一份坚持,都是在为未来积攒底气。 案例:OLED显示一个A 这边观察到一个点,怎么雪花了就是都是乱七八糟的占满了屏幕。。 解释 : 如果代码里信号切换太快(比如 SDA 刚变,SCL 立刻变&#…...

搭建DNS域名解析服务器(正向解析资源文件)

正向解析资源文件 1)准备工作 服务端及客户端都关闭安全软件 [rootlocalhost ~]# systemctl stop firewalld [rootlocalhost ~]# setenforce 0 2)服务端安装软件:bind 1.配置yum源 [rootlocalhost ~]# cat /etc/yum.repos.d/base.repo [Base…...

Web后端基础(基础知识)

BS架构:Browser/Server,浏览器/服务器架构模式。客户端只需要浏览器,应用程序的逻辑和数据都存储在服务端。 优点:维护方便缺点:体验一般 CS架构:Client/Server,客户端/服务器架构模式。需要单独…...

uniapp 小程序 学习(一)

利用Hbuilder 创建项目 运行到内置浏览器看效果 下载微信小程序 安装到Hbuilder 下载地址 :开发者工具默认安装 设置服务端口号 在Hbuilder中设置微信小程序 配置 找到运行设置,将微信开发者工具放入到Hbuilder中, 打开后出现 如下 bug 解…...

小智AI+MCP

什么是小智AI和MCP 如果还不清楚的先看往期文章 手搓小智AI聊天机器人 MCP 深度解析:AI 的USB接口 如何使用小智MCP 1.刷支持mcp的小智固件 2.下载官方MCP的示例代码 Github:https://github.com/78/mcp-calculator 安这个步骤执行 其中MCP_ENDPOI…...

JavaScript 标签加载

目录 JavaScript 标签加载script 标签的 async 和 defer 属性,分别代表什么,有什么区别1. 普通 script 标签2. async 属性3. defer 属性4. type"module"5. 各种加载方式的对比6. 使用建议 JavaScript 标签加载 script 标签的 async 和 defer …...

Linux入门课的思维导图

耗时两周,终于把慕课网上的Linux的基础入门课实操、总结完了! 第一次以Blog的形式做学习记录,过程很有意思,但也很耗时。 课程时长5h,涉及到很多专有名词,要去逐个查找,以前接触过的概念因为时…...

关于 ffmpeg设置摄像头报错“Could not set video options” 的解决方法

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/148515355 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV…...