h2oGPT
文章目录
- 一、关于 h2oGPT
- 二、现场演示
- 特点
- 三、开始行动
- 安装h2oGPT
- 拼贴画演示
- 资源
- 文档指南
- 开发
- 致谢
- 为什么选择 H2O.ai?
- 免责声明
一、关于 h2oGPT
使用文档、图像、视频等与本地GPT进行私人聊天。100%私人,Apache 2.0。支持oLLaMa、Mixtral、llama. cpp等。演示:https://gpt.h2o.ai/ https://gpt-docs.h2o.ai/
喜欢项目就把★变成⭐(右上角)!
使用h2oGPT(一个Apache V2开源项目)查询和总结您的文档或与本地私有GPT LLM聊天。
查看一个长CoT Open-o1开放🍓草莓🍓项目:https://github.com/pseudotensor/open-strawberry
二、现场演示
https://private-user-images.githubusercontent.com/2249614/253246405-2f805035-2c85-42fb-807f-fd0bca79abc6.mp4
YouTube4K视频 : https://www.youtube.com/watch?v=_iktbj4obAI
特点
- 任何文档的离线私有数据库(PDF、Excel、Word、图像、视频帧、YouTube、音频、代码、文本、MarkDown等)
- 使用准确嵌入的持久数据库(Chroma、Weaviate或内存FAISS)(讲师大、all-MiniLM-L6-v2等)
- 使用指示调整的LLM有效使用上下文(不需要LangChain的少镜头方法)
- 并行汇总和提取,使用13BLLaMa2模型达到每秒80个令牌的输出
- 基于LLM响应的增强检索的HYDE(假设文档嵌入)
- 用于更好文档拆分的语义分块(需要GPU)
- 支持各种模型(LLaMa2, Mistral, Falcon, Vicuna, WizardLM. With AutoGPTQ, 4-bit/8-bit, LORA, 等)
- 来自HF和LLaMa. cpp GGML模型的GPU支持,以及使用HF、LLaMa.cpp和GPT4ALL模型的CPU支持
- 任意长的注意力汇生成(LLaMa-2,米斯特拉尔,MPT,皮提亚,猎鹰等)
- Gradio UI或CLI,可流式传输所有型号
- 通过UI上传和查看文档(控制多个协作或个人收藏)
- 视觉型号LLaVa, Claude-3,Jiony-Pro-Vision,GPT-4-Vision
- 图像生成稳定扩散(sdxl-turbo、sdxl、SD3)、Playground AI(playv2)和Flux
- 使用带有流式音频转换的Whisper的语音STT
- 使用MIT许可的Microsoft Speech T5的语音TTS,具有多种语音和流式音频转换
- 使用MPL2许可TTS的语音TTS,包括语音克隆和流式音频转换
- AI Assistant语音控制模式,免提控制h2oGPT聊天
- 同时针对多个模型的烘烤UI模式
- 通过UI轻松下载模型工件并控制LLaMa. cpp等模型
- 通过Native或Google OAuth通过用户/密码在UI中进行身份验证
- 用户/密码在UI中的状态保存
- Open Web UI 和 h2oGPT 通过 OpenAI Proxy 作为后端
- 请参见启动文档。
- 通过流媒体完成聊天
- 使用DocTR的高级OCR使用h2oGPT摄取进行文档Q/A
- 视觉模型
- 音频转录(STT)
- 音频生成(TTS)
- 图像生成
- 认证
- 国家保全
- Linux、Docker、macOS和Windows支持
- 推理服务器 支持oLLaMa、HF TGI服务器、vLLM、Gradio、ExLLaMa、复制、Together.ai、OpenAI、Azure OpenAI、Anrowpic、MistralAI、Google和Groq
- 兼容OpenAI
- 服务器代理API(h2oGPT充当OpenAI服务器的直接替代品)
- 聊天和文本完成(流式和非流式)
- 音频转录(STT)
- 音频生成(TTS)
- 图像生成
- 嵌入
- 带自动工具选择的功能工具调用
- AutoGen代码执行代理
- JSON模式
- 通过使用大纲对vLLM进行严格的模式控制
- OpenAI、Anthropic、Google Double、MistralAI模型的严格模式控制
- JSON模式适用于一些较旧的带有模式控制的OpenAI或双子座模型,如果模型足够智能(例如双子座1.5闪存)
- 通过代码块提取的任何模型
- 网络搜索与聊天和文档问答的集成
- 代理商
- 通过单独端口上的OpenAI代理服务器提供高质量代理
- 代码优先代理,通过视觉模型等生成绘图、研究、评估图像(客户端代码openai_server/openai_client.py)。
- 没有UI,只有API
- 使用奖励模型评估绩效
- 通过超过1000个单元和超过24个GPU小时的集成测试保持质量
三、开始行动
- GitHub license : ttps://github.com/h2oai/h2ogpt/blob/main/LICENSE
- Linux : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_LINUX.md
- macOS : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_MACOS.md
- Windows : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_WINDOWS.md
- Docker : ttps://github.com/h2oai/h2ogpt/blob/main/docs/README_DOCKER.md
安装h2oGPT
Docker推荐用于Linux、Windows和MAC以获得完整功能。Linux脚本也具有完整功能,而Windows和MAC脚本的功能不如使用Docker。
- Docker构建和运行文档(Linux、Windows、MAC)
- Linux安装和运行文档
- Windows 10/11安装脚本
- MAC安装和运行文档
- 在任何平台上快速入门
拼贴画演示
- https://colab.research.google.com/drive/13RiBdAFZ6xqDwDKfW6BG_-tXfXiqPNQe?usp=sharing
- https://colab.research.google.com/drive/143-KFHs2iCqXTQLI2pFCDiR69z0dR8iE?usp=sharing
资源
- 常见问题解答
- LangChain自述文件
- Discord
- 模型(LLaMa-2、Falcon 40等)🤗
- YouTube: 100%离线ChatGPT替代方案?
- YouTube:终极开源LLM摊牌(测试了6个模型)-令人惊讶的结果!
- YouTube:快速猎鹰40b🚀未经审查,开源,完全托管,与您的文档聊天
- 技术论文:https://arxiv.org/pdf/2306.08161.pdf
文档指南
- 开始行动
- Linux(CPU或CUDA)
- macOS(CPU或M1/M2)
- Windows 10/11(CPU或CUDA)
- GPU(CUDA、AutoGPTQ、exllama)运行详情
- CPU运行详情
- CLI聊天
- 等级UI
- 客户端API(Gradio,符合OpenAI)
- 推理服务器(oLLaMa、HF TGI服务器、vLLM、Groq、Anrowpic、Google、Mistral、Gradio、ExLLaMa、Replate、OpenAI、Azure OpenAI)
- 构建Python轮
- 离线安装
- 低内存
- Docker
- LangChain文档支持
- 与Private ateGPT等人相比。
- 路线图
- 发展
- 帮助
- 支持的LangChain文件类型
- CLI数据库控件
- 常见问题解答
- 型号使用说明
- 添加LLM模型(包括使用GGUF和注意力接收器)
- 添加嵌入模型
- 添加提示
- 语境学习
- 多个GPU
- 低内存使用
- 环境变量
- 服务器和客户端的HTTPS访问
- 有用链接
- 微调
- 海卫一
- 商业可行性
- 致谢
- 为什么H2O.ai?
- 免责声明
开发
-
要为训练和生成创建开发环境,请遵循安装说明。
-
要对数据微调任何LLM模型,请按照微调说明进行。
-
运行 h2oGPT 测试:
pip install requirements-parser pytest-instafail pytest-random-order playsound==1.3.0
conda install -c conda-forge gst-python -y
sudo apt-get install gstreamer-1.0
pip install pygame
GPT_H2O_AI=0 CONCURRENCY_COUNT=1 pytest --instafail -s -v tests
# for openai server test on already-running local server
pytest -s -v -n 4 openai_server/test_openai_server.py::test_openai_client
或运行下面代码 并行测试
tests/test4gpus.sh
致谢
- 一些训练代码基于3月24日版本的羊驼-洛拉。
- 使用OpenAssistant创建的高质量数据。
- 使用EleutherAI的基本模型。
- 使用LAION创建的OIG数据。
为什么选择 H2O.ai?
我们创客的H2O.ai已经建立了几个世界级的机器学习、深度学习和人工智能平台:
- #1企业开源机器学习平台H2O-3
- 世界上最好的AutoML(自动机器学习)与H2O无人驾驶AI
- 无代码深度学习与H2O氢炬
- 文档AI中的深度学习文档处理
我们还构建了用于部署和监控以及数据处理和治理的平台:
- H2O MLOps可大规模部署和监控模型
- H2O功能商店与AT&T合作
- 开源低代码AI应用程序开发框架Wave和Nitro
- 开源Python数据化(H2O无人驾驶AI特征工程引擎)
我们的许多客户正在创建模型,并在H2O AI Cloud中大规模部署它们:
- 多云或本地
- 托管云(SaaS)
- 混合云
- AI应用商店
我们很自豪有超过25位(世界280位)Kaggle大师将H2O称为家,其中包括三位进入世界第一的Kaggle大师。
免责声明
在使用本存储库中提供的大型语言模型之前,请仔细阅读本免责声明。您使用该模型表示您同意以下条款和条件。
- 偏见和冒犯性:大型语言模型在各种互联网文本数据上进行训练,这些数据可能包含偏见、种族主义、冒犯性或其他不适当的内容。通过使用此模型,您承认并接受生成的内容有时可能会表现出偏见或产生冒犯性或不适当的内容。本存储库的开发人员不认可、支持或推广任何此类内容或观点。
- 限制:大型语言模型是基于人工智能的工具,而不是人类。它可能会产生不正确、无意义或不相关的响应。用户有责任批判性地评估生成的内容并自行决定使用它。
- 使用风险自负:此大型语言模型的用户必须对其使用该工具可能产生的任何后果承担全部责任。本存储库的开发人员和贡献者不对因使用或滥用所提供的模型而导致的任何损害、损失或伤害承担任何责任。
- 道德考虑:鼓励用户负责任和合乎道德地使用大语言模型。通过使用此模型,您同意不将其用于促进仇恨言论、歧视、骚扰或任何形式的非法或有害活动的目的。
- 报告问题:如果您遇到大型语言模型生成的任何有偏见的、令人反感的或其他不适当的内容,请通过提供的渠道向存储库维护人员报告,您的反馈将有助于改进模型并缓解潜在问题。
- 此免责声明的更改:此存储库的开发人员保留权力随时修改或更新此免责声明,恕不另行通知。用户有责任定期查看免责声明以随时了解任何更改。
通过使用本存储库中提供的大型语言模型,您同意接受并遵守本免责声明中概述的条款和条件。如果您不同意本免责声明的任何部分,您应该避免使用模型及其生成的任何内容。
2025-01-27(一)
相关文章:
h2oGPT
文章目录 一、关于 h2oGPT二、现场演示特点 三、开始行动安装h2oGPT拼贴画演示资源文档指南开发致谢为什么选择 H2O.ai?免责声明 一、关于 h2oGPT 使用文档、图像、视频等与本地GPT进行私人聊天。100%私人,Apache 2.0。支持oLLaMa、Mixtral、llama. cpp…...
Win10安装MySQL、Pycharm连接MySQL,Pycharm中运行Django
一、Windows系统mysql相关操作 1、 检查系统是否安装mysql 按住win r (调出运行窗口) 输入service.msc,点击【确定】 image.png 打开服务列表-检查是否有mysql服务 (compmgmt.msc) image.png 2、 Windows安装MySQL …...
使用Pygame制作“俄罗斯方块”游戏
1. 前言 俄罗斯方块(Tetris) 是一款由方块下落、行消除等核心规则构成的经典益智游戏: 每次从屏幕顶部出现一个随机的方块(由若干小方格组成),玩家可以左右移动或旋转该方块,让它合适地堆叠在…...
【Block总结】ODConv动态卷积,适用于CV任务|即插即用
一、论文信息 论文标题:Omni-Dimensional Dynamic Convolution作者:Chao Li, Aojun Zhou, Anbang Yao发表会议:ICLR 2022论文链接:https://arxiv.org/pdf/2209.07947GitHub链接:https://github.com/OSVAI/ODConv 二…...
RK3568 opencv播放视频
文章目录 一、opencv相关视频播放类1. `cv::VideoCapture` 类主要构造方法:主要方法:2. 视频播放基本流程代码示例:3. 获取和设置视频属性4. 结合 FFmpeg 使用5. OpenCV 视频播放的局限性6. 结合 Qt 实现更高级的视频播放总结二、QT中的代码实现一、opencv相关视频播放类 在…...
《LLM大语言模型+RAG实战+Langchain+ChatGLM-4+Transformer》
文章目录 Langchain的定义Langchain的组成三个核心组件实现整个核心组成部分 为什么要使用LangchainLangchain的底层原理Langchain实战操作LangSmithLangChain调用LLM安装openAI库-国内镜像源代码运行结果小结 使用Langchain的提示模板部署Langchain程序安装langserve代码请求格…...
【搜索回溯算法篇】:拓宽算法视野--BFS如何解决拓扑排序问题
✨感谢您阅读本篇文章,文章内容是个人学习笔记的整理,如果哪里有误的话还请您指正噢✨ ✨ 个人主页:余辉zmh–CSDN博客 ✨ 文章所属专栏:搜索回溯算法篇–CSDN博客 文章目录 一.广度优先搜索(BFS)解决拓扑排…...
计算机网络 (61)移动IP
前言 移动IP(Mobile IP)是由Internet工程任务小组(Internet Engineering Task Force,IETF)提出的一个协议,旨在解决移动设备在不同网络间切换时的通信问题,确保移动设备可以在离开原有网络或子网…...
Elasticsearch+kibana安装(简单易上手)
下载ES( Download Elasticsearch | Elastic ) 将ES安装包解压缩 解压后目录如下: 修改ES服务端口(可以不修改) 启动ES 记住这些内容 验证ES是否启动成功 下载kibana( Download Kibana Free | Get Started Now | Elastic ) 解压后的kibana目…...
音视频多媒体编解码器基础-codec
如果要从事编解码多媒体的工作,需要准备哪些更为基础的内容,这里帮你总结完。 因为数据类型不同所以编解码算法不同,分为图像、视频和音频三大类;因为流程不同,可以分为编码和解码两部分;因为编码器实现不…...
【算法与数据结构】动态规划
目录 基本概念 最长递增子序列(中等) 最大子数组和(中等) 基本概念 重叠子问题 一个问题可以被分解为多个子问题,并且这些子问题在求解过程中会被多次重复计算。例如,在计算斐波那契数列时,…...
DeepSeekMoE:迈向混合专家语言模型的终极专业化
一、结论写在前面 论文提出了MoE语言模型的DeepSeekMoE架构,目的是实现终极的专家专业化(expert specialization)。通过细粒度的专家分割和共享专家隔离,DeepSeekMoE相比主流的MoE架构实现了显著更高的专家专业化和性能。从较小的2B参数规模开始&#x…...
什么是Maxscript?为什么要学习Maxscript?
MAXScript是Autodesk 3ds Max的内置脚本语言,它是一种与3dsMax对话并使3dsMax执行某些操作的编程语言。它是一种脚本语言,这意味着您不需要编译代码即可运行。通过使用一系列基于文本的命令而不是使用UI操作,您可以完成许多使用UI操作无法完成的任务。 Maxscript是一种专有…...
HyperLogLog 近似累计去重技术解析:大数据场景下的高效基数统计
目录 引言 一、HyperLogLog 核心原理 1.1 算法思想 1.2 误差特性 二、SQL 实现详解(PostgreSQL 示例)...
LabVIEW透镜多参数自动检测系统
在现代制造业中,提升产品质量检测的自动化水平是提高生产效率和准确性的关键。本文介绍了一个基于LabVIEW的透镜多参数自动检测系统,该系统能够在单一工位上完成透镜的多项质量参数检测,并实现透镜的自动搬运与分选,极大地提升了检…...
MySQL数据库(二)- SQL
目录 编辑 一 DDL (一 数据库操作 1 查询-数据库(所有/当前) 2 创建-数据库 3 删除-数据库 4 使用-数据库 (二 表操作 1 创建-表结构 2 查询-所有表结构名称 3 查询-表结构内容 4 查询-建表语句 5 添加-字段名数据类型 6 修改-字段数据类…...
【Block总结】HiLo注意力,局部自注意力捕获细粒度的高频信息,通过全局注意力捕获低频信息|即插即用
一、论文信息 标题: Fast Vision Transformers with HiLo AttentionGitHub链接: https://github.com/ziplab/LITv2论文链接: arXiv 二、创新点 HiLo注意力机制: 本文提出了一种新的自注意力机制——HiLo注意力,旨在同时捕捉图像中的高频和低频特征。该机制通过将…...
python 使用Whisper模型进行语音翻译
目录 一、Whisper 是什么? 二、Whisper 的基本命令行用法 三、代码实践 四、是否保留Token标记 五、翻译长度问题 六、性能分析 一、Whisper 是什么? Whisper 是由 OpenAI 开源的一个自动语音识别(Automatic Speech Recognition, ASR)系统。它的主要特点是: 多语言…...
C# Winform enter键怎么去关联button
1.关联按钮上的Key事件按钮上的keypress,keydown,keyup事件随便一个即可private void textBox1_KeyDown(object sender, KeyEventArgs e){if (e.KeyCode Keys.Enter){this.textBox2.Focus();}}2.窗体上的事件private void textBox2_KeyPress(object sen…...
Github 2025-01-30 Go开源项目日报 Top10
根据Github Trendings的统计,今日(2025-01-30统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Go项目10Ollama: 本地大型语言模型设置与运行 创建周期:248 天开发语言:Go协议类型:MIT LicenseStar数量:42421 个Fork数量:2724 次关注人…...
挑战杯推荐项目
“人工智能”创意赛 - 智能艺术创作助手:借助大模型技术,开发能根据用户输入的主题、风格等要求,生成绘画、音乐、文学作品等多种形式艺术创作灵感或初稿的应用,帮助艺术家和创意爱好者激发创意、提高创作效率。 - 个性化梦境…...
谷歌浏览器插件
项目中有时候会用到插件 sync-cookie-extension1.0.0:开发环境同步测试 cookie 至 localhost,便于本地请求服务携带 cookie 参考地址:https://juejin.cn/post/7139354571712757767 里面有源码下载下来,加在到扩展即可使用FeHelp…...
React Native 开发环境搭建(全平台详解)
React Native 开发环境搭建(全平台详解) 在开始使用 React Native 开发移动应用之前,正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南,涵盖 macOS 和 Windows 平台的配置步骤,如何在 Android 和 iOS…...
Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件
今天呢,博主的学习进度也是步入了Java Mybatis 框架,目前正在逐步杨帆旗航。 那么接下来就给大家出一期有关 Mybatis 逆向工程的教学,希望能对大家有所帮助,也特别欢迎大家指点不足之处,小生很乐意接受正确的建议&…...
莫兰迪高级灰总结计划简约商务通用PPT模版
莫兰迪高级灰总结计划简约商务通用PPT模版,莫兰迪调色板清新简约工作汇报PPT模版,莫兰迪时尚风极简设计PPT模版,大学生毕业论文答辩PPT模版,莫兰迪配色总结计划简约商务通用PPT模版,莫兰迪商务汇报PPT模版,…...
并发编程 - go版
1.并发编程基础概念 进程和线程 A. 进程是程序在操作系统中的一次执行过程,系统进行资源分配和调度的一个独立单位。B. 线程是进程的一个执行实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。C.一个进程可以创建和撤销多个线程;同一个进程中…...
【Android】Android 开发 ADB 常用指令
查看当前连接的设备 adb devices 连接设备 adb connect 设备IP 断开已连接的设备 adb disconnect 设备IP 安装应用 adb install 安装包的路径 卸载应用 adb uninstall 应用包名 查看已安装的应用包名 adb shell pm list packages 查看已安装的第三方应用包名 adb shell pm list…...
Kafka主题运维全指南:从基础配置到故障处理
#作者:张桐瑞 文章目录 主题日常管理1. 修改主题分区。2. 修改主题级别参数。3. 变更副本数。4. 修改主题限速。5.主题分区迁移。6. 常见主题错误处理常见错误1:主题删除失败。常见错误2:__consumer_offsets占用太多的磁盘。 主题日常管理 …...
零知开源——STM32F103RBT6驱动 ICM20948 九轴传感器及 vofa + 上位机可视化教程
STM32F1 本教程使用零知标准板(STM32F103RBT6)通过I2C驱动ICM20948九轴传感器,实现姿态解算,并通过串口将数据实时发送至VOFA上位机进行3D可视化。代码基于开源库修改优化,适合嵌入式及物联网开发者。在基础驱动上新增…...
DAY 26 函数专题1
函数定义与参数知识点回顾:1. 函数的定义2. 变量作用域:局部变量和全局变量3. 函数的参数类型:位置参数、默认参数、不定参数4. 传递参数的手段:关键词参数5 题目1:计算圆的面积 任务: 编写一…...
