当前位置: 首页 > article >正文

在linux服务器部署Heygem

前言:

Heygem官方文档上提供了基于windwos系统的安装方案。在实际使用过程中个人电脑的配置可能不够。这个时候如果服务器配置够的话,可以尝试在服务器上装一下。但是服务器一般都是linux系统的,于是这篇教程就出现了…


在这里插入图片描述

可行性分析

通读安装文档发现Heygem应用分为服务端和客户端,服务端基于docker容器所以不区分系统是linux还是windows。应用端基于electron构建的,electron是可以跨平台使用的,所以理论上也可以在linux服务器上构建。有了上面的基础我们可以继续操作了…

环境

  • Ubuntu 22.04.1
  • Docker version 24.0.7
  • Docker Compose version v2.21.0
  • node v18.20.7
  • CPU 13th Gen Intel® Core™ i7-13700KF
  • 显卡 NVIDIA 4090 24G
  • 内存 64G

官方推荐配置

  • CPU:第13代英特尔酷睿 i5-13400F
  • 内存:32G及以上(必要)
  • 显卡:rtx-4070

安装docker

  • 安装教程很多,不再赘述。已经按照跳过。

安装docker-compose

  • 安装教程很多,不再赘述。已经按照跳过

启动Heygem服务端

  • 新建文件目录Heygem
  • 新建文件docker-compose.yml
  • 写入docker-compose.yml,内容参考 https://github.com/GuijiAI/HeyGem.ai/blob/main/deploy/docker-compose.yml
networks:ai_network:driver: bridgeservices:heygem-tts:image: guiji2025/fish-speech-zimingcontainer_name: heygem-ttsrestart: alwaysruntime: nvidiaenvironment:- NVIDIA_VISIBLE_DEVICES=0- NVIDIA_DRIVER_CAPABILITIES=compute,graphics,utility,video,displayports:- '18180:8080'volumes:# - d:/heygem_data/voice/data:/code/data # 修改挂载目录- ./heygem_data/voice/data:/code/datacommand: /bin/bash -c "/opt/conda/envs/python310/bin/python3 tools/api_server.py --listen 0.0.0.0:8080"networks:- ai_networkheygem-asr:image: guiji2025/fun-asrcontainer_name: heygem-asrrestart: alwaysruntime: nvidiaprivileged: trueworking_dir: /workspace/FunASR/runtimeports:- '10095:10095'command: sh /run.shdeploy:resources:reservations:devices:- driver: nvidiacount: allcapabilities: [gpu]networks:- ai_networkheygem-f2f:image: guiji2025/heygem.aicontainer_name: heygem-f2frestart: alwaysruntime: nvidiaprivileged: truevolumes:#- d:/heygem_data/face2face:/code/data # 修改挂载目录- ./heygem_data/face2face:/code/dataenvironment:- PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512deploy:resources:reservations:devices:- capabilities: [gpu]shm_size: '8g'ports:- '8383:8383'command: python /code/app_local.pynetworks:- ai_network
  • 启动docker-compose服务
docker compose up -d

紧接着就是漫长的等待了…此时我们可以并行按照我们的客户端

启动Heygem客户端

  • 下载客户端源码 https://github.com/GuijiAI/HeyGem.ai.git

  • 进入HeyGem.ai目录

  • 安装node环境,建议 v18.20.7版本

  • 安装ffemp服务

    	sudo apt updatesudo apt install ffmpeg -yffmpeg -version
    
    • 进入到目录resources/ffmpeg下
    • 创建文件夹 mkdir -p linux/bin
    • 下载预编译二进制(选择适用于 Ubuntu 22.04 的版本)
    wget https://johnvansickle.com/ffmpeg/releases/ffmpeg-release-amd64-static.tar.xz
    tar xvf ffmpeg-release-amd64-static.tar.xz
    
    • 复制文件到项目目录
    cp ffmpeg-*-amd64-static/ffmpeg linux/bin/
    cp ffmpeg-*-amd64-static/ffprobe linux/bin/
    • 赋予执行权限
    chmod +x .linux/bin/ffmpeg
    chmod +x ./linux/bin/ffprobe
    
    • 手动复制运行依赖
    # 回到 HeyGem.ai目录下
    mkdir -p ./node_modules/electron/dist/resources/app.asar.unpacked/resources/ffmpeg/linux/bin/
    cp -r ./resources/ffmpeg/linux/bin/ ./node_modules/electron/dist/resources/app.asar.unpacked/resources/ffmpeg/linux/bin/
    
  • 修改配置文件

    	vim src/main/config/config.js# 根据自己的实际路径修改
    export const assetPath = {model: path.join('XXXX/HeyGem','heygem_data', 'face2face', 'temp'), // 模特视频ttsProduct: path.join('XXXX/HeyGem','heygem_data', 'face2face', 'temp'), // TTS 产物ttsRoot: path.join('XXXX/HeyGem','heygem_data', 'voice', 'data'), // TTS服务根目录ttsTrain: path.join('XXXX/HeyGem','heygem_data', 'voice', 'data','origin_audio') // TTS 训练产物
    }
  • 修改 ffmpeg.js

vim src/main/util/ffmpeg.jsconst ffmpegPathValue =process.env.NODE_ENV === 'development'? 'ffmpeg' // 开发环境直接使用系统安装的版本
-    : path.join(
+    : path.join(process.resourcesPath,'app.asar.unpacked','resources','ffmpeg',
+       'linux', // 新增 Linux 子目录'bin',
-       'ffmpeg.exe'
+       'ffmpeg')const ffprobePathValue =process.env.NODE_ENV === 'development'? 'ffprobe' // 开发环境直接使用系统安装的版本
-    : path.join(
+    : path.join(process.resourcesPath,'app.asar.unpacked','resources','ffmpeg',
+       'linux', // 新增 Linux 子目录'bin',
-       'ffprobe.exe'
+       'ffprobe')
  • 启动服务
    npm run start # 不要使用npm run dev命令 
    

  • 常见错误
    • Missing X server or $DISPLAY
    [838724:0321/095319.155461:ERROR:ozone_platform_x11.cc(245)] Missing X server or $DISPLAY
    [838724:0321/095319.155479:ERROR:env.cc(258)] The platform failed to initialize.  Exiting.
    • 解决办法

    更换ssh连接客户端,推荐使用MobaXterm

相关文章:

在linux服务器部署Heygem

前言: Heygem官方文档上提供了基于windwos系统的安装方案。在实际使用过程中个人电脑的配置可能不够。这个时候如果服务器配置够的话,可以尝试在服务器上装一下。但是服务器一般都是linux系统的,于是这篇教程就出现了… 可行性分析 通读安装…...

图书管理系统系统-Java、SpringBoot、Vue和MySQL开发的图书馆管理系统

「springboot、vue图书馆管理系统.zip」 链接:https://pan.quark.cn/s/5a929a7e9450 分享一个图书管理系统,Java、SpringBoot、Vue和MySQL开发的图书馆管理系统 以下是对文本内容的总结: 项目概述 项目名称与背景: 项目概述 项…...

学生管理系统(需求文档)

需求: 采取控制台的方式去书写学生管理系统 分析: 初始菜单: “----------欢迎来到java学生管理系统----------” “1:添加学生” “2:删除学生” “3:修改学生” “4:查询学生” “5:…...

[c语言日寄]数据输入

【作者主页】siy2333 【专栏介绍】⌈c语言日寄⌋:这是一个专注于C语言刷题的专栏,精选题目,搭配详细题解、拓展算法。从基础语法到复杂算法,题目涉及的知识点全面覆盖,助力你系统提升。无论你是初学者,还是…...

CMake-环境变量介绍

文章目录 作用域获取环境变量初始化查看特殊的环境变量 环境变量类似普通变量&#xff0c;但也有些不同&#xff0c;如下&#xff1a; 作用域 在一个CMake进程中环境变量具有全局作用域 获取环境变量 使用ENV操作符获取环境变量&#xff0c;例如$ENV{<name>}&#xff…...

数据预处理流程与关键步骤解析

数据预处理流程图&#xff08;Markdown格式&#xff09;&#xff1a; #mermaid-svg-b3mhJcpFWaJ9qMZ8 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-b3mhJcpFWaJ9qMZ8 .error-icon{fill:#552222;}#mermaid-svg-b3m…...

字节DAPO算法:改进DeepSeek的GRPO算法-解锁大规模LLM强化学习的新篇章(代码实现)

DAPO算法&#xff1a;解锁大规模LLM强化学习的新篇章 近年来&#xff0c;大规模语言模型&#xff08;LLM&#xff09;在推理任务上的表现令人瞩目&#xff0c;尤其是在数学竞赛&#xff08;如AIME&#xff09;和编程任务中&#xff0c;强化学习&#xff08;RL&#xff09;成为…...

计算机操作系统(四) 操作系统的结构与系统调用

计算机操作系统&#xff08;四&#xff09; 操作系统的结构与系统调用 前言一、操作系统的结构1.1 简单结构1.2 模块化结构1.3 分层化结构1.4 微内核结构1.5 外核结构 二、系统调用1.1 系统调用的基本概念1.2 系统调用的类型 总结&#xff08;核心概念速记&#xff09;&#xf…...

Docker安装,并pullMySQL和redis

卸载原Docker 您的 Linux 发行版可能提供非官方的 Docker 软件包&#xff0c;这可能与 Docker 提供的官方软件包冲突。在安装 Docker Engine 正式版之前&#xff0c;您必须先卸载这些软件包。 sudo dnf remove docker \ docker-client \ docker-client-latest \ docker-common…...

第三天 开始Unity Shader的学习之旅之第二天的补充

Unity Shader的学习笔记 第三天 开始Unity Shader的学习之旅之第二天的补充 文章目录 Unity Shader的学习笔记前言一、Unity 提供的内置文件和变量1. 内置的包含文件2. UnityCG.cginc中的常用结构体 二、Unity 提供的Cg/HLSL语义1. 从应用阶段传递模型数据给顶点着色器时Unity…...

DeepSeek技术架构解析:MoE混合专家模型

一、前言 2025年初&#xff0c;DeepSeek V3以557万美元的研发成本&#xff08;仅为GPT-4的1/14&#xff09;和开源模型第一的排名&#xff0c;在全球AI领域掀起波澜。其核心创新之一——混合专家模型&#xff08;Mixture of Experts, MoE&#xff09;的优化设计&#xff0c;不…...

【正点原子】AI人工智能深度学习(RV1126/RK3568/RK3588)-第1期 准备篇

1.1SDK编译后的目录 1、真正的根文件系统镜像存放目录 2、非必须&#xff0c;负责系统升级等&#xff0c;kerneldtbramdisk组成的根文件系统 1.2文件系统分区 1.3开机自启动 1.6设置静态ip地址 1.8RKMedia框架/编译测试SDK自带RKMedia例程 出厂系统以下内容都是默认…...

PCB沉金和镀金的区别

本文通过多方面角度对比两者的区别。 一.成本和工艺复杂度 沉金&#xff1a;成本较高&#xff0c;制作过程中消耗的金盐多。工艺的参数控制上较严格&#xff0c;需防止“黑盘效应”。 黑盘效应&#xff1a;是指在PCB&#xff08;印刷电路板&#xff09;的化学镀镍金&#xf…...

靶场(十五)---小白心得思路分析---LaVita

启程&#xff1a; 扫描端口&#xff0c;发现开放22&#xff0c;80端口&#xff0c;发现ws.css可能存在exp&#xff0c;经查发现无可利用的exp PORT STATE SERVICE VERSION 22/tcp open ssh OpenSSH 8.4p1 Debian 5deb11u2 (protocol 2.0) | ssh-hostkey: | 3072 c9…...

【AI大模型】DeepSeek + 通义万相高效制作AI视频实战详解

目录 一、前言 二、AI视频概述 2.1 什么是AI视频 2.2 AI视频核心特点 2.3 AI视频应用场景 三、通义万相介绍 3.1 通义万相概述 3.1.1 什么是通义万相 3.2 通义万相核心特点 3.3 通义万相技术特点 3.4 通义万相应用场景 四、DeepSeek 通义万相制作AI视频流程 4.1 D…...

Pi型隶属函数(Π-shaped Membership Function)的详细介绍及python示例

我们前文已经深度解读了三角形、梯形、高斯、S型和Z型隶属函数&#xff0c;现在转向Pi型。当然我们先简要回顾不同隶属函数的特点和曲线效果。了解每种隶属函数的特性是为了更好的应用。 一、回顾五种隶属函数的特点 1.从每种隶属函数的结构和特点角度对比。三角形隶属函数&am…...

MySQL 入门大全:常用函数

&#x1f9d1; 博主简介&#xff1a;CSDN博客专家&#xff0c;历代文学网&#xff08;PC端可以访问&#xff1a;https://literature.sinhy.com/#/literature?__c1000&#xff0c;移动端可微信小程序搜索“历代文学”&#xff09;总架构师&#xff0c;15年工作经验&#xff0c;…...

轻量级TLS反向代理工具TLS-reverse-proxy:打造安全通信桥梁

在数字化浪潮席卷全球的今天&#xff0c;数据隐私与传输安全已成为企业及个人的核心关切。TLS&#xff08;传输层安全协议&#xff09;作为互联网通信的"隐形卫士"&#xff0c;承担着保护数据在传输过程中不被窃取或篡改的重要使命。然而&#xff0c;对于许多传统服务…...

SpringBoot3实战(SpringBoot3+Vue3基本增删改查、前后端通信交互、配置后端跨域请求、数据批量删除(超详细))(3)

目录 一、从0快速搭建SpringBoot3工程、SpringBoot3集成MyBatis、PageHelper分页查询的详细教程。(博客链接) 二、实现前端与后端通信对接数据。(axios工具) &#xff08;1&#xff09;安装axios。(vue工程目录) &#xff08;2&#xff09;封装请求工具类。(request.js) <1&…...

AF3 Rotation 类解读

Rotation 类(rigid_utils 模块)是 AlphaFold3 中用于 3D旋转 的核心组件,支持两种旋转表示: 1️⃣ 旋转矩阵 (3x3) 2️⃣ 四元数 (quaternion, 4元向量) 👉 设计目标: 允许灵活选择 旋转矩阵 或 四元数 封装了常用的 旋转操作(组合、逆旋转、应用到点上等) 像 torch.…...

JVM垃圾回收笔记02-垃圾回收器

文章目录 前言1.串行(Serial 收集器/Serial Old 收集器)Serial 收集器Serial Old 收集器相关参数-XX:UseSerialGC 2.吞吐量优先(Parallel Scavenge 收集器/Parallel Old 收集器)Parallel Scavenge 收集器Parallel Old 收集器相关参数-XX:UseParallelGC ~ -XX:UseParallelOldGC-…...

Linux上位机开发实战(编写API库)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 我们自己编写linux上位机软件的时候&#xff0c;尽量都是通过框架库的形式来开发。这就是所谓的低耦合&#xff0c;高内聚。相似的功能、模块和算法…...

深入浅出JVM性能优化:从理论到实践

一、JVM架构与内存模型深度解析 1.1 JVM运行时数据区全景图 方法区&#xff08;元空间&#xff09;&#xff1a;存储类信息、常量池等元数据堆内存&#xff1a;对象实例存储核心区域 Young Generation&#xff08;新生代&#xff09; Eden区&#xff08;对象诞生地&#xff0…...

Redis Sentinel 详解

Redis Sentinel 详解 1. 什么是 Redis Sentinel&#xff1f;有什么用&#xff1f; Redis Sentinel&#xff08;哨兵&#xff09; 是 Redis 官方提供的高可用性解决方案&#xff0c;主要用于监控、通知和自动故障转移。当 Redis 主节点&#xff08;master&#xff09;发生故障…...

器件功耗模型原理

器件功耗模型原理 谷歌提供了一套通用的器件耗电模型和配置方案&#xff0c;先对器件进行耗电因子拆解&#xff0c;建立器件功耗模型&#xff0c;得到一个器件耗电的计算公式。通过运行时统计器件的使用数据&#xff0c;代入功耗模型&#xff0c;就可以计算出器件的功耗。例如…...

拥抱成长型思维:解锁持续进步的人生密码

我强烈推荐4本可以改变命运的经典著作&#xff1a; 《寿康宝鉴》在线阅读白话文《欲海回狂》在线阅读白话文《阴律无情》在线阅读白话文《了凡四训》在线阅读白话文 一、什么是成长型思维&#xff1f; 成长型思维&#xff08;Growth Mindset&#xff09;由斯坦福大学心理学家卡…...

Ubuntu上查看GPU使用情况并释放内存

先用nvidia-smi查看GPU当前使用情况 再用fuser 命令查找对应显卡上占用 GPU 的进程 最后查到了用kill -9强制杀掉进程&#xff08;PID&#xff09;即可...

解决思科交换机无法访问局域网外设备

问题背景 有时&#xff0c;我们需要远程连接来管理一台思科交换机&#xff0c;例如使用SSH协议。然而交换机运作在链路层&#xff0c;这就需要交换机有一个网络层地址&#xff0c;来接纳基于IP协议的远程访问请求。于是&#xff0c;我们依靠设置一个带有IP地址的交换机虚拟接口…...

Unity Shader编程】之透明物体渲染

以下是针对您提出的关于 Unity Shader 渲染 Pass 的查看方法、多个 Pass 的影响、Pass 的含义&#xff0c;以及 Unity 渲染物体的流程和处理多个透明/半透明/不透明物体的详细解答。 1. Unity Shader 渲染 Pass 的查看方法 查看 Pass 的方法 通过 Shader 代码&#xff1a; 打开…...

fopen和open 等区别是什么?文件描述符与文件描述指针区别

FILE *fp fopen(path, "w"); int fd open(path,) 1.区别 函数定义所属库返回类型fopen高级文件操作函数&#xff0c;提供缓冲机制标准 C 库 (stdio.h)FILE*&#xff08;文件指针&#xff09;open低级文件操作函数&#xff0c;直接调用系统接口Unix/Linux 系统调用…...