在linux服务器部署Heygem
前言:
Heygem官方文档上提供了基于windwos系统的安装方案。在实际使用过程中个人电脑的配置可能不够。这个时候如果服务器配置够的话,可以尝试在服务器上装一下。但是服务器一般都是linux系统的,于是这篇教程就出现了…

可行性分析
通读安装文档发现Heygem应用分为服务端和客户端,服务端基于docker容器所以不区分系统是linux还是windows。应用端基于electron构建的,electron是可以跨平台使用的,所以理论上也可以在linux服务器上构建。有了上面的基础我们可以继续操作了…
环境
- Ubuntu 22.04.1
- Docker version 24.0.7
- Docker Compose version v2.21.0
- node v18.20.7
- CPU 13th Gen Intel® Core™ i7-13700KF
- 显卡 NVIDIA 4090 24G
- 内存 64G
官方推荐配置
- CPU:第13代英特尔酷睿 i5-13400F
- 内存:32G及以上(必要)
- 显卡:rtx-4070
安装docker
- 安装教程很多,不再赘述。已经按照跳过。
安装docker-compose
- 安装教程很多,不再赘述。已经按照跳过
启动Heygem服务端
- 新建文件目录Heygem
- 新建文件docker-compose.yml
- 写入docker-compose.yml,内容参考 https://github.com/GuijiAI/HeyGem.ai/blob/main/deploy/docker-compose.yml
networks:ai_network:driver: bridgeservices:heygem-tts:image: guiji2025/fish-speech-zimingcontainer_name: heygem-ttsrestart: alwaysruntime: nvidiaenvironment:- NVIDIA_VISIBLE_DEVICES=0- NVIDIA_DRIVER_CAPABILITIES=compute,graphics,utility,video,displayports:- '18180:8080'volumes:# - d:/heygem_data/voice/data:/code/data # 修改挂载目录- ./heygem_data/voice/data:/code/datacommand: /bin/bash -c "/opt/conda/envs/python310/bin/python3 tools/api_server.py --listen 0.0.0.0:8080"networks:- ai_networkheygem-asr:image: guiji2025/fun-asrcontainer_name: heygem-asrrestart: alwaysruntime: nvidiaprivileged: trueworking_dir: /workspace/FunASR/runtimeports:- '10095:10095'command: sh /run.shdeploy:resources:reservations:devices:- driver: nvidiacount: allcapabilities: [gpu]networks:- ai_networkheygem-f2f:image: guiji2025/heygem.aicontainer_name: heygem-f2frestart: alwaysruntime: nvidiaprivileged: truevolumes:#- d:/heygem_data/face2face:/code/data # 修改挂载目录- ./heygem_data/face2face:/code/dataenvironment:- PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512deploy:resources:reservations:devices:- capabilities: [gpu]shm_size: '8g'ports:- '8383:8383'command: python /code/app_local.pynetworks:- ai_network
- 启动docker-compose服务
docker compose up -d
紧接着就是漫长的等待了…此时我们可以并行按照我们的客户端
启动Heygem客户端
-
下载客户端源码 https://github.com/GuijiAI/HeyGem.ai.git
-
进入HeyGem.ai目录
-
安装node环境,建议 v18.20.7版本
-
安装ffemp服务
sudo apt updatesudo apt install ffmpeg -yffmpeg -version- 进入到目录resources/ffmpeg下
- 创建文件夹 mkdir -p linux/bin
- 下载预编译二进制(选择适用于 Ubuntu 22.04 的版本)
wget https://johnvansickle.com/ffmpeg/releases/ffmpeg-release-amd64-static.tar.xz tar xvf ffmpeg-release-amd64-static.tar.xz- 复制文件到项目目录
cp ffmpeg-*-amd64-static/ffmpeg linux/bin/ cp ffmpeg-*-amd64-static/ffprobe linux/bin/- 赋予执行权限
chmod +x .linux/bin/ffmpeg chmod +x ./linux/bin/ffprobe- 手动复制运行依赖
# 回到 HeyGem.ai目录下 mkdir -p ./node_modules/electron/dist/resources/app.asar.unpacked/resources/ffmpeg/linux/bin/ cp -r ./resources/ffmpeg/linux/bin/ ./node_modules/electron/dist/resources/app.asar.unpacked/resources/ffmpeg/linux/bin/ -
修改配置文件
vim src/main/config/config.js# 根据自己的实际路径修改 export const assetPath = {model: path.join('XXXX/HeyGem','heygem_data', 'face2face', 'temp'), // 模特视频ttsProduct: path.join('XXXX/HeyGem','heygem_data', 'face2face', 'temp'), // TTS 产物ttsRoot: path.join('XXXX/HeyGem','heygem_data', 'voice', 'data'), // TTS服务根目录ttsTrain: path.join('XXXX/HeyGem','heygem_data', 'voice', 'data','origin_audio') // TTS 训练产物 } -
修改 ffmpeg.js
vim src/main/util/ffmpeg.jsconst ffmpegPathValue =process.env.NODE_ENV === 'development'? 'ffmpeg' // 开发环境直接使用系统安装的版本
- : path.join(
+ : path.join(process.resourcesPath,'app.asar.unpacked','resources','ffmpeg',
+ 'linux', // 新增 Linux 子目录'bin',
- 'ffmpeg.exe'
+ 'ffmpeg')const ffprobePathValue =process.env.NODE_ENV === 'development'? 'ffprobe' // 开发环境直接使用系统安装的版本
- : path.join(
+ : path.join(process.resourcesPath,'app.asar.unpacked','resources','ffmpeg',
+ 'linux', // 新增 Linux 子目录'bin',
- 'ffprobe.exe'
+ 'ffprobe')
- 启动服务
npm run start # 不要使用npm run dev命令
- 常见错误
- Missing X server or $DISPLAY
[838724:0321/095319.155461:ERROR:ozone_platform_x11.cc(245)] Missing X server or $DISPLAY [838724:0321/095319.155479:ERROR:env.cc(258)] The platform failed to initialize. Exiting.- 解决办法
更换ssh连接客户端,推荐使用MobaXterm
相关文章:
在linux服务器部署Heygem
前言: Heygem官方文档上提供了基于windwos系统的安装方案。在实际使用过程中个人电脑的配置可能不够。这个时候如果服务器配置够的话,可以尝试在服务器上装一下。但是服务器一般都是linux系统的,于是这篇教程就出现了… 可行性分析 通读安装…...
图书管理系统系统-Java、SpringBoot、Vue和MySQL开发的图书馆管理系统
「springboot、vue图书馆管理系统.zip」 链接:https://pan.quark.cn/s/5a929a7e9450 分享一个图书管理系统,Java、SpringBoot、Vue和MySQL开发的图书馆管理系统 以下是对文本内容的总结: 项目概述 项目名称与背景: 项目概述 项…...
学生管理系统(需求文档)
需求: 采取控制台的方式去书写学生管理系统 分析: 初始菜单: “----------欢迎来到java学生管理系统----------” “1:添加学生” “2:删除学生” “3:修改学生” “4:查询学生” “5:…...
[c语言日寄]数据输入
【作者主页】siy2333 【专栏介绍】⌈c语言日寄⌋:这是一个专注于C语言刷题的专栏,精选题目,搭配详细题解、拓展算法。从基础语法到复杂算法,题目涉及的知识点全面覆盖,助力你系统提升。无论你是初学者,还是…...
CMake-环境变量介绍
文章目录 作用域获取环境变量初始化查看特殊的环境变量 环境变量类似普通变量,但也有些不同,如下: 作用域 在一个CMake进程中环境变量具有全局作用域 获取环境变量 使用ENV操作符获取环境变量,例如$ENV{<name>}ÿ…...
数据预处理流程与关键步骤解析
数据预处理流程图(Markdown格式): #mermaid-svg-b3mhJcpFWaJ9qMZ8 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-b3mhJcpFWaJ9qMZ8 .error-icon{fill:#552222;}#mermaid-svg-b3m…...
字节DAPO算法:改进DeepSeek的GRPO算法-解锁大规模LLM强化学习的新篇章(代码实现)
DAPO算法:解锁大规模LLM强化学习的新篇章 近年来,大规模语言模型(LLM)在推理任务上的表现令人瞩目,尤其是在数学竞赛(如AIME)和编程任务中,强化学习(RL)成为…...
计算机操作系统(四) 操作系统的结构与系统调用
计算机操作系统(四) 操作系统的结构与系统调用 前言一、操作系统的结构1.1 简单结构1.2 模块化结构1.3 分层化结构1.4 微内核结构1.5 外核结构 二、系统调用1.1 系统调用的基本概念1.2 系统调用的类型 总结(核心概念速记)…...
Docker安装,并pullMySQL和redis
卸载原Docker 您的 Linux 发行版可能提供非官方的 Docker 软件包,这可能与 Docker 提供的官方软件包冲突。在安装 Docker Engine 正式版之前,您必须先卸载这些软件包。 sudo dnf remove docker \ docker-client \ docker-client-latest \ docker-common…...
第三天 开始Unity Shader的学习之旅之第二天的补充
Unity Shader的学习笔记 第三天 开始Unity Shader的学习之旅之第二天的补充 文章目录 Unity Shader的学习笔记前言一、Unity 提供的内置文件和变量1. 内置的包含文件2. UnityCG.cginc中的常用结构体 二、Unity 提供的Cg/HLSL语义1. 从应用阶段传递模型数据给顶点着色器时Unity…...
DeepSeek技术架构解析:MoE混合专家模型
一、前言 2025年初,DeepSeek V3以557万美元的研发成本(仅为GPT-4的1/14)和开源模型第一的排名,在全球AI领域掀起波澜。其核心创新之一——混合专家模型(Mixture of Experts, MoE)的优化设计,不…...
【正点原子】AI人工智能深度学习(RV1126/RK3568/RK3588)-第1期 准备篇
1.1SDK编译后的目录 1、真正的根文件系统镜像存放目录 2、非必须,负责系统升级等,kerneldtbramdisk组成的根文件系统 1.2文件系统分区 1.3开机自启动 1.6设置静态ip地址 1.8RKMedia框架/编译测试SDK自带RKMedia例程 出厂系统以下内容都是默认…...
PCB沉金和镀金的区别
本文通过多方面角度对比两者的区别。 一.成本和工艺复杂度 沉金:成本较高,制作过程中消耗的金盐多。工艺的参数控制上较严格,需防止“黑盘效应”。 黑盘效应:是指在PCB(印刷电路板)的化学镀镍金…...
靶场(十五)---小白心得思路分析---LaVita
启程: 扫描端口,发现开放22,80端口,发现ws.css可能存在exp,经查发现无可利用的exp PORT STATE SERVICE VERSION 22/tcp open ssh OpenSSH 8.4p1 Debian 5deb11u2 (protocol 2.0) | ssh-hostkey: | 3072 c9…...
【AI大模型】DeepSeek + 通义万相高效制作AI视频实战详解
目录 一、前言 二、AI视频概述 2.1 什么是AI视频 2.2 AI视频核心特点 2.3 AI视频应用场景 三、通义万相介绍 3.1 通义万相概述 3.1.1 什么是通义万相 3.2 通义万相核心特点 3.3 通义万相技术特点 3.4 通义万相应用场景 四、DeepSeek 通义万相制作AI视频流程 4.1 D…...
Pi型隶属函数(Π-shaped Membership Function)的详细介绍及python示例
我们前文已经深度解读了三角形、梯形、高斯、S型和Z型隶属函数,现在转向Pi型。当然我们先简要回顾不同隶属函数的特点和曲线效果。了解每种隶属函数的特性是为了更好的应用。 一、回顾五种隶属函数的特点 1.从每种隶属函数的结构和特点角度对比。三角形隶属函数&am…...
MySQL 入门大全:常用函数
🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,…...
轻量级TLS反向代理工具TLS-reverse-proxy:打造安全通信桥梁
在数字化浪潮席卷全球的今天,数据隐私与传输安全已成为企业及个人的核心关切。TLS(传输层安全协议)作为互联网通信的"隐形卫士",承担着保护数据在传输过程中不被窃取或篡改的重要使命。然而,对于许多传统服务…...
SpringBoot3实战(SpringBoot3+Vue3基本增删改查、前后端通信交互、配置后端跨域请求、数据批量删除(超详细))(3)
目录 一、从0快速搭建SpringBoot3工程、SpringBoot3集成MyBatis、PageHelper分页查询的详细教程。(博客链接) 二、实现前端与后端通信对接数据。(axios工具) (1)安装axios。(vue工程目录) (2)封装请求工具类。(request.js) <1&…...
AF3 Rotation 类解读
Rotation 类(rigid_utils 模块)是 AlphaFold3 中用于 3D旋转 的核心组件,支持两种旋转表示: 1️⃣ 旋转矩阵 (3x3) 2️⃣ 四元数 (quaternion, 4元向量) 👉 设计目标: 允许灵活选择 旋转矩阵 或 四元数 封装了常用的 旋转操作(组合、逆旋转、应用到点上等) 像 torch.…...
JVM垃圾回收笔记02-垃圾回收器
文章目录 前言1.串行(Serial 收集器/Serial Old 收集器)Serial 收集器Serial Old 收集器相关参数-XX:UseSerialGC 2.吞吐量优先(Parallel Scavenge 收集器/Parallel Old 收集器)Parallel Scavenge 收集器Parallel Old 收集器相关参数-XX:UseParallelGC ~ -XX:UseParallelOldGC-…...
Linux上位机开发实战(编写API库)
【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 我们自己编写linux上位机软件的时候,尽量都是通过框架库的形式来开发。这就是所谓的低耦合,高内聚。相似的功能、模块和算法…...
深入浅出JVM性能优化:从理论到实践
一、JVM架构与内存模型深度解析 1.1 JVM运行时数据区全景图 方法区(元空间):存储类信息、常量池等元数据堆内存:对象实例存储核心区域 Young Generation(新生代) Eden区(对象诞生地࿰…...
Redis Sentinel 详解
Redis Sentinel 详解 1. 什么是 Redis Sentinel?有什么用? Redis Sentinel(哨兵) 是 Redis 官方提供的高可用性解决方案,主要用于监控、通知和自动故障转移。当 Redis 主节点(master)发生故障…...
器件功耗模型原理
器件功耗模型原理 谷歌提供了一套通用的器件耗电模型和配置方案,先对器件进行耗电因子拆解,建立器件功耗模型,得到一个器件耗电的计算公式。通过运行时统计器件的使用数据,代入功耗模型,就可以计算出器件的功耗。例如…...
拥抱成长型思维:解锁持续进步的人生密码
我强烈推荐4本可以改变命运的经典著作: 《寿康宝鉴》在线阅读白话文《欲海回狂》在线阅读白话文《阴律无情》在线阅读白话文《了凡四训》在线阅读白话文 一、什么是成长型思维? 成长型思维(Growth Mindset)由斯坦福大学心理学家卡…...
Ubuntu上查看GPU使用情况并释放内存
先用nvidia-smi查看GPU当前使用情况 再用fuser 命令查找对应显卡上占用 GPU 的进程 最后查到了用kill -9强制杀掉进程(PID)即可...
解决思科交换机无法访问局域网外设备
问题背景 有时,我们需要远程连接来管理一台思科交换机,例如使用SSH协议。然而交换机运作在链路层,这就需要交换机有一个网络层地址,来接纳基于IP协议的远程访问请求。于是,我们依靠设置一个带有IP地址的交换机虚拟接口…...
Unity Shader编程】之透明物体渲染
以下是针对您提出的关于 Unity Shader 渲染 Pass 的查看方法、多个 Pass 的影响、Pass 的含义,以及 Unity 渲染物体的流程和处理多个透明/半透明/不透明物体的详细解答。 1. Unity Shader 渲染 Pass 的查看方法 查看 Pass 的方法 通过 Shader 代码: 打开…...
fopen和open 等区别是什么?文件描述符与文件描述指针区别
FILE *fp fopen(path, "w"); int fd open(path,) 1.区别 函数定义所属库返回类型fopen高级文件操作函数,提供缓冲机制标准 C 库 (stdio.h)FILE*(文件指针)open低级文件操作函数,直接调用系统接口Unix/Linux 系统调用…...
