当前位置：首页 > news >正文

开源TTS+gtx1080+cuda11.7+conda+python3.9吊打百度TTS

news 2026/2/9 7:57:20

一、简介

开源项目，文本提示的生成音频模型

https://github.com/suno-ai/bark

Bark是由Suno创建的基于变换器的文本到音频模型。Bark可以生成极为逼真的多语种演讲以及其他音频 - 包括音乐、背景噪音和简单的声音效果。该模型还可以产生非言语沟通，如笑声、叹息和哭声。为了支持研究社区，我们提供了预训练的模型检查点，可用于推断，并可供商业使用。

二、演示链接:

https://pan.baidu.com/s/1O9_la6TBar75NfI1yut4Lg?pwd=utqg 提取码: utqg

三、支持的语言

Language	Status
English (en)	✅
German (de)	✅
Spanish (es)	✅
French (fr)	✅
Hindi (hi)	✅
Italian (it)	✅
Japanese (ja)	✅
Korean (ko)	✅
Polish (pl)	✅
Portuguese (pt)	✅
Russian (ru)	✅
Turkish (tr)	✅
Chinese, simplified (zh)	✅

显卡信息

四、安装步骤

1.安装conda

2.安装python3.9

conda create --name brakAI python=3.9

3.激活brakAI环境

conda activate barkAI

4.安装 pytorc

conda install pytorch==2.0.0 torchvision==0.15.0 torchaudio==2.0.0 pytorch-cuda=11.7 -c pytorch -c nvidia

5.查看了版本

import torch
print(torch.cuda.is_available())
print(torch.__version__)

6.克隆bark

git clone https://github.com/suno-ai/bark
cd bark && pip install .

7.测试

from bark import SAMPLE_RATE, generate_audio, preload_models
from scipy.io.wavfile import write as write_wav
from IPython.display import Audio# download and load all models
preload_models()# generate audio from text
text_prompt = """CSDN是全球知名中文IT技术交流平台,创建于1999年,包含原创博客、精品问答、职业培训、技术论坛、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区.。
"""
audio_array = generate_audio(text_prompt)# save audio to disk
write_wav("bark_generation22.wav", SAMPLE_RATE, audio_array)# play text in notebook
Audio(audio_array, rate=SAMPLE_RATE)

会自动下载模型文件text_2.pt，也可以自己下载suno/bark at main

模型路径 bark/generation.py

将临时目录改到bark 根目录，模型文件下载到这个目录下

五、网页版提供服务

后端main.pyp

# -*- coding: utf-8 -*-
from flask import Flask, request, send_file, render_template_string ,jsonify
from bark import SAMPLE_RATE, generate_audio, preload_models
from scipy.io.wavfile import write as write_wav
import tempfile
import time
import osapp = Flask(__name__)# 下载和加载所有模型
preload_models()@app.route('/')
def index():return render_template_string(open('templates/index.html').read())@app.route('/generate', methods=['POST'])
def generate():text_prompt = request.form.get('text')if text_prompt:text_prompt = request.form['text']audio_array = generate_audio(text_prompt)timestamp = str(int(time.time()))filename = timestamp + "times.wav"filepath = os.path.join('wavfile', filename)write_wav(filepath, SAMPLE_RATE, audio_array)file_url = '/wavfile/' + filenamereturn jsonify({"file_url": file_url})else:return "No text provided!", 400if __name__ == '__main__':app.run(host='0.0.0.0' ,debug=True)

前端index.html

<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Text to Audio</title><link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/bootstrap@4.0.0/dist/css/bootstrap.min.css" integrity="sha384-Gn5384xqQ1aoWXA+058RXPxPg6fy4IWvTNh0E263XmFcJlSAwiGgFAW/dAiS6JXm" crossorigin="anonymous">
<script src="https://cdn.jsdelivr.net/npm/bootstrap@4.0.0/dist/js/bootstrap.min.js" integrity="sha384-JZR6Spejh4U02d8jOt6vLEHfe/JQGiRRSQQxSfFWpi1MquVdAyjUar5+76PVCmYl" crossorigin="anonymous"></script>
</head>
<body><div class="container mt-5"><h1>Text to Audio Converter By 3yuan 2023.8.22 23.15.00</h1><div class="form-group"><label for="text">Enter your text:</label><textarea class="form-control" id="text" rows="4" required></textarea></div><button id="convert" class="btn btn-primary">Convert</button><div  class="mt-3"><a href="https://blog.csdn.net/jxyk2007/article/details/132425993?">Open Source TTS+gtx1080+cuda11.7+conda+python3.9 ,Beat Baidu TTS</a></div><img id="loading" class="img-responsive mt-3" src="{{ url_for('static', filename='loading.gif') }}" style="display: none;" alt="Loading..."><div id="result" class="mt-3"></div><div id="result2" class="mt-3"></div></div><script src="https://code.jquery.com/jquery-3.3.1.min.js"></script><script>$("#convert").click(function() {var text = $("#text").val();if (text) {$("#loading").show();$.post("/generate", { text: text }, function(data) {$("#loading").hide();var link = $('<a href="' + data.file_url + '" download="' + data.file_url + '">Download the audio file</a>');$("#result").html(link);var link2 = $(" <video src="+ data.file_url +" data-canonical-src="+ data.file_url + " controls='controls'   autoplay='autoplay' style='max-height:200px; min-height: 100px'></video>");$("#result2").html(link2);});} else {alert("Please enter some text!");}});</script>
</body>
</html>

其他模型下载，文字转语言

Models - Hugging Face

开源TTS+gtx1080+cuda11.7+conda+python3.9吊打百度TTS

一、简介开源项目，文本提示的生成音频模型 https://github.com/suno-ai/bark Bark是由Suno创建的基于变换器的文本到音频模型。Bark可以生成极为逼真的多语种演讲以及其他音频 - 包括音乐、背景噪音和简单的声音效果。该模型还可以产生非言语沟通，如…...

编程日记 2023/8/26 4:52:26

【私有GPT】CHATGLM-6B部署教程

【私有GPT】CHATGLM-6B部署教程 CHATGLM-6B是什么？ ChatGLM-6B是清华大学知识工程和数据挖掘小组（Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University）发布的一个开源的对话机器人。根据官方介绍，这是…...

编程日记 2023/8/26 4:51:23

基于“R语言+遥感“水环境综合评价方法教程

详情点击链接：基于"R语言遥感"水环境综合评价方法教程一：R语言 1.1 R语言特点（R语言） 1.2 安装R（R语言） 1.3 安装RStudio（R语言） （1）下载地址…...

编程日记 2023/8/26 4:50:22

To_Heart—题解——P6234 [eJOI2019] T形覆盖

link. 突然很想写这篇题解。虽然题目不算难。考场只有30分是为什么呢？看来是我没有完全理解这道题目吧！ 首先很明显的转换是，把 T 型覆盖看成十字形，再考虑最后减去某一块的贡献。然后然后直接往原图上面放十字形!对于每一个…...

编程日记 2023/8/26 4:49:15

[软件工具]精灵标注助手目标检测数据集格式转VOC或者yolo

有时候我们拿到一个数据集发现是xml文件格式如下： <?xml version"1.0" ?> <doc><path>C:\Users\Administrator\Desktop\test\000000000074.jpg</path><outputs><object><item><name>dog</name>…...

编程日记 2023/8/26 4:48:14

先看代码演示项目先定义一个User类 public class User {private String name;Overridepublic String toString() {return "User{" "name" name \ };}public String getName() {return name;}public void setName(String name) {this.name name;} }…...

编程日记 2023/8/26 4:47:08

论文阅读_图形图像_U-NET

name_en: U-Net: Convolutional Networks for Biomedical Image Segmentation name_ch: U-Net：用于生物医学图像分割的卷积网络 addr: http://link.springer.com/10.1007/978-3-319-24574-4_28 doi: 10.1007/978-3-319-24574-4_28 date_read: 2023-02-08 date_publi…...

编程日记 2023/8/26 4:46:07

基于热交换算法优化的BP神经网络（预测应用） - 附代码

基于热交换算法优化的BP神经网络（预测应用） - 附代码文章目录基于热交换算法优化的BP神经网络（预测应用） - 附代码1.数据介绍2.热交换优化BP神经网络2.1 BP神经网络参数设置2.2 热交换算法应用 4.测试结果：5.Matlab代…...

编程日记 2023/8/26 4:45:05

基于秃鹰算法优化的BP神经网络（预测应用） - 附代码

基于秃鹰算法优化的BP神经网络（预测应用） - 附代码文章目录基于秃鹰算法优化的BP神经网络（预测应用） - 附代码1.数据介绍2.秃鹰优化BP神经网络2.1 BP神经网络参数设置2.2 秃鹰算法应用 4.测试结果：5.Matlab代码摘要…...

编程日记 2023/8/26 4:44:04

2.文章复现《热电联产系统在区域综合能源系统中的定容选址研究》（附matlab程序）

0.代码链接 1.简述光热发电是大规模利用太阳能的新兴方式，其储热系统能够调节光热电站的出力特性，进而缓解光热电站并网带来的火电机组调峰问题。合理配置光热电站储热容量，能够有效降低火电机组调峰成本。该文提出一种光热电站储热容量配…...

编程日记 2023/8/26 4:43:02

如何开启esxi主机的ssh远程连接

环境：esxi主机，说明：esxi主机默认ssh是不开启的，需要人工手动启动，也可以设置同esxi主机一起开机启动。 1、找到esxi主机，点击“配置”那里，再点击右边的属性，如图所示： …...

编程日记 2023/8/26 4:42:01

Android Studio实现解析HTML获取json，解析json图片URL，将URL存到list，进行瀑布流展示

目录效果build.gradle（app）添加的依赖（用不上的可以不加）AndroidManifest.xml错误activity_main.xmlitem_image.xmlMainActivityImage适配器ImageModel 接收图片URL 效果 build.gradle（app）添加的依赖&…...

编程日记 2023/8/26 4:41:00

Centos7 交叉编译QT5.9.9源码 AArch64架构

环境准备 centos7 镜像下载地址：http://mirrors.aliyun.com/centos/7.9.2009/isos/x86_64/ aarch64交叉编译链下载地址：https://releases.linaro.org/components/toolchain/binaries/7.3-2018.05/aarch64-linux-gnu/ QT5.9.9源代码下载地址&#xff1…...

编程日记 2023/8/26 4:39:59

爬虫逆向实战（二十）--某99网站登录

一、数据接口分析主页地址：某99网站 1、抓包通过抓包可以发现登录接口是AC_userlogin 2、判断是否有加密参数请求参数是否加密？ 通过查看“载荷”可以发现txtPassword和aws是加密参数请求头是否加密？ 无响应是否加密？ 无…...

编程日记 2023/8/26 4:38:58

【C# 基础精讲】LINQ to Objects查询

LINQ to Objects是LINQ技术在C#中的一种应用，它专门用于对内存中的对象集合进行查询和操作。通过使用LINQ to Objects，您可以使用统一的语法来查询、过滤、排序、分组等操作各种.NET对象。本文将详细介绍LINQ to Objects的基本概念、常见的操作和示例&am…...

编程日记 2023/8/26 4:37:56

【力扣】209. 长度最小的子数组＜滑动窗口＞

【力扣】209. 长度最小的子数组给定一个含有 n 个正整数的数组和一个正整数 target 。找出该数组中满足其和 ≥ target 的长度最小的连续子数组 [numsl, numsl1, …, numsr-1, numsr] ，并返回其长度。如果不存在符合条件的子数组，返回 0 。示例 1&a…...

编程日记 2023/8/26 4:36:49

帮助中心应该用什么工具做？

在线帮助中心是指一个位于互联网上的资源平台，提供给用户获取产品或服务相关信息、解决问题以及获取技术支持的渠道。它通常包含了组织化的知识库、常见问题解答（FAQ）、操作指南、教程视频、用户手册等内容。在线帮助中心的主要目标是为用户提…...

编程日记 2023/8/26 4:35:48

前端面试：【跨域与安全】跨域问题及解决方案

嗨，亲爱的Web开发者！在构建现代Web应用时，跨域问题和安全性一直是不可忽视的挑战之一。本文将深入探讨跨域问题的背景以及解决方案，以确保你的应用既安全又能与其他域名的资源进行互操作。 1. 什么是跨域问题？ 跨域问…...

编程日记 2023/8/26 4:34:48

【SQL中DDL DML DQL DCL所包含的命令】

SQL中DDL DML DQL DCL所包含的命令关于DDL、DML、DQL、DCL的定义和适用范围如下： 数据定义语言（Data Definition Language，DDL）： DDL用于创建、修改和删除数据库中的表、视图、索引等对象。它的主要命令包括CREATE、A…...

编程日记 2023/8/26 4:33:47

LeetCode150道面试经典题-- 二叉树的最大深度(简单)

1.题目给定一个二叉树 root ，返回其最大深度。二叉树的最大深度是指从根节点到最远叶子节点的最长路径上的节点数。 2.示例 3.思路深度优先遍历一个二叉树要查询到最大深度，可以将问题转为从根节点出发，查看左右子树的最大深度&am…...

编程日记 2023/8/26 4:32:45

visual studio 2022更改主题为深色

visual studio 2022更改主题为深色点击visual studio 上方的工具-> 选项在选项窗口中，选择环境 -> 常规 ，将其中的颜色主题改成深色点击确定，更改完成...

编程新知 2026/1/25 11:13:37

HarmonyOS运动开发：如何用mpchart绘制运动配速图表

##鸿蒙核心技术##运动开发##Sensor Service Kit（传感器服务）# 前言在运动类应用中，运动数据的可视化是提升用户体验的重要环节。通过直观的图表展示运动过程中的关键数据，如配速、距离、卡路里消耗等，用户可以更清晰…...

编程新知 2026/2/2 7:49:59

[免费]微信小程序问卷调查系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】

大家好，我是java1234_小锋老师，看到一个不错的微信小程序问卷调查系统(SpringBoot后端Vue管理端)【论文源码SQL脚本】，分享下哈。项目视频演示【免费】微信小程序问卷调查系统(SpringBoot后端Vue管理端) Java毕业设计_哔哩哔哩_bilibili 项…...

编程新知 2026/1/29 5:39:49

Git 3天2K星标：Datawhale 的 Happy-LLM 项目介绍（附教程）

引言在人工智能飞速发展的今天，大语言模型（Large Language Models, LLMs）已成为技术领域的焦点。从智能写作到代码生成，LLM 的应用场景不断扩展，深刻改变了我们的工作和生活方式。然而，理解这些模型的内部…...

编程新知 2026/1/29 11:06:33

R 语言科研绘图第 55 期 --- 网络图-聚类

在发表科研论文的过程中，科研绘图是必不可少的，一张好看的图形会是文章很大的加分项。为了便于使用，本系列文章介绍的所有绘图都已收录到了 sciRplot 项目中，获取方式： R 语言科研绘图模板 --- sciRplothttps://mp.…...

编程新知 2026/1/30 2:34:31

拟合问题处理

在机器学习中，核心任务通常围绕模型训练和性能提升展开，但你提到的 “优化训练数据解决过拟合” 和 “提升泛化性能解决欠拟合” 需要结合更准确的概念进行梳理。以下是对机器学习核心任务的系统复习和修正： 一、机器学习的核心任务框架机…...

编程新知 2025/9/6 11:47:54

Yii2项目自动向GitLab上报Bug

Yii2 项目自动上报Bug 原理 yii2在程序报错时, 会执行指定action, 通过重写ErrorAction, 实现Bug自动提交至GitLab的issue 步骤配置SiteController中的actions方法 public function actions(){return [error > [class > app\helpers\web\ErrorAction,],];}重写Error…...

编程新知 2025/12/17 3:27:17

LTR-381RGB-01RGB+环境光检测应用场景及客户类型主要有哪些？

RGB环境光检测功能，在应用场景及客户类型： 1. 可应用的儿童玩具类型 (1) 智能互动玩具功能：通过检测环境光或物体颜色触发互动（如颜色识别积木、光感音乐盒）。客户参考： LEGO（乐高&#x…...

编程新知 2026/2/5 5:41:34

【笔记】结合 Conda任意创建和配置不同 Python 版本的双轨隔离的 Poetry 虚拟环境

如何结合 Conda 任意创建和配置不同 Python 版本的双轨隔离的Poetry 虚拟环境？ 在 Python 开发中，为不同项目配置独立且适配的虚拟环境至关重要。结合 Conda 和 Poetry 工具，能高效创建不同 Python 版本的 Poetry 虚拟环境，接下来…...

编程新知 2026/1/28 7:51:38

Spring Boot 与 Kafka 的深度集成实践（二）

3. 生产者实现 3.1 生产者配置在 Spring Boot 项目中，配置 Kafka 生产者主要是配置生产者工厂（ProducerFactory）和 KafkaTemplate 。生产者工厂负责创建 Kafka 生产者实例，而 KafkaTemplate 则是用于发送消息的核心组件&#x…...

编程新知 2025/9/7 5:22:08