当前位置：首页 > article >正文

连接chatgpt的桌面语音助手

article 2026/2/28 11:53:36

要创建一个连接到 ChatGPT 的桌面语音助手，可以使用 Python 编写一个程序来实现语音识别、与 ChatGPT API 交互以及语音合成的功能。以下是一个完整的解决方案和技术实现步骤：

所需工具和库

语音识别
- 使用 speech_recognition 库捕获用户的语音输入。
- 需要麦克风支持。
ChatGPT API
- 使用 OpenAI 提供的 API（如 GPT-3.5 或 GPT-4）处理用户的问题并生成响应。
- 需要一个 OpenAI 账号和 API 密钥。
语音合成（TTS, Text-to-Speech）
- 使用 pyttsx3 或 gTTS（Google Text-to-Speech）将 ChatGPT 的文本响应转换为语音输出。
其他依赖
- openai：用于调用 OpenAI API。
- pyaudio：支持语音识别。
- playsound 或 simpleaudio：播放语音合成后的音频文件（如果需要）。

实现步骤

1. 安装必要的库

在终端中运行以下命令安装所需的 Python 库：

pip install speechrecognition pyttsx3 openai playsound pyaudio

注意：pyaudio 可能需要额外的系统依赖项。如果安装失败，请参考 PyAudio 安装指南。

2. 编写代码

以下是一个完整的示例代码：

import speech_recognition as sr
import pyttsx3
import openai
import os# 初始化语音引擎
engine = pyttsx3.init()# 设置 OpenAI API 密钥
openai.api_key = "YOUR_OPENAI_API_KEY"# 配置语音参数
engine.setProperty('rate', 150)  # 设置语速
engine.setProperty('volume', 1.0)  # 设置音量# 语音识别函数
def recognize_speech():recognizer = sr.Recognizer()with sr.Microphone() as source:print("请说话...")recognizer.adjust_for_ambient_noise(source)  # 减少环境噪音的影响audio = recognizer.listen(source)try:text = recognizer.recognize_google(audio, language="zh-CN")  # 使用 Google 的语音识别服务print(f"你说的是: {text}")return textexcept sr.UnknownValueError:print("无法识别语音")return ""except sr.RequestError as e:print(f"语音识别服务出错: {e}")return ""# 调用 ChatGPT API 获取响应
def get_chatgpt_response(prompt):response = openai.ChatCompletion.create(model="gpt-3.5-turbo",  # 使用 GPT-3.5 模型messages=[{"role": "system", "content": "你是一个智能助手，能够回答用户的问题。"},{"role": "user", "content": prompt}])return response.choices[0].message.content# 语音合成函数
def speak(text):print(f"助手回答: {text}")engine.say(text)engine.runAndWait()# 主程序
def main():while True:# 语音输入user_input = recognize_speech()if not user_input:continue# 如果用户说“退出”或“停止”，结束程序if "退出" in user_input or "停止" in user_input:speak("好的，再见！")break# 调用 ChatGPT 获取响应response = get_chatgpt_response(user_input)# 语音输出speak(response)if __name__ == "__main__":main()

代码解析

语音识别
- 使用 speech_recognition 库捕获用户的语音输入。
- 通过 recognize_google 方法将语音转换为文本。
调用 ChatGPT API
- 使用 OpenAI 的 ChatCompletion API 发送用户输入，并获取 ChatGPT 的响应。
- 在 messages 参数中，定义了系统角色（system）和用户角色（user），以模拟对话。
语音合成
- 使用 pyttsx3 将 ChatGPT 的文本响应合成为语音。
- engine.say() 用于生成语音，engine.runAndWait() 用于播放语音。
主循环
- 程序持续监听用户的语音输入，直到用户说出“退出”或“停止”。

运行程序

设置 OpenAI API 密钥
替换代码中的 YOUR_OPENAI_API_KEY 为你自己的 OpenAI API 密钥。可以从 OpenAI 官网获取。
运行代码
在终端中运行以下命令启动程序：
```
python your_script_name.py
```
测试功能
- 对着麦克风说话，程序会将你的语音转换为文本。
- ChatGPT 处理文本后返回响应，程序将其合成为语音并播放。

优化建议

多语言支持
- 修改 recognize_google 的 language 参数，支持其他语言（如英语、法语等）。
离线语音合成
- 如果不想依赖在线服务，可以使用离线 TTS 引擎（如 espeak 或 Festival）。
改进用户体验
- 添加唤醒词（如“嘿，助手”）以避免误触发。
- 使用更高级的语音合成引擎（如 gTTS 或 Azure Speech Service）提高语音质量。
错误处理
- 增强对网络问题、API 调用失败等情况的处理。

总结

通过上述代码，你可以创建一个简单的桌面语音助手，结合语音识别、ChatGPT 和语音合成技术，实现与用户的自然语言交互。这个项目不仅可以作为学习 AI 和语音技术的实践，还可以扩展为更复杂的应用，例如智能家居控制、教育助手等。

连接chatgpt的桌面语音助手

要创建一个连接到 ChatGPT 的桌面语音助手，可以使用 Python 编写一个程序来实现语音识别、与 ChatGPT API 交互以及语音合成的功能。以下是一个完整的解决方案和技术实现步骤： 所需工具和库语音识别使用 speech_recognition 库捕获用户的语音输入。需要…...

编程日记 2026/2/19 2:56:46

systemctl restart 和 systemctl reload 和 systemctl daemon-reload 对比笔记250322

systemctl restart 和 systemctl reload 和 systemctl daemon-reload 对比以下是 systemctl restart、systemctl reload 和 systemctl daemon-reload 的对比总结： 命令作用对象行为适用场景对服务的影响systemctl restart 服务名具体服务强制停止服务&#xff0c…...

编程日记 2026/2/27 11:03:54

DeepSeek 助力 Vue3 开发：打造丝滑的表格（Table）之添加导出数据功能示例9，TableView15_09带排序的导出表格示例

前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏关注哦 💕 目录 Deep…...

编程日记 2026/2/20 7:08:56

spring boot 登入权限RBAC模式

首先准备好5张表 user_info表，用户的信息表 role表，角色表（比如超级管理员、管理员、审核员、采购......） 创建user_role表，user_info表，role表的中间表注意了，role_id和user_id是 u…...

编程日记 2026/2/22 5:11:46

调用API拿到的值——存储方式

1.响应结果示例： "purposeTagList":["稳中向好及进中提质"] 2.数据库中定义的 3.值的获取： F1 JsonNode purposeTagListNode dataNode.path("purposeTagList");if (purposeTagListNode.isArray()) {StringBuilder purp…...

编程日记 2026/2/20 3:26:55

【用 Trace读源码】PlanAgent 执行流程

前提条件在 Trae 中打开 OpenManus 工程，使用 build 模式，模型选择 claude-sonnet-3.7 提示词分析 agent/planning.py 中 main 方法及相关类的执行流程，以流程图的方式展示PlanningAgent 执行流程图以下流程图展示了 PlanningAgent 类…...

编程日记 2026/2/14 10:56:41

第一讲 | 解锁C++编程能力：基础语法解析

C入门基础一、C的第一个程序二、命名空间三、C输入&输出四、缺省参数/默认参数五、函数重载六、引用1.引用的特性2.引用的使用引用做返回值场景 3.const引用只有指针和引用涉及权限放大、缩小的问题，普通变量没有 4.指针和引用的关系七、inline八、nullptr 一…...

编程日记 2026/2/17 19:27:11

LeetCode 热题 100_划分字母区间（80_763_中等_C++）(贪心算法(求并集))

LeetCode 热题 100_划分字母区间（80_763） 题目描述：输入输出样例：题解：解题思路：思路一（贪心算法(求交集)）： 代码实现代码实现（思路一（贪心算法(求…...

编程日记 2026/2/17 4:25:14

C++ --- 多态

1 多态的概念多态(polymorphism)的概念：通俗来说，就是多种形态。多态分为编译时多态(静态多态)和运⾏时多态(动态多态)，这⾥我们重点讲运⾏时多态，编译时多态(静态多态)和运⾏时多态(动态多态)。编译时多态(静态多态)主要就是我…...

编程日记 2026/2/28 4:37:10

HAL库中使用空闲中断+DMA接收数据，接收失败的问题

问题： 串口屏与单片机通过串口（USART1）进行通信，调试时发现问题，现象如下： 手动页面的几个文本，输入的数字不会显示出来，比如初始值为0，输入200，200会一闪而…...

编程日记 2026/2/18 8:17:08

【STM32实物】基于STM32的扫地机器人/小车控制系统设计

基于STM32的扫地机器人/小车控制系统设计演示视频：基于STM32的扫地机器人小车控制系统设计简介：扫地机器人系统采用分层结构设计，主要包括底层硬件控制层、中间数据处理层和上层用户交互层。底层硬件控制层负责对各个硬件模块进行控制和数据采集，中间数据处理层负责对采…...

编程日记 2026/2/18 20:37:38

【Scrapy】Scrapy教程8——处理子链接

通过前面几篇文章，已经了解了如何去爬取网页内容并存储到数据库，但是目前只是存储了一个页面的内容，现在想要获取每篇文章链接内的文章内容，我们来看看怎么获取。生成新请求首先我们肯定要先拿到链接，所以第一步都获取文章标题和链接肯定少不了，然后再爬取获取到到子…...

编程日记 2026/2/23 23:12:28

使用pycel将Excel移植到Python

1.适用需求有些工作可能长期适用excel来进行公式计算，当需要把工作流程转换为可视化界面时，开发人员不懂专业逻辑，手动摸索公式很大可能出错，而且费时费力 2.可用工具及缺点 pandas 方便进行数据处理，支持各种格…...

编程日记 2026/2/18 9:42:00

学习应用层

应用层概述客户/服务器方式（C/S）和对等方式（P2P） 动态主机配置协议DHCP 客户/服务器方式 DHCP报文会被封装成为UDP用户数据报，DHCP服务器端口号是UDP67，用户是UDP68。广播发送，是因为并不知道…...

编程日记 2026/2/17 12:42:33

一、FE配置源码 apache-doris-src\fe\fe-common\src\main\java\org\apache\doris\common\Config.java 二、BE配置源码 apache-doris-src\be\src\common\config.cpp 三、FE源码 package org.apache.doris.common;public class Config extends ConfigBase {ConfField(descri…...

编程日记 2026/2/18 13:47:43

蓝桥杯算法精讲：二分查找实战与变种解析

适合人群：蓝桥杯备考生 | 算法竞赛入门者 | 二分查找进阶学习者目录一、二分查找核心要点 1. 算法思想 2. 适用条件 3. 算法模板二、蓝桥杯真题实战例题1：分巧克力（蓝桥杯2017省赛） 例题2：砍竹子&#xff0…...

编程日记 2026/2/17 1:51:06

C++脚本化方案调研

1 什么是脚本化脚本化（Scripting）是指将脚本语言嵌入到主程序（C等编译型语言）中，通过以下方式扩展程序能力： 动态逻辑控制：通过脚本实现运行时逻辑调整，无需重新编译主程序&#x…...

编程日记 2026/2/18 7:19:01

蓝桥杯（N皇后问题）------回溯法

题目描述在 NN 的方格棋盘放置了 N 个皇后，使得它们不相互攻击（即任意 2 个皇后不允许处在同一排，同一列，也不允许处在与棋盘边框成 45 角的斜线上。你的任务是，对于给定的 N，求出有多少种合法的放置方法…...

编程日记 2026/2/22 5:25:22

再探C语言（1）

温馨提示： 学C语言就像玩《掘地求升》——你以为懂了语法就能通关？ 不！编译器会用铁锤教你做人！(╯‵□′)╯︵┻━┻ 🐱Part 1：sizeofの跨平台迷惑行为 Q1. 不同环境下sizeof(int)的结果运行环境结果&a…...

编程日记 2026/2/17 0:06:27

高项第十三章——项目资源管理

什么是资源管理？项目资源管理包括识别、获取和管理所需资源以成功完成项目的各个过程。本过程关注两类资源：实物资源包括设备、材料、设施和基础设施团队资源或人员指的是团队的人力资源 13_1 项目资源管理基础项目团队是执行项目工作&#xff0c…...

编程日记 2026/2/16 23:08:08

C/C++转换为字符串宏和字符串拼接宏的综合使用

本文内容参考： C/C++ 宏拼接和宏展开为字符串 - DoubleLi - 博客园特此致谢！ 1. 转换为字符串宏与字符串拼接宏（1）转换为字符串宏转换为字符串的宏为： #define STR(x) #x //转字符串（2）字符串拼接宏字符串拼接的宏为： #define CONCAT(x,y) x##y //拼接 2…...

编程日记 2026/2/17 23:47:49

Linux：xxx is not in the sudoers file. This incident will be reported.

报错 xxx is not in the sudoers file. This incident will be reported.解决方式切换到root用户下操作 # 1、修改/etc/sudoers文件为可修改，默认是只读的 ls -lh /etc/sudoers -r--r----- 1 root root 4.3K Dec 1 01:45 /etc/sudoerschmod uw /etc/sudoersls…...

编程日记 2026/2/16 12:07:48

掌握新编程语言的秘诀：利用 AI 快速上手 Python、Go、Java 和 Rust

网罗开发 （小红书、快手、视频号同名） 大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、Harmony OS、Java、Python等…...

编程日记 2026/2/18 11:51:18

个人常用的chrome好用插件

chrome可以说是兼容性和实用性较高的浏览器没有复杂的ui 沉重的广告加上各种各样的浏览器插件现在罗列一下个人常用的几款好用的插件 1. Adblock Plus 一款免费的广告拦截器，可以拦截大部分网站上的广告推荐，还你一个干净舒服的页面以下为b站演示…...

编程日记 2026/2/20 14:23:14

Redis 内存优化

Redis 内存优化 Redis性能优化可以从多个方面进行，主要包括以下几个方面： 1. 内存优化 Redis 是基于内存的数据库，优化内存使用可以提高性能并降低成本。 (1) 使用合适的数据结构不同的数据结构占用的内存不同，选择合适的数据…...

编程日记 2026/2/17 10:26:35

数据库设计-笔记2

1.介绍一下MySQL 历史与发展 MySQL 最初由瑞典的 MySQL AB 公司开发，于 1995 年正式发布。2008 年，MySQL AB 公司被 Sun Microsystems 收购，之后 Sun 又被甲骨文（Oracle）公司收购，MySQL 成为 Oracle 旗下…...

编程日记 2026/2/19 4:47:18

【大模型】什么是循环神经网络（RNNs）

在人工智能（AI）的世界里，**循环神经网络（Recurrent Neural Networks, RNNs）**是一种非常强大的工具，特别适合处理序列数据。无论是语言、时间序列还是音乐，RNNs都能帮助我们理解和预测这些数据的…...

编程日记 2026/2/17 2:38:13

hexo+butterfly搭建博客网站总结篇

hexobutterfly搭建博客网站总结篇文章目录 hexobutterfly搭建博客网站总结篇0.往期栏目1.发现的不错的butterfly博主2.待实现的功能 && 结语笔者待实现的功能结语 0.往期栏目个人博客网站搭建_为了前进而后退，为了走直路而走弯路的博客-CSDN博客【Node…...

编程日记 2026/2/28 3:58:28

损失函数理解（二）——交叉熵损失

损失函数的目的是为了定量描述不同模型（例如神经网络模型和人脑模型）的差异。交叉熵，顾名思义，与熵有关，先把模型换成熵这么一个数值，然后用这个数值比较不同模型之间的差异。为什么要做这一步转换&…...

编程日记 2026/2/21 0:53:10

基于随机森林回归预测葡萄酒质量

基于随机森林回归预测葡萄酒质量 1.作者介绍2.随机森林算法与数据集介绍2.1定义2.2核心思想2.3主要步骤2.4数据集介绍 3.算法实现3.1数据加载与探索3.2数据可视化3.3数据预处理（标准化、划分训练/测试集）3.4模型训练与优化（随机森林回归超参…...

编程日记 2026/2/14 4:08:45

连接chatgpt的桌面语音助手

所需工具和库

实现步骤

1. 安装必要的库

2. 编写代码

代码解析

运行程序

优化建议

总结

相关文章：

连接chatgpt的桌面语音助手

systemctl restart 和 systemctl reload 和 systemctl daemon-reload 对比笔记250322

DeepSeek 助力 Vue3 开发：打造丝滑的表格（Table）之添加导出数据功能示例9，TableView15_09带排序的导出表格示例

spring boot 登入权限RBAC模式

调用API拿到的值——存储方式

【用 Trace读源码】PlanAgent 执行流程

第一讲 | 解锁C++编程能力：基础语法解析

LeetCode 热题 100_划分字母区间（80_763_中等_C++）(贪心算法(求并集))

C++ --- 多态

HAL库中使用空闲中断+DMA接收数据，接收失败的问题

【STM32实物】基于STM32的扫地机器人/小车控制系统设计

【Scrapy】Scrapy教程8——处理子链接

使用pycel将Excel移植到Python

学习应用层

Doris官网上没有的一些Fe参数了，都在源码中

蓝桥杯算法精讲：二分查找实战与变种解析

C++脚本化方案调研

蓝桥杯（N皇后问题）------回溯法

再探C语言（1）

高项第十三章——项目资源管理

C/C++转换为字符串宏和字符串拼接宏的综合使用

Linux：xxx is not in the sudoers file. This incident will be reported.

掌握新编程语言的秘诀：利用 AI 快速上手 Python、Go、Java 和 Rust

个人常用的chrome好用插件

Redis 内存优化

数据库设计-笔记2

【大模型】什么是循环神经网络（RNNs）

hexo+butterfly搭建博客网站总结篇

损失函数理解（二）——交叉熵损失

基于随机森林回归预测葡萄酒质量