当前位置：首页 > news >正文

AI客服-接入deepseek大模型到微信（本地部署deepseek集成微信自动收发消息）

news 2026/2/9 14:59:35

1.本地部署

1.1 ollama

Ollama软件通过其高度优化的推理引擎和先进的内存管理机制，显著提升了大型语言模型在本地设备上的运行效率。其核心采用了量化技术（Quantization）以降低模型的计算复杂度和存储需求，同时结合张量并行计算（Tensor Parallelism）和混合精度计算（Mixed Precision Computing），在FP16、INT8等低精度格式下实现高效的数值运算，从而大幅减少显存占用并加速推理过程。此外，Ollama支持动态批处理（Dynamic Batching）和分布式推理（Distributed Inference），能够根据输入请求动态调整资源分配，并通过多GPU或节点间的高效通信协议（如NCCL）实现弹性扩展，突破单机硬件限制。为确保兼容性，Ollama内置了对主流框架（如PyTorch、TensorFlow）的支持，并通过ONNX Runtime和TensorRT进一步优化模型性能，同时提供灵活的API接口和模块化设计，允许用户进行自定义微调（Fine-tuning）和Prompt工程，满足多样化应用场景需求。

1.1.1 下载安装

https://ollama.com/download
在这里插入图片描述 双击打开安装，ollama默认只能安装在C盘，占用：4.6G 空间。

C:\用户\用户名称\AppData\Local\Programs\Ollama

我的电脑中安装目录：C:\Users\Administrator\AppData\Local\Programs\Ollama
在这里插入图片描述

1.1.2 环境变量

默认ollama去下载部署deepseek模型时，会放在C盘 C:\Users\Administrator\.ollama\models文件夹中。修改环境变量，可以让后续模型下载到其他盘符。

OLLAMA_MODELS D:\ollama\models

配置好之后，ollama重启 或 重启电脑 让环境变量生效。

1.2 deepseek部署

https://ollama.com/library/deepseek-r1
在这里插入图片描述
根据自己电脑配置部署模型规模

模型规模	硬盘	显存需求	内存	显卡要求
1.5B	1.1 GB	~2-3 GB	~4-6 GB	单卡（RTX 3060/3090/4090）
7B	4.7 GB	~8-12 GB	~16-24 GB	单卡（RTX 3090/4090/A100）
8B	4.9 GB	~9-13 GB	~18-26 GB	单卡（RTX 3090/4090/A100）
14B	9.0 GB	~16-20 GB	~32-40 GB	单卡（A100 40GB）
32B	20 GB	~35-45 GB	~70-90 GB	单卡（A100 80GB）或多卡并行
70B	43 GB	~75-90 GB	~150-180 GB	多卡（A100/H100 + NVLink）
671B	404 GB	~700-900 GB	~1.4-1.8 TB	多卡集群（A100/H100 + NVLink）

执行命令本地部署：

ollama run deepseek-r1:1.5b

在这里插入图片描述

2.deepseek调用

在这里插入图片描述
ollama中的服务可以用两种方式启动，默认监听本机localhost 和端口11434

在终端执行命令： ollama serve
找到ollama图标，点击运行

2.1 终端调用

C:\Users\Administrator>ollama list
NAME                ID              SIZE      MODIFIED       
deepseek-r1:1.5b    a42b25d8c10a    1.1 GB    4 hours ago
C:\Users\Administrator>ollama run deepseek-r1:1.5b
>>> 
>>> 学习python的路径？
<think>
好吧，我现在要学习Python了。我对它还不是很了解，所以得一步一步来。首先，我应该确定我的学习目标是什么。可能是从基础开始，比如语     
法和基本概念，然后逐步深入到更高级的内容。
...
>>> /bye

在这里插入图片描述

2.2 API调用

对话相关的API有两个：

/api/generate，用于一次性生成特定文本的场景。
/api/chat，针对多轮对话上下文生成的回复消息。

接下来，结合案例来使用API来调用，需要安装Python环境和 requests 模块。

示例：/api/generate

该 API 主要用于基于给定的提示信息生成文本内容。它适用于一次性生成特定文本的场景，不涉及对话上下文的维护.请求参数model：要使用的模型名称，例如 `deepseek-r1:1.5b`。prompt：提示信息，即向模型提供的输入文本，模型会根据该提示生成相应的内容。可选参数：还可以包含其他参数来控制生成的行为，如 `temperature`（控制生成文本的随机性，值越大越随机）、`max_tokens`（限制生成文本的最大令牌数）等。示例请求体{"model": "llama2","prompt": "写一首关于春天的诗","temperature": 0.7,"max_tokens": 200}

import requestsres = requests.post(url="http://localhost:11434/api/generate",json={"model": "deepseek-r1:1.5b","prompt": "写一首关于春天的诗","stream": False}
)data_dict = res.json()
print(data_dict)

在这里插入图片描述
示例：/api/chat

用于模拟对话交互，它会维护对话的上下文，使得模型能够根据之前的对话内容生成合适的回复，实现更自然、连贯的对话效果。请求参数model：要使用的模型名称。messages：一个包含对话消息的列表，每个消息对象包含 role（角色，如 user 表示用户消息，assistant 表示模型回复）和 content（消息内容）。同样可以包含可选参数来控制生成行为。示例请求体{"model": "deepseek-r1:1.5b","messages": [{"role": "user","content": "你好"}],"temperature": 0.8}

import requestsres = requests.post(url="http://localhost:11434/api/chat",json={"model": "deepseek-r1:1.5b","messages": [{"role": "user", "content": "你好"}],"stream": False}
)
data_dict = res.json()
print(data_dict)

在这里插入图片描述
可以将对话保存下来，生成对话：

import requestsmessage_list = []while True:text = input("请输入：")user_dict = {"role": "user", "content": text}message_list.append(user_dict)res = requests.post(url="http://localhost:11434/api/chat",json={"model": "deepseek-r1:1.5b","messages": message_list,"stream": False})data_dict = res.json()res_msg_dict = data_dict['message']print(res_msg_dict)message_list.append(res_msg_dict)

在这里插入图片描述

2.3 网页交互

搭建一个网站，在内部进行访问使用。

第1步：电脑安装nodejs

https://nodejs.org/zh-cn/download
在这里插入图片描述
第2步：下载网站源码

https://github.com/ollama-webui/ollama-webui-lite
在这里插入图片描述
下载并解压至任意目录。例如：F:\ollama-webui-lite-main 【不要有中文路径】

第3步：安装依赖并启动网站

打开CMD终端进入项目目录并执行相关命令。

C:\Users\Administrator>F:
F:\>cd F:\ollama-webui-lite-main
F:\ollama-webui-lite-main>
F:\ollama-webui-lite-main>npm ci
F:\ollama-webui-lite-main>npm run dev --  --port=9001

在这里插入图片描述
访问网站：http://localhost:9001/

3.微信收发信息

wxauto 是一个基于UIAutomation开发的用于实现微信自动化得库。

消息发送：支持发送文字、图片、文件、@群好友、引用消息等功能
聊天记录：可获取好友的聊天记录内容
监听消息：实时获取指定监听好友（群）的新消息

所用开发环境：Python 3.12.6 + PC微信 3.9.12（目前最新）
在这里插入图片描述
实现原理：在电脑安装PC微信，基于wxauto自动控制微信界面来实现收发消息等功能。

安装wxauto

pip install wxauto==3.9.11.17.5

发消息

from wxauto import WeChat
wx = WeChat()
wx.SendMsg(msg="你好呀", who="xxx_888")  # 指定人/群发消息# wx.SendMsg(msg="你好呀", who="群名", at=["张三","张开"])   # 群消息+@指定人
# wx.SendMsg(filepath="F:\xxx.png", who="用户或群") 
# wx.SendMsg(filepath=["文件A","文件B","F:\xxx.png"], who="用户或群")

收消息（所有）

from wxauto import WeChatwx = WeChat()while True:# 等待接受收到的最新消息# {"用户昵称A":[消息对象1,消息对象2,消息对象3], "用户昵称B":[消息对象1,消息对象2,消息对象3], }msg_dict = wx.GetNextNewMessage()for username, msg_list in msg_dict.items():print("昵称：", username)# [消息对象1, 消息对象2, 消息对象3]for msg in msg_list:print("\t消息", msg.type, msg.content)

收消息（指定用户）

from wxauto import WeChat
wx = WeChat()wx.AddListenChat(who="运营")
wx.AddListenChat(who="xxx_888")while True:# { "用户A聊天窗口":[消息对象1,消息对象2,消息对象3],  "用户B聊天窗口":[消息对象1,消息对象2,消息对象3]}listen_dict = wx.GetListenMessage()for chat_win,message_list in listen_dict.items():# 用户或群名chat_user = chat_win.who# [消息对象1,消息对象2,消息对象3]for msg in message_list:if msg.type != "friend":continueprint(chat_user, msg.content)# 回复消息# chat_win.SendMsg("回复的内容")time.sleep(5)

👏欢迎贡献代码和改进项目！

AI客服-接入deepseek大模型到微信（本地部署deepseek集成微信自动收发消息）

1.本地部署 1.1 ollama Ollama软件通过其高度优化的推理引擎和先进的内存管理机制，显著提升了大型语言模型在本地设备上的运行效率。其核心采用了量化技术（Quantization）以降低模型的计算复杂度和存储需求，同时结合张量并行计算&…...

编程日记 2025/2/22 7:37:52

Host文件没有配置ip解析，导致请求接口速度慢

Linux访问第三方接口速度慢现象在测试环境，Linux的服务器中，要访问第三方接口；速度有时快，有时慢。有时候第一次访问比较慢，第二次访问比较快。第三方人员，排查之后，第三方接口没有问题&am…...

编程日记 2025/2/22 7:36:30

excel导入Mysql中时间格式异常

问题描述： 当使用xls/xlsx/csv导入mysql中，如果列是时间类型比如excel表中显示2024/02/20 09:18:00，导入后时间可能就会变成1900-01-01 09:18:00这样。问题原因： 这是由于excel表中和数据库中的时间类型不匹配导致。问题解决…...

编程日记 2025/2/22 7:35:16

vue 判断一个属性值，如果是null或者空字符串或者是空格没有值的情况下，赋值为--

在 Vue 中，可以通过多种方式来判断一个属性值是否为 null、空字符串或者仅包含空格，如果满足这些条件则将其赋值为 --。下面分别介绍在模板和计算属性、方法中实现的具体做法。 1. 在模板中直接判断如果只需要在模板中对属性值进行显示处理&#xff0c…...

编程日记 2025/2/22 7:32:58

JavaWeb-Tomcat服务器

文章目录 Web服务器存在的意义关于Web服务器软件Tomcat服务器简介安装Tomcat服务器Tomcat服务器源文件解析配置Tomcat的环境变量启动Tomcat服务器一个最简单的webapp(不涉及Java) Web服务器存在的意义我们之前介绍过Web服务器进行通信的原理, 但是我们当时忘记了一点, 服务器…...

编程日记 2025/2/22 7:31:30

vue语法---样式操作-行内样式

文章目录直接写死的行内样式v-bind绑定对象(静态样式)对象数组直接写死的行内样式 <template><div v-bind:style"{color:red}">睡觉</div> </template><script>export default{data() {return {}},methods:{}, mounted(){},} </…...

编程日记 2025/2/22 7:30:21

封装一个echarts的组件

父组件页面 <yyjlchartv-if"showyyjl"chartId"yyjllLine":sourceData"sourceDatayyjl":options"optionsyyjl"></yyjlchart>components: {LineEcharts,yyjlchart: () > import("../yyjlchart"),},data() {re…...

编程日记 2025/2/22 7:27:05

计算机网络安全之一:网络安全概述

1.1 网络安全的内涵随着计算机和网络技术的迅猛发展和广泛普及，越来越多的企业将经营的各种业务建立在Internet/Intranet环境中。于是，支持E-mail、文件共享、即时消息传送的消息和协作服务器成为当今商业社会中的极重要的IT基础设施。然而&#xff0…...

编程日记 2025/2/22 7:23:52

Linux 性能调优简单指南

一、性能调优概述 Linux 性能调优是系统运维的核心任务之一，目的是通过资源分配、参数优化和瓶颈消除，提升系统运行效率和稳定性。调优需遵循以下原则：基于数据驱动：使用监控工具精准定位瓶颈分层逐级分析：从硬件到应用的逐层排查变更可回溯：单变量调整并记录结果场景适…...

编程日记 2025/2/22 7:21:25

第十一章： vue2-3 生命周期

创建挂载更新销毁四个阶段 > 生命周期函数　生命周期钩子　　created mounted 创建vue2 的脚手架：　vue create vue2_test v-show"isShow" v-if "isShow" 这里的isShow 表示一个函数 let isShow "true" <tem…...

编程日记 2025/2/22 7:18:04

【算法基础】--前缀和

前缀和一、一维前缀和示例模板[寻找数组的中心下标 ](https://leetcode.cn/problems/tvdfij/description/)除自身以外的数组乘积和可被k整除的子数组一、一维前缀和前缀和就是快速求出数组某一个连续区间内所有元素的和。示例模板已知一个数组arr，求前缀和 …...

编程日记 2025/2/22 7:13:38

输入搜索、分组展示选项、下拉选取，el-select 实现：即输入关键字检索，返回分组选项，选取跳转到相应内容页 —— VUE 项目-全局模糊检索

后端数据代码写于下一篇：输入搜索、分组展示选项、下拉选取，全局跳转页，el-select 实现 —— 后端数据处理代码，抛砖引玉展思路【效果图】：分组展示选项【去界面操作感受一下】—> 便捷简洁的企业官网【录制效…...

编程日记 2025/2/22 7:10:26

Web入侵实战分析-常见web攻击类应急处置实验2

场景说明某天运维人员，发现运维的公司站点被黑页，首页标题被篡改，你获得的信息如下： 操作系统：windows server 2008 R2业务：公司官网网站架构：通过phpstudy运行apache mysqlphp开放端口&…...

编程日记 2025/2/22 7:09:09

DeepSeek：AI商业化的新引擎与未来蓝图

摘要在人工智能迅猛发展的浪潮中，DeepSeek以其卓越的技术实力和高超的商业化能力崭露头角。作为一款现象级AI产品，它不仅在算法性能上位居行业前列，还通过灵活的定制解决方案渗透到金融、医疗、零售等多个领域。DeepSeek以创新的商业模式和场…...

编程日记 2025/2/22 7:06:56

从零开始学习PX4源码9(部署px4源码到gitee)

目录文章目录目录摘要1.gitee上创建仓库1.1 gitee上创建仓库PX4代码仓库1.2 gitee上创建子仓库2.固件在gitee部署过程2.1下载固件到本地2.2切换本地分支2.3修改.gitmodules内容2.4同步子模块仓库地址2.5同步子模块仓库地址更新（下载）子模块3.一级子模块和二级子模块的映射关…...

编程日记 2025/2/22 7:05:52

wps中zotero插件消失，解决每次都需要重新开问题

参考查看zotero目录 D:\zotero\integration\word-for-windows 加载项点击 dotm即可长期解决把dom 复制到 C:\Users\89735\AppData\Roaming\kingsoft\office6\templates\wps\zh_CN还是每次都需要重新开的话重新加载一下...

编程日记 2025/2/22 7:03:37

【Python 语法】collections 模块的字典类 defaultdict

默认字典 (defaultdict) 的语法defaultdict 的常见应用场景1. 计数2. 分组3. 嵌套字典 defaultdict 是 Python 中 collections 模块提供的一个字典类，它和普通字典（ dict）的主要区别在于提供了一个默认值，可以避免在访问字典中…...

编程日记 2025/2/22 7:02:32

《论系统需求分析方法》写作心得 - 系统分析师

系统需求分析方法论述一、项目概述及本人职责本人曾参与一项企业级客户关系管理系统（CRM）的开发项目，担任系统分析师的角色。该项目旨在为企业提供一个集客户信息管理、销售过程跟踪、客户服务支持于一体的综合管理平台，以提升…...

编程日记 2025/2/22 6:59:19

Jupyter里面的manim编程学习

1.Jupyterlab的使用因为我之前一直都是使用的vscode进行manim编程的，但是今天看的这个教程使用的是Jupyter，我也很是好奇这个manim在Jupyter这样的交互式下面会生成怎么样的效果，所以今天尝试了jupyter，并且对于两个进行比较和说…...

编程日记 2025/2/22 6:51:57

Python之装饰器二带参数的装饰器

前言一、带参数的装饰器二、在装饰器里面传入参数总结前言暂无一、带参数的装饰器我们知道，不带参数的装饰其实就是在函数的头上添加装饰器时放一个名称，这种写法就默认了装饰器函数调的是被装饰函数自己，换句话说就是，大家…...

编程日记 2025/2/22 6:45:48

华为云AI开发平台ModelArts

华为云ModelArts：重塑AI开发流程的“智能引擎”与“创新加速器”！ 在人工智能浪潮席卷全球的2025年，企业拥抱AI的意愿空前高涨，但技术门槛高、流程复杂、资源投入巨大的现实，却让许多创新构想止步于实验室。数据科学家…...

编程新知 2026/2/8 4:37:19

应用升级/灾备测试时使用guarantee 闪回点迅速回退

1.场景应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。相对于RMAN恢复需要很长时间， 数据库闪回只需要几分钟。 2.技术实现数据库设置 2个db_recovery参数创建guarantee闪回点，不需要开启数据库闪回。…...

编程新知 2026/1/14 22:12:47

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能，包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...

编程新知 2025/11/14 9:31:35

Mybatis逆向工程，动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢，博主的学习进度也是步入了Java Mybatis 框架，目前正在逐步杨帆旗航。那么接下来就给大家出一期有关 Mybatis 逆向工程的教学，希望能对大家有所帮助，也特别欢迎大家指点不足之处，小生很乐意接受正确的建议&…...

编程新知 2026/1/31 15:00:15

全球首个30米分辨率湿地数据集(2000—2022)

数据简介今天我们分享的数据是全球30米分辨率湿地数据集，包含8种湿地亚类，该数据以0.5X0.5的瓦片存储，我们整理了所有属于中国的瓦片名称与其对应省份，方便大家研究使用。该数据集作为全球首个30米分辨率、覆盖2000–2022年时间…...

编程新知 2026/1/31 17:15:25

【RockeMQ】第2节｜RocketMQ快速实战以及核⼼概念详解（二）

升级Dledger高可用集群一、主从架构的不足与Dledger的定位主从架构缺陷数据备份依赖Slave节点，但无自动故障转移能力，Master宕机后需人工切换，期间消息可能无法读取。Slave仅存储数据，无法主动升级为Master响应请求&#xff…...

编程新知 2025/9/2 3:37:40

python执行测试用例，allure报乱码且未成功生成报告

allure执行测试用例时显示乱码：‘allure’ �����ڲ����ⲿ���Ҳ���ǿ�&am…...

编程新知 2026/2/7 4:21:44

给网站添加live2d看板娘

给网站添加live2d看板娘参考文献： stevenjoezhang/live2d-widget: 把萌萌哒的看板娘抱回家 (ノ≧∇≦)ノ | Live2D widget for web platformEikanya/Live2d-model: Live2d model collectionzenghongtu/live2d-model-assets 前言网站环境如下，文章也主…...

编程新知 2026/2/1 4:23:19