AI客服-接入deepseek大模型到微信(本地部署deepseek集成微信自动收发消息)
1.本地部署
1.1 ollama
Ollama软件通过其高度优化的推理引擎和先进的内存管理机制,显著提升了大型语言模型在本地设备上的运行效率。其核心采用了量化技术(Quantization)以降低模型的计算复杂度和存储需求,同时结合张量并行计算(Tensor Parallelism)和混合精度计算(Mixed Precision Computing),在FP16、INT8等低精度格式下实现高效的数值运算,从而大幅减少显存占用并加速推理过程。此外,Ollama支持动态批处理(Dynamic Batching)和分布式推理(Distributed Inference),能够根据输入请求动态调整资源分配,并通过多GPU或节点间的高效通信协议(如NCCL)实现弹性扩展,突破单机硬件限制。为确保兼容性,Ollama内置了对主流框架(如PyTorch、TensorFlow)的支持,并通过ONNX Runtime和TensorRT进一步优化模型性能,同时提供灵活的API接口和模块化设计,允许用户进行自定义微调(Fine-tuning)和Prompt工程,满足多样化应用场景需求。
1.1.1 下载安装
https://ollama.com/download

双击打开安装,ollama默认只能安装在C盘,占用:4.6G 空间。
C:\用户\用户名称\AppData\Local\Programs\Ollama
我的电脑中安装目录:C:\Users\Administrator\AppData\Local\Programs\Ollama


1.1.2 环境变量
默认ollama去下载部署deepseek模型时,会放在C盘 C:\Users\Administrator\.ollama\models文件夹中。修改环境变量,可以让后续模型下载到其他盘符。
OLLAMA_MODELS D:\ollama\models
配置好之后,ollama重启 或 重启电脑 让环境变量生效。
1.2 deepseek部署
https://ollama.com/library/deepseek-r1

根据自己电脑配置部署模型规模
| 模型规模 | 硬盘 | 显存需求 | 内存 | 显卡要求 |
|---|---|---|---|---|
| 1.5B | 1.1 GB | ~2-3 GB | ~4-6 GB | 单卡(RTX 3060/3090/4090) |
| 7B | 4.7 GB | ~8-12 GB | ~16-24 GB | 单卡(RTX 3090/4090/A100) |
| 8B | 4.9 GB | ~9-13 GB | ~18-26 GB | 单卡(RTX 3090/4090/A100) |
| 14B | 9.0 GB | ~16-20 GB | ~32-40 GB | 单卡(A100 40GB) |
| 32B | 20 GB | ~35-45 GB | ~70-90 GB | 单卡(A100 80GB)或多卡并行 |
| 70B | 43 GB | ~75-90 GB | ~150-180 GB | 多卡(A100/H100 + NVLink) |
| 671B | 404 GB | ~700-900 GB | ~1.4-1.8 TB | 多卡集群(A100/H100 + NVLink) |
执行命令本地部署:
ollama run deepseek-r1:1.5b




2.deepseek调用

ollama中的服务可以用两种方式启动,默认监听本机localhost 和 端口11434
- 在终端执行命令: ollama serve

- 找到ollama图标,点击运行

2.1 终端调用
C:\Users\Administrator>ollama list
NAME ID SIZE MODIFIED
deepseek-r1:1.5b a42b25d8c10a 1.1 GB 4 hours ago
C:\Users\Administrator>ollama run deepseek-r1:1.5b
>>>
>>> 学习python的路径?
<think>
好吧,我现在要学习Python了。我对它还不是很了解,所以得一步一步来。首先,我应该确定我的学习目标是什么。可能是从基础开始,比如语
法和基本概念,然后逐步深入到更高级的内容。
...
>>> /bye

2.2 API调用
对话相关的API有两个:
- /api/generate,用于一次性生成特定文本的场景。
- /api/chat,针对多轮对话上下文生成的回复消息。
接下来,结合案例来使用API来调用,需要安装Python环境 和 requests 模块。
示例:/api/generate
该 API 主要用于基于给定的提示信息生成文本内容。它适用于一次性生成特定文本的场景,不涉及对话上下文的维护.请求参数model:要使用的模型名称,例如 `deepseek-r1:1.5b`。prompt:提示信息,即向模型提供的输入文本,模型会根据该提示生成相应的内容。可选参数:还可以包含其他参数来控制生成的行为,如 `temperature`(控制生成文本的随机性,值越大越随机)、`max_tokens`(限制生成文本的最大令牌数)等。示例请求体{"model": "llama2","prompt": "写一首关于春天的诗","temperature": 0.7,"max_tokens": 200}
import requestsres = requests.post(url="http://localhost:11434/api/generate",json={"model": "deepseek-r1:1.5b","prompt": "写一首关于春天的诗","stream": False}
)data_dict = res.json()
print(data_dict)

示例:/api/chat
用于模拟对话交互,它会维护对话的上下文,使得模型能够根据之前的对话内容生成合适的回复,实现更自然、连贯的对话效果。请求参数model:要使用的模型名称。messages:一个包含对话消息的列表,每个消息对象包含 role(角色,如 user 表示用户消息,assistant 表示模型回复)和 content(消息内容)。同样可以包含可选参数来控制生成行为。示例请求体{"model": "deepseek-r1:1.5b","messages": [{"role": "user","content": "你好"}],"temperature": 0.8}
import requestsres = requests.post(url="http://localhost:11434/api/chat",json={"model": "deepseek-r1:1.5b","messages": [{"role": "user", "content": "你好"}],"stream": False}
)
data_dict = res.json()
print(data_dict)

可以将对话保存下来,生成对话:
import requestsmessage_list = []while True:text = input("请输入:")user_dict = {"role": "user", "content": text}message_list.append(user_dict)res = requests.post(url="http://localhost:11434/api/chat",json={"model": "deepseek-r1:1.5b","messages": message_list,"stream": False})data_dict = res.json()res_msg_dict = data_dict['message']print(res_msg_dict)message_list.append(res_msg_dict)

2.3 网页交互
搭建一个网站,在内部进行访问使用。
第1步:电脑安装nodejs
https://nodejs.org/zh-cn/download

第2步:下载网站源码
https://github.com/ollama-webui/ollama-webui-lite

下载并解压至任意目录。例如:F:\ollama-webui-lite-main 【不要有中文路径】

第3步:安装依赖并启动网站
打开CMD终端进入项目目录并执行相关命令。
C:\Users\Administrator>F:
F:\>cd F:\ollama-webui-lite-main
F:\ollama-webui-lite-main>
F:\ollama-webui-lite-main>npm ci
F:\ollama-webui-lite-main>npm run dev -- --port=9001

访问网站:http://localhost:9001/

3.微信收发信息
wxauto 是一个基于UIAutomation开发的用于实现微信自动化得库。
消息发送:支持发送文字、图片、文件、@群好友、引用消息等功能
聊天记录:可获取好友的聊天记录内容
监听消息:实时获取指定监听好友(群)的新消息
所用开发环境:Python 3.12.6 + PC微信 3.9.12(目前最新)

实现原理:在电脑安装PC微信,基于wxauto自动控制微信界面来实现收发消息等功能。

安装wxauto
pip install wxauto==3.9.11.17.5
发消息
from wxauto import WeChat
wx = WeChat()
wx.SendMsg(msg="你好呀", who="xxx_888") # 指定人/群发消息# wx.SendMsg(msg="你好呀", who="群名", at=["张三","张开"]) # 群消息+@指定人
# wx.SendMsg(filepath="F:\xxx.png", who="用户或群")
# wx.SendMsg(filepath=["文件A","文件B","F:\xxx.png"], who="用户或群")
收消息(所有)
from wxauto import WeChatwx = WeChat()while True:# 等待接受收到的最新消息# {"用户昵称A":[消息对象1,消息对象2,消息对象3], "用户昵称B":[消息对象1,消息对象2,消息对象3], }msg_dict = wx.GetNextNewMessage()for username, msg_list in msg_dict.items():print("昵称:", username)# [消息对象1, 消息对象2, 消息对象3]for msg in msg_list:print("\t消息", msg.type, msg.content)
收消息(指定用户)
from wxauto import WeChat
wx = WeChat()wx.AddListenChat(who="运营")
wx.AddListenChat(who="xxx_888")while True:# { "用户A聊天窗口":[消息对象1,消息对象2,消息对象3], "用户B聊天窗口":[消息对象1,消息对象2,消息对象3]}listen_dict = wx.GetListenMessage()for chat_win,message_list in listen_dict.items():# 用户或群名chat_user = chat_win.who# [消息对象1,消息对象2,消息对象3]for msg in message_list:if msg.type != "friend":continueprint(chat_user, msg.content)# 回复消息# chat_win.SendMsg("回复的内容")time.sleep(5)
👏欢迎贡献代码和改进项目!
相关文章:
AI客服-接入deepseek大模型到微信(本地部署deepseek集成微信自动收发消息)
1.本地部署 1.1 ollama Ollama软件通过其高度优化的推理引擎和先进的内存管理机制,显著提升了大型语言模型在本地设备上的运行效率。其核心采用了量化技术(Quantization)以降低模型的计算复杂度和存储需求,同时结合张量并行计算&…...
Host文件没有配置ip解析,导致请求接口速度慢
Linux访问第三方接口速度慢 现象 在测试环境,Linux的服务器中,要访问第三方接口;速度有时快,有时慢。 有时候第一次访问比较慢,第二次访问比较快。第三方人员,排查之后,第三方接口没有问题&am…...
excel导入Mysql中时间格式异常
问题描述: 当使用xls/xlsx/csv导入mysql中,如果列是时间类型比如excel表中显示2024/02/20 09:18:00,导入后时间可能就会变成1900-01-01 09:18:00这样。 问题原因: 这是由于excel表中和数据库中的时间类型不匹配导致。 问题解决…...
vue 判断一个属性值,如果是null或者空字符串或者是空格没有值的情况下,赋值为--
在 Vue 中,可以通过多种方式来判断一个属性值是否为 null、空字符串或者仅包含空格,如果满足这些条件则将其赋值为 --。下面分别介绍在模板和计算属性、方法中实现的具体做法。 1. 在模板中直接判断 如果只需要在模板中对属性值进行显示处理,…...
JavaWeb-Tomcat服务器
文章目录 Web服务器存在的意义关于Web服务器软件Tomcat服务器简介安装Tomcat服务器Tomcat服务器源文件解析配置Tomcat的环境变量启动Tomcat服务器一个最简单的webapp(不涉及Java) Web服务器存在的意义 我们之前介绍过Web服务器进行通信的原理, 但是我们当时忘记了一点, 服务器…...
vue语法---样式操作-行内样式
文章目录 直接写死的行内样式v-bind绑定对象(静态样式)对象数组 直接写死的行内样式 <template><div v-bind:style"{color:red}">睡觉</div> </template><script>export default{data() {return {}},methods:{}, mounted(){},} </…...
封装一个echarts的组件
父组件页面 <yyjlchartv-if"showyyjl"chartId"yyjllLine":sourceData"sourceDatayyjl":options"optionsyyjl"></yyjlchart>components: {LineEcharts,yyjlchart: () > import("../yyjlchart"),},data() {re…...
计算机网络安全之一:网络安全概述
1.1 网络安全的内涵 随着计算机和网络技术的迅猛发展和广泛普及,越来越多的企业将经营的各种业务建立在Internet/Intranet环境中。于是,支持E-mail、文件共享、即时消息传送的消息和协作服务器成为当今商业社会中的极重要的IT基础设施。然而࿰…...
Linux 性能调优简单指南
一、性能调优概述 Linux 性能调优是系统运维的核心任务之一,目的是通过资源分配、参数优化和瓶颈消除,提升系统运行效率和稳定性。调优需遵循以下原则: 基于数据驱动:使用监控工具精准定位瓶颈分层逐级分析:从硬件到应用的逐层排查变更可回溯:单变量调整并记录结果场景适…...
第十一章: vue2-3 生命周期
创建 挂载 更新 销毁 四个阶段 > 生命周期函数 生命周期钩子 created mounted 创建vue2 的脚手架: vue create vue2_test v-show"isShow" v-if "isShow" 这里的isShow 表示一个函数 let isShow "true" <tem…...
【算法基础】--前缀和
前缀和 一、一维前缀和示例模板[寻找数组的中心下标 ](https://leetcode.cn/problems/tvdfij/description/)除自身以外的数组乘积和可被k整除的子数组 一、一维前缀和 前缀和就是快速求出数组某一个连续区间内所有元素的和。 示例模板 已知一个数组arr,求前缀和 …...
输入搜索、分组展示选项、下拉选取,el-select 实现:即输入关键字检索,返回分组选项,选取跳转到相应内容页 —— VUE 项目-全局模糊检索
后端数据代码写于下一篇:输入搜索、分组展示选项、下拉选取,全局跳转页,el-select 实现 —— 后端数据处理代码,抛砖引玉展思路 【效果图】:分组展示选项 【去界面操作感受一下】—> 便捷简洁的企业官网 【录制效…...
Web入侵实战分析-常见web攻击类应急处置实验2
场景说明 某天运维人员,发现运维的公司站点被黑页,首页标题被篡改,你获得的信息如下: 操作系统:windows server 2008 R2业务:公司官网网站架构:通过phpstudy运行apache mysqlphp开放端口&…...
DeepSeek:AI商业化的新引擎与未来蓝图
摘要 在人工智能迅猛发展的浪潮中,DeepSeek以其卓越的技术实力和高超的商业化能力崭露头角。作为一款现象级AI产品,它不仅在算法性能上位居行业前列,还通过灵活的定制解决方案渗透到金融、医疗、零售等多个领域。DeepSeek以创新的商业模式和场…...
从零开始学习PX4源码9(部署px4源码到gitee)
目录 文章目录 目录摘要1.gitee上创建仓库1.1 gitee上创建仓库PX4代码仓库1.2 gitee上创建子仓库2.固件在gitee部署过程2.1下载固件到本地2.2切换本地分支2.3修改.gitmodules内容2.4同步子模块仓库地址2.5同步子模块仓库地址更新(下载)子模块3.一级子模块和二级子模块的映射关…...
wps中zotero插件消失,解决每次都需要重新开问题
参考 查看zotero目录 D:\zotero\integration\word-for-windows 加载项点击 dotm即可 长期解决 把dom 复制到 C:\Users\89735\AppData\Roaming\kingsoft\office6\templates\wps\zh_CN还是每次都需要重新开的话 重新加载一下...
【Python 语法】collections 模块的字典类 defaultdict
默认字典 (defaultdict) 的语法defaultdict 的常见应用场景1. 计数2. 分组3. 嵌套字典 defaultdict 是 Python 中 collections 模块提供的一个字典类,它和普通字典( dict)的主要区别在于 提供了一个默认值,可以避免在访问字典中…...
《论系统需求分析方法》写作心得 - 系统分析师
系统需求分析方法论述 一、项目概述及本人职责 本人曾参与一项企业级客户关系管理系统(CRM)的开发项目,担任系统分析师的角色。该项目旨在为企业提供一个集客户信息管理、销售过程跟踪、客户服务支持于一体的综合管理平台,以提升…...
Jupyter里面的manim编程学习
1.Jupyterlab的使用 因为我之前一直都是使用的vscode进行manim编程的,但是今天看的这个教程使用的是Jupyter,我也很是好奇这个manim在Jupyter这样的交互式下面会生成怎么样的效果,所以今天尝试了jupyter,并且对于两个进行比较和说…...
Python之装饰器二 带参数的装饰器
前言一、带参数的装饰器二、在装饰器里面传入参数总结 前言 暂无 一、带参数的装饰器 我们知道,不带参数的装饰其实就是在函数的头上添加装饰器时放一个名称,这种写法就默认了装饰器函数调的是被装饰函数自己,换句话说就是,大家…...
Python并发编程多进程与多线程选择
Python并发编程:多进程与多线程的选择 在Python开发中,处理高并发任务是提升程序性能的关键。多进程与多线程是两种常见的并发编程方式,但它们的适用场景和性能表现截然不同。如何根据任务特性选择合适的方式?本文将从资源占用、…...
H5唤起高德地图避坑指南:从协议失效到参数错误,我踩过的雷都帮你填平了
H5唤起高德地图避坑指南:从协议失效到参数错误,我踩过的雷都帮你填平了 在移动端H5开发中,唤起高德地图实现导航功能是常见需求。看似简单的功能背后,却隐藏着无数开发者踩过的坑。不同手机型号、系统版本、高德地图App版本之间的…...
单片机软件架构实战:从新手到高手的9种设计模式
1. 单片机软件架构入门:从main函数到模块化设计 刚接触单片机编程时,我们往往从一个简单的main函数开始。记得我第一次用51单片机点亮LED时,代码简单到只有十几行: #include <reg51.h> void main() {while(1) {P1 0x00; …...
让你的Arduino项目动起来!0.96寸OLED滚动显示天气预报/歌词的保姆级教程
用Arduino打造智能滚动显示屏:天气预报与歌词动态展示实战指南 你是否厌倦了静态显示的Arduino项目?想让你的创意作品"活"起来?本文将带你从零开始,利用0.96寸OLED屏幕的滚动功能,打造一个既能显示实时天气又…...
上市公司-绿色新闻、环保新闻数据库(2007-2023年)
01、数据介绍上市公司绿色新闻报道的内容确实涵盖了多个关键方面,旨在向投资者、消费者、监管机构及广大公众传达企业在环境保护、可持续发展和社会责任方面的实践与成效。上市公司绿色新闻报道不仅是企业向外界传递其绿色发展成果和承诺的窗口,也是促进…...
java面向对象的学习主线
java基础的语法,是为了执行一段程序。 这篇文章的主体是 有一个逻辑思路,解决javase是什么知识体系, 为什么要学这套知识体系。 我们想一个概念。 假如,我们要执行一段程序。 我们总不能 光执行一个类里面的psvm方法 于是我们就创…...
深度神经网络贪婪逐层预训练原理与实践
1. 贪婪逐层预训练的本质理解在深度神经网络训练中,贪婪逐层预训练(Greedy Layer-Wise Pretraining)是一种分阶段构建网络参数的策略。我第一次接触这个方法是在2014年处理图像分类任务时,当时面对深层网络难以收敛的问题…...
Go语言的context.WithValue设计
Go语言中的context.WithValue设计解析 在Go语言的并发编程中,context包是管理请求生命周期和跨协程数据传递的核心工具之一。其中,context.WithValue方法提供了一种轻量级的方式,用于在请求链路中传递键值对数据。这种设计既避免了全局变量的…...
fvcore性能优化:如何通过缓存和并行化提升计算速度
fvcore性能优化:如何通过缓存和并行化提升计算速度 【免费下载链接】fvcore Collection of common code thats shared among different research projects in FAIR computer vision team. 项目地址: https://gitcode.com/gh_mirrors/fv/fvcore fvcore是FAIR计…...
如何快速解决Blender与3D打印机兼容问题:完整Blender3mfFormat使用指南
如何快速解决Blender与3D打印机兼容问题:完整Blender3mfFormat使用指南 【免费下载链接】Blender3mfFormat Blender add-on to import/export 3MF files 项目地址: https://gitcode.com/gh_mirrors/bl/Blender3mfFormat 您是否曾在Blender中精心设计了一个3D…...

