当前位置: 首页 > news >正文

【笔记】用大预言模型构建专家系统

最近闲庭漫步,赏一赏各个AI大语言模型芳容。也趁着时间,把倪海夏一家的天纪和人纪视频看完了,感谢倪先生和现在网络的知识分享,受益匪浅。但是发现看完,很多不错的知识都不能记录在脑子里,那用的时候岂不是还要再看一遍视频把那个要点找出来听一遍?现在都AI时代了,我们就AI一下:把视频里的语音转成文本,用大语言模型校正,再生成知识库让大预言模型检索并回答我们提出的问题。

首先,需要的当然是硬件,拿出这个前东家送的游戏本,RTX3090一枚;顺带一提的是,最新的mac笔记本m4很猛啊,新工作机48GB内存已经可以跑ollama上量化了的72B了,如果能有个超级mac m4 max,直接内存128GB可以跑很大的模型了,网上有人直接使用开源的exo+8台mac凑够496GB内存可以直接跑deepseek-r1 671B。第二个需要能科学上网访问hugging face。
然后是准备当下AI三件套Ollama + Open-WebUI + Jupyter。windows环境当然是要一个python,open-webui要求不能python-3.13,那就python-3.12呗。装好pytorch,jupyter,open-webui,ollama,然后我们就要开始配置这些环境了。

为了把视频语音转,我们要祭出whisper,一般whisperx用就好了,不过windows上有点问题,也懒得深究了,直接换到本源走openai的whisper最新large-v3模型。jupyter上设计一个pipeline,让ffmpeg将所有视频只保留音频mp3,再按huggingface上whisper主页的案例引用直接对每个mp3生成识别后的文本…

这个文本有很多错误,也没有啥标点…这个就需要动用大预言模型了;一开始使用了ollama,因为3090内存有限,扣吧吧用个小模型,让它校正有时候它还不太听话…于是想想这个文本又不是什么私密的东西,直接用线上正统超级大语言模型好了…先去arena试验了一下,发现deepseek-r1对这种任务线上超大模型都不怎么听话,看来deepseek训练方法贡献巨大,但是自己还是在模型积累的初级阶段…连grok-3和claude 3.7都比它好用。但是老是科学着也不好,再尝试了下qwen2.5-max,效果不错!任务都丢给它了…配置好合适的prompt,预填一些先验知识,它能很好得给出简单修正,以及断句打标点…

有了这些视频的音频文本,后面就是建立一个简单RAG系统了…这个要用到open-webui和ollama,当然我是想自用的,所以用ollama用gpu运行小模型。open-webui自带了dev用chroma vector db,个人用就够了,先ollama下载bge-m3的embedding模型,再下载一个为问答使用的模型比如qwen2.5,open-webui里配置好知识库的embedding模型,并且在workspace里创建知识库,把生成好的文本上传,等它embedding结束。之后就是创建专家系统模型,套一个base模型qwen2.5,再选上知识库内容,然后就开始play~

之后就是继续各种添加知识库,并且写一套langchain让它更丝滑得运行,提高对知识库掌握的准确度。后面还可以搭建各种其他的知识库了~enjoy…

(以下图片仅供展示系统有知识库初期的demo,生病了还请求医,慎重看待AI生成内容)
请添加图片描述

相关文章:

【笔记】用大预言模型构建专家系统

最近闲庭漫步,赏一赏各个AI大语言模型芳容。也趁着时间,把倪海夏一家的天纪和人纪视频看完了,感谢倪先生和现在网络的知识分享,受益匪浅。但是发现看完,很多不错的知识都不能记录在脑子里,那用的时候岂不是…...

Android SystemUI深度定制实战:下拉状态栏集成响铃功能开关全解析

一、功能实现全景视图 目标场景:在Android 14系统级ROM定制中,为SystemUI下拉状态栏的QuickQSPanel区域新增响铃模式切换开关,实现静音/响铃快速切换功能。该功能需通过三层关键改造实现: 二、核心实现三部曲 1. 配置注入&…...

【Python】基础语法三

> 作者:დ旧言~ > 座右铭:松树千年终是朽,槿花一日自为荣。 > 目标:了解Python的函数、列表和数组。 > 毒鸡汤:有些事情,总是不明白,所以我不会坚持。早安! > 专栏选自&#xff…...

[Computer Vision]实验六:视差估计

目录 一、实验内容 二、实验过程 2.1.1 test.py文件 2.1.2 test.py文件结果与分析 2.2.1 文件代码 2.2.2 结果与分析 一、实验内容 给定左右相机图片,估算图片的视差/深度;体现极线校正(例如打印前后极线对)、同名点匹配…...

【 开发知识点 一 】 随机数生成器 /dev/urandom 和 /dev/random

文章目录 一、随机数生成器 是什么 ?二、为什么 需要 随机数生成器 ?三、随机数生成器 基本原理四、随机数生成器 三个输出接口五、随机生成器 应用1、简单应用2、项目应用一、随机数生成器 是什么 ? /dev/random 和 /dev/urandom 是 Linux 上的字符设备文件,它们是随机数…...

LabVIEW虚拟弗兰克赫兹实验仪

随着信息技术的飞速发展,虚拟仿真技术已经成为教学和研究中不可或缺的工具。开发了一种基于LabVIEW平台开发的虚拟弗兰克赫兹实验仪,该系统不仅能模拟实验操作,还能实时绘制数据图形,极大地丰富了物理实验的教学内容和方式。 ​ …...

LLC谐振变换器恒压恒流双竞争闭环simulink仿真

1.模型简介 本仿真模型基于MATLAB/Simulink(版本MATLAB 2017Ra)软件。建议采用matlab2017 Ra及以上版本打开。(若需要其他版本可联系代为转换)针对全桥LLC拓扑,利用Matlab软件搭建模型,分别对轻载&#xf…...

TVbox蜂蜜影视:智能电视观影新选择,简洁界面与强大功能兼具

蜂蜜影视是一款基于猫影视开源项目 CatVodTVJarLoader 开发的智能电视软件,专为追求简洁与高效观影体验的用户设计。该软件从零开始编写,界面清爽,操作流畅,特别适合在智能电视上使用。其最大的亮点在于能够自动跳过失效的播放地址…...

Python 绘制迷宫游戏,自带最优解路线

1、需要安装pygame 2、上下左右移动,空格实现物体所在位置到终点的路线,会有虚线绘制。 import pygame import random import math# 迷宫单元格类 class Cell:def __init__(self, x, y):self.x xself.y yself.walls {top: True, right: True, botto…...

vue3学习-1(基础)

vue3学习-1(基础) 1. 开始API 风格选项式 API (Options API)组合式 API (Composition API) 快速创建个应用 2.基础1. 创建个应用2.模板语法3.响应式基础reactive() 的局限性[](https://cn.vuejs.org/guide/essentials/reactivity-fundamentals.html#limi…...

deepseek使用记录18——文化基因之文化融合

文明长河中的生命浪花 在洛阳白马寺的银杏树下,年轻母亲指着"农禅并重"碑刻给孩子讲述祖辈耕作的故事;在哔哩哔哩的直播间里,00后女孩穿着汉服跳起街舞,弹幕飘过"这才是文化缝合怪"。当文明交融的宏大叙事照…...

Hadoop简介

1. Hadoop简介 官网:http://hadoop.apache.org 1.1 Hadoop架构 Hadoop由三个模块组成:分布式存储HDFS、分布式计算MapReduce、资源调度引擎YARN 1.2 Hadoop历史 Hadoop作者Doug Cutting Apache Lucene是一个文本搜索系统库 Apache Nutch作为前者的一部…...

密码学(哈希函数)

4.1 Hash函数与数据完整性 数据完整性: 检测传输消息(加密或未加密)的修改。 密码学Hash函数: 构建某些数据的简短“指纹”;如果数据被篡改,则该指纹(以高概率)不再有效。Hash函数…...

谈谈单例模式中通过Htools包的SpringUtil.getBean获取Bean的好处

目录 优势 解决依赖注入失效问题: 典型应用场景: 好处 1. 实例化时序问题 2. 延迟获取解决空指针 3. 设计模式与 Spring 的权衡 代码对比:错误 vs 正确 错误示例(空指针): 正确实现(延…...

本地部署大语言模型-DeepSeek

DeepSeek 是国内顶尖 AI 团队「深度求索」开发的多模态大模型,具备数学推理、代码生成等深度能力,堪称"AI界的六边形战士"。 Hostease AMD 9950X/96G/3.84T NVMe/1G/5IP/RTX4090 GPU服务器提供多种计费模式。 DeepSeek-R1-32B配置 配置项 规…...

adb的安装

1、概念 (1)adb(android debug bridge)安卓调试桥,用于完成电脑和手机之间的通信控制。 (2)xcode来完成对于ios设备的操控,前提是有个mac电脑。 2、adb的安装 (1&…...

Python 如何实现 Markdown 记账记录转 Excel 存储

文章精选推荐 1 JetBrains Ai assistant 编程工具让你的工作效率翻倍 2 Extra Icons:JetBrains IDE的图标增强神器 3 IDEA插件推荐-SequenceDiagram,自动生成时序图 4 BashSupport Pro 这个ides插件主要是用来干嘛的 ? 5 IDEA必装的插件&…...

随机播放音乐 伪随机

import java.util.*;/*** https://cloud.tencent.com.cn/developer/news/1045747* 伪随机播放音乐*/ public class MusicPlayer {private List<String> allSongs; // 所有歌曲列表private List<String> playedSongs; // 已经播放过的歌曲列表private Map<String…...

latex 环境配置

编译器可选 miktex和 tex live ① miktex 下载地址 Portable 版本用的也是 Installer版的安装程序 basic-miktex-24.1-x64.exe&#xff0c;但是需要修改文件名为 miktex-portable.exe ├──texmfs │ ├─config │ ├─data │ └─install │ └─miktex/…...

fortify安全扫描Access Control: Database问题解决

概述 Access Control: Database说白了就是权限控制。在访问数据库(sql和nosql)需要加入当前用户的权限控制。不然会被fortify扫描出来&#xff0c;认为客户端可能不挟持和假冒&#xff0c;从而导致数据被泄露。 但是这个并不是任何时候都需要的&#xff0c;有的接口本来…...

小红书内容采集终极指南:一键下载无水印图文视频的完整教程

小红书内容采集终极指南&#xff1a;一键下载无水印图文视频的完整教程 【免费下载链接】XHS-Downloader 小红书&#xff08;XiaoHongShu、RedNote&#xff09;链接提取/作品采集工具&#xff1a;提取账号发布、收藏、点赞、专辑作品链接&#xff1b;提取搜索结果作品、用户链接…...

Godot原生强化学习集成:零Python实现AI训练与部署

1. 这不是又一个“Hello World”式教程&#xff1a;为什么GodotRL的组合值得你花10分钟认真看我第一次在Godot Asset Library里点开那个标着“Reinforcement Learning Agent”的插件时&#xff0c;心里是带着怀疑的——毕竟过去三年里&#xff0c;我试过七种不同方式把强化学习…...

服务器CPU架构对决:Chiplet与Monolithic技术解析与选型指南

1. 市场格局的悄然变迁&#xff1a;从“牙膏厂”到“撕裂者”的冲击如果你最近几年一直在关注数据中心和服务器市场&#xff0c;一个非常明显的趋势是&#xff0c;曾经由英特尔至强处理器几乎垄断的“铁王座”&#xff0c;正在被AMD的EPYC&#xff08;霄龙&#xff09;处理器一…...

从0到1:如何用MNBVC超大规模中文语料库训练你的中文大模型

从0到1&#xff1a;如何用MNBVC超大规模中文语料库训练你的中文大模型 【免费下载链接】MNBVC MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化&#xff0c;也包括各个小众文化甚至火星文的数据…...

跨平台项目实战:完整UI组件库与状态管理方案

一、项目实战概述随着移动端、Web端、桌面端多终端统一开发的需求日益普及&#xff0c;跨平台开发已成为企业级项目的主流选型。传统分端开发模式存在代码冗余、迭代效率低、UI风格不统一、状态逻辑复用困难等痛点。本项目以一套代码多端适配、UI标准化、状态统一管控为核心目标…...

Brushes项目部署教程:从源码编译到App Store发布完整指南 [特殊字符]

Brushes项目部署教程&#xff1a;从源码编译到App Store发布完整指南 &#x1f3a8; 【免费下载链接】Brushes Painting app for the iPhone and iPad. 项目地址: https://gitcode.com/gh_mirrors/br/Brushes Brushes是一款专为iPhone和iPad设计的开源绘画应用&#xff…...

CANN/pypto填充操作API

pypto.pad 【免费下载链接】pypto PyPTO&#xff08;发音: pai p-t-o&#xff09;&#xff1a;Parallel Tensor/Tile Operation编程范式。 项目地址: https://gitcode.com/cann/pypto 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atla…...

CANN/asc-devkit HCCL算法分析器指南

Algorithm Analyzer User Guide 【免费下载链接】asc-devkit 本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言&#xff0c;原生支持C和C标准规范&#xff0c;主要由类库和语言扩展层构成&#xff0c;提供多层级API&#xff0c;满足多维场景算子开发诉求。 项目地址: …...

S7-1200通讯选型指南:RS485、Profinet还是开放式TCP?看完这篇不再纠结

S7-1200通讯选型指南&#xff1a;RS485、Profinet还是开放式TCP&#xff1f;看完这篇不再纠结 在工业自动化项目中&#xff0c;PLC通讯方案的选择往往让工程师们陷入两难——既要考虑当下设备的兼容性&#xff0c;又要为未来升级预留空间。作为西门子S7-1200系列PLC的用户&…...

uView 2.0自定义主题开发:颜色配置与样式覆盖的详细步骤

uView 2.0自定义主题开发&#xff1a;颜色配置与样式覆盖的详细步骤 【免费下载链接】uView2.0 uView UI&#xff0c;是全面兼容nvue的uni-app生态框架&#xff0c;全面的组件和便捷的工具会让您信手拈来&#xff0c;如鱼得水 项目地址: https://gitcode.com/gh_mirrors/uv/u…...