当前位置：首页 > news >正文

240330-大模型资源-使用教程-部署方式-部分笔记

news 2026/2/10 17:00:54

A. 大模型资源

Models - Hugging Face
HF-Mirror - Huggingface 镜像站
模型库首页 · 魔搭社区

在这里插入图片描述

B. 使用教程

HuggingFace

HuggingFace 10分钟快速入门（一），利用Transformers，Pipeline探索AI。_哔哩哔哩_bilibili
HuggingFace快速入门（二），利用AI模型快速搭建APP。_哔哩哔哩_bilibili
HuggingFace 快速入门（三），HF的Agent快速搭建AI Agent_哔哩哔哩_bilibili
HuggingFace 快速入门（四），玩转HF上的模型_哔哩哔哩_bilibili

HF-Mirror

如何快速下载huggingface模型——全方法总结 - 知乎

huggingface-cli download --resume-download mistralai/Mistral-7B-Instruct-v0.2 --local-dir Mistral-7B-Instruct-v0.2 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download google-t5/t5-small --local-dir t5-small --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/whisper-large-v3 --local-dir whisper-large-v3 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/whisper-large-v3 --local-dir whisper-large-v3 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/clip-vit-base-patch32 --local-dir clip-vit-base-patch32 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/clip-vit-large-patch14 --local-dir clip-vit-large-patch14 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download keremberke/yolov8m-table-extraction --local-dir yolov8m-table-extraction --local-dir-use-symlinks Falsehuggingface-cli download --resume-download merve/yolov9 --local-dir yolov9 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download stabilityai/stable-code-instruct-3b --local-dir stable-code-instruct-3b --local-dir-use-symlinks Falsehuggingface-cli download --resume-download stabilityai/stable-code-3b --local-dir stable-code-3b--local-dir-use-symlinks Falsehuggingface-cli download --resume-download defog/sqlcoder-7b-2 --local-dir sqlcoder-7b-2 --local-dir-use-symlinks False

魔搭社区

ModelScope 魔搭社区初探 - 知乎
魔搭v1.3版本 Release Note (20230216) · 文档中心

from modelscope.hub.snapshot_download import snapshot_downloadmodel_dir = snapshot_download('iic/speech_fsmn_vad_zh-cn-16k-common-pytorch', cache_dir='speech_fsmn_vad_zh-cn-16k-common-pytorch')model_dir = snapshot_download('qwen/Qwen1.5-MoE-A2.7B', cache_dir='Qwen1.5-MoE-A2.7B')model_dir = snapshot_download('iic/speech_eres2net_large_sv_zh-cn_cnceleb_16k', cache_dir='speech_eres2net_large_sv_zh-cn_cnceleb_16k')model_dir = snapshot_download('iic/cv_ddsar_face-detection_iclr23-damofd', cache_dir='cv_ddsar_face-detection_iclr23-damofd')model_dir = snapshot_download('iic/Whisper-large-v3', cache_dir='Whisper-large-v3-iic')model_dir = snapshot_download('iic/nlp_bart_text-error-correction_chinese', cache_dir='nlp_bart_text-error-correction_chinese')model_dir = snapshot_download('iic/nlp_bart_text-error-correction_chinese-law', cache_dir='nlp_bart_text-error-correction_chinese-law')model_dir = snapshot_download('iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch', cache_dir='speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch')model_dir = snapshot_download('iic/cv_dla34_table-structure-recognition_cycle-centernet', cache_dir='cv_dla34_table-structure-recognition_cycle-centernet')model_dir = snapshot_download('iic/cv_resnet-transformer_table-structure-recognition_lore', cache_dir='cv_resnet-transformer_table-structure-recognition_lore') model_dir = snapshot_download('iic/cv_convnextTiny_ocr-recognition-general_damo', cache_dir='cv_convnextTiny_ocr-recognition-general_damo')model_dir = snapshot_download('iic/cv_resnet18_ocr-detection-db-line-level_damo', cache_dir='cv_resnet18_ocr-detection-db-line-level_damo')model_dir = snapshot_download('iic/cv_convnextTiny_ocr-recognition-document_damo', cache_dir='cv_convnextTiny_ocr-recognition-document_damo')model_dir = snapshot_download('iic/cv_resnet18_ocr-detection-line-level_damo', cache_dir='cv_resnet18_ocr-detection-line-level_damo')

C. 部署方式

一键部署Google开源大模型Gemma，性能远超Mistral、LLama2 | 本地大模型部署，ollama助您轻松完成！_哔哩哔哩_bilibili
Windows系统本机运行Gemma最简步骤_哔哩哔哩_bilibili
ollama如何把gemma模型部署到D盘_哔哩哔哩_bilibili
Ollama如何把Gemma模型部署到D盘_方法二创建目录链接释放C盘空间_哔哩哔哩_bilibili
Ollama如何使用现有的GGUF文件_哔哩哔哩_bilibili
Ollama导入GGUF文件_哔哩哔哩_bilibili
Ollama wsarecv: An existing connection was forcibly closed by the remote host._哔哩哔哩_bilibili
OLLAMA_KEEP_ALIVE潜在问题分析_哔哩哔哩_bilibili
Ollama 运行 GGUF 模型
LangChain 与 ollama 携手python 环境演示 Hello World 构建属于自己的大模型应用
人工智能大模型系列（七）使用 Ollama 和 CodeGPT 在 VSCode 中创建您自己的自定义 Copilot

D. 格式转换

开源大模型GGUF量化(llama.cpp)与本地部署运行(ollama)教程 - 知乎
揭开gguf神秘面纱——大模型CPU部署系列02 - 知乎

E. 代码生成

LLM 系列 | 21 : Code Llama实战(上篇) : 模型简介与试用
LLM系列 | 22 : Code Llama实战(下篇)：本地部署、量化及GPT-4对比
Stability AI开源3B代码生成模型：可补全，还能Debug

F. YOLOV9

WongKinYiu/yolov9
YOLO v9训练自己数据集_yolov9训练自己的数据集-CSDN博客
手把手教你在自己的数据集上训练YOLOv9！ - 知乎

G. SAM

facebookresearch/segment-anything

H. Qwen1.5-MoE

Github官方GitHub - QwenLM/Qwen1.5: Qwen1.5 is the improved version of Qwen, the large language model series developed by Qwen team, Alibaba Cloud.
GPTQ版本运行失败Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能_哔哩哔哩_bilibili
对应Chat版本的代码Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能 - 哔哩哔哩
微信资料开源MOE再添一员：通义团队Qwen1.5 MOE A2.7B大模型
如何选择模型Qwen1.5系列6个模型如何选择？ AWQ还是GPTQ？#小工蚁_哔哩哔哩_bilibili
不同型号显卡在同一台机器上通过vllm加速推理双4090部署qwen72b大模型每秒150tokens_哔哩哔哩_bilibili
Qwen-Agent及浏览器插件GitHub - QwenLM/Qwen-Agent: Agent framework and applications built upon Qwen1.5, featuring Function Calling, Code Interpreter, RAG, and Chrome extension.

240330-大模型资源-使用教程-部署方式-部分笔记

A. 大模型资源 Models - Hugging FaceHF-Mirror - Huggingface 镜像站模型库首页魔搭社区 B. 使用教程 HuggingFace HuggingFace 10分钟快速入门（一），利用Transformers，Pipeline探索AI。_哔哩哔哩_bilibiliHuggingFace快速入…...

编程日记 2024/3/31 23:16:38

uni-app 富文本编辑器

<template><view class"container"><view>标题：<u-input placeholder"请输入标题"></u-input></view><view class"page-body"><view classwrapper><view classtoolbar tap"…...

编程日记 2024/3/31 23:12:34

3D汽车模型线上三维互动展示提供视觉盛宴

VR全景虚拟看车软件正在引领汽车展览行业迈向一个全新的时代，它不仅颠覆了传统展览的局限，还为参展者提供了前所未有的高效、便捷和互动体验。借助于尖端的vr虚拟现实技术、逼真的web3d开发、先进的云计算能力以及强大的大数据处理，这一在线展…...

编程日记 2024/3/31 23:06:29

如何在Flutter中进行网络请求？

Hello！大家好，我是咕噜铁蛋，你们的好朋友！今天，我想和大家分享一下在Flutter中如何进行网络请求。Flutter作为一个跨平台的开发框架，网络请求是其实现数据交互的重要一环。下面，我将详细介绍几种…...

编程日记 2024/3/31 23:05:27

node：ReferenceError: XMLHttpRequest is not defined

node：ReferenceError: XMLHttpRequest is not defined 1 前言 node执行如下代码： new XMLHttpRequest()报错提示：ReferenceError: XMLHttpRequest is not defined 2 解决 2.1 可能原因是没有安装xmlhttprequest npm install xmlhttpreq…...

编程日记 2024/3/31 23:03:24

PHP定时任务框架taskPHP3.0的学习记录1（TaskPHP、执行任务类的实操代码实例）

TaskPHP是一个基于PHP的定时任务框架，它提供了一个简单、灵活且易于使用的解决方案，用于在PHP环境中执行定时任务。下面是对TaskPHP框架的简要介绍： 简单易用：TaskPHP的设计目标是让定时任务的创建和管理变得简单。通过简单的配置…...

编程日记 2024/3/31 22:56:15

图腾柱PFC：HP1010为您的电动两轮车之旅提供绿色，高效，安全的动力

电动两轮车不仅为当今生活提供了便利，更是一种健康和绿色的出行方式。想象一下，在经过一整晚的充分休息，骑上爱车，满血复活的准备开始新的一天。您会愿意带着如何给心爱的两轮车充电的担心开始这一天吗？ 随着越来越…...

编程日记 2024/3/31 22:54:13

动态规划-----背包类问题（0-1背包与完全背包）详解

目录什么是背包问题？ 动态规划问题的一般解决办法： 0-1背包问题： 0 - 1背包类问题分割等和子集： 完全背包问题： 完全背包类问题零钱兑换II: 什么是背包问题？ 背包问题(Knapsack problem)是一种…...

编程日记 2024/3/31 22:53:11

通过 Docker 搭建 BookStack

文章目录环境说明1、官方网站2、通过 Docker 部署总结环境说明操作系统版本：CentOS Linux release 7.9.2009 (Core) Docker 版本：Docker Engine - Community 24.0.2 BookStack 版本：23.02.3 MySQL 版本：8.0.32 1、官方网站 G…...

编程日记 2024/3/31 22:49:08

通俗易懂：什么是Java虚拟机（JVM）？它的主要作用是什么？

Java虚拟机（Java Virtual Machine, JVM）是一种软件实现的抽象计算机，它负责执行Java字节码（Bytecode）。Java程序并不是直接在物理计算机上运行，而是先由Java编译器将源代码编译成与平台无关的字节码&#x…...

编程日记 2024/3/31 22:47:05

[k8s] kubectl执行失败后等待一段时间再重试 (Shell实现)

使用Shell脚本实现功能： kubectl执行失败后，等待30秒后再重试，一共重试3次，代码如下： #!/bin/bashKUBECTL_BIN/var/lib/snapd/snap/bin/kubectlERR_MSG_K8S_NOTRUNNING"microk8s is not running" ERR_MSG_C…...

编程日记 2024/3/31 22:44:02

java中的static和单例模式

同一个类中，访问其类成员，可以省略类名不写 static：叫静态，可以修饰成员变量，成员方法。成员变量按照有无static修饰，分为两种： 类变量：有static修饰，属于类&#xf…...

编程日记 2024/3/31 22:43:00

RabbitMQ相关总结

Broker 异步调用中用Broker进行事件订阅和调用，完成解耦没有强依赖，不用担心级联失败流量削峰 MQ 的下载 1.可以使用命令拉取镜像 docker pull rabbitmq:3-management 2.也可以直接去官网下载tar包，然后上传到虚拟机上面 spring AMQP…...

编程日记 2024/3/31 22:39:57

RAFT: Adapting Language Model to Domain Specific RAG

今天来介绍下伯克利大学3.15日新发的一篇paper，RAFT: Adapting Language Model to Domain Specific RAG 主要研究了如何构造训练数据来微调你的LLM，从而在LLM在垂直领域的RAG中表现更好。并且开源了代码：GitHub - ShishirPatil/gorilla: Gorilla: An API store for LLMs 主…...

编程日记 2024/3/31 22:37:55

第十五届蓝桥杯第三期模拟赛第十题 ← 上楼梯

【问题描述】小蓝要上一个楼梯，楼梯共有 n 级台阶（即小蓝总共要走 n 级）。小蓝每一步可以走 a 级、b 级或 c 级台阶。请问小蓝总共有多少种方案能正好走到楼梯顶端？【输入格式】输入的第一行包含一个整数 n 。第二行包含三个整…...

编程日记 2024/3/31 22:34:52

第四题：星期一

题目描述本题为填空题，只需要算出结果后，在代码中使用输出语句将所填结果输出即可。整个 20 世纪（1901 年 1 月 1 日至 2000 年 12 月 31 日之间），一共有多少个星期一？(不要告诉我你不知道今天是星期几…...

编程日记 2024/3/31 22:33:51

Mamba: Linear-Time Sequence Modeling with Selective State Spaces(论文笔记)

What can I say? 2024年我还能说什么？ Mamba out! 曼巴出来了！ 原文链接： [2312.00752] Mamba: Linear-Time Sequence Modeling with Selective State Spaces (arxiv.org) 原文笔记： What： Mamba: Linear-Time …...

编程日记 2024/3/31 22:29:47

2024蓝桥杯每日一题（区间DP）

备战2024年蓝桥杯 -- 每日一题 Python大学A组试题一：游戏试题二：石子合并试题三：密码脱落试题四：能量项链试题一：游戏【题目描述】玩家一和玩家二共同玩一个小游戏。给定一个包含 N 个…...

编程日记 2024/3/31 22:24:44

LeetCode-2952. 需要添加的硬币的最小数量【贪心数组排序】

LeetCode-2952. 需要添加的硬币的最小数量【贪心数组排序】题目描述：解题思路一：看提示主要是用贪心和排序。那我们肯定是首先对coins排序。然后依次遍历coins[i]，获取当前可以获取金额范围，和判断是否加入新硬币。判断规则如下…...

编程日记 2024/3/31 22:23:43

新书速递——《可解释AI实战（PyTorch版）》

本书旨在帮助你实施最新的可解释AI技术，以构建公平且可解释的AI系统。可解释AI是当今AI研究中的热门话题，但只有少数资源和指南涵盖了所有重要技术，这些技术对实践者来说非常有价值。本书旨在填补这一空白。本书读者对象本书既适合那些有兴…...

编程日记 2024/3/31 22:21:41

Appium+python自动化（十六）- ADB命令

简介 Android 调试桥(adb)是多种用途的工具，该工具可以帮助你你管理设备或模拟器的状态。 adb ( Android Debug Bridge)是一个通用命令行工具，其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利，如安装和调试…...

编程新知 2026/1/21 18:20:51

练习（含atoi的模拟实现,自定义类型等练习）

一、结构体大小的计算及位段 （结构体大小计算及位段详解请看：自定义类型：结构体进阶-CSDN博客） 1.在32位系统环境，编译选项为4字节对齐，那么sizeof(A)和sizeof(B)是多少？ #pragma pack(4)st…...

编程新知 2026/1/30 15:16:30

MongoDB学习和应用(高效的非关系型数据库)

一丶 MongoDB简介对于社交类软件的功能，我们需要对它的功能特点进行分析： 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具： mysql：关系型数据库&am…...

编程新知 2026/1/23 10:24:30

【大模型RAG】Docker 一键部署 Milvus 完整攻略

本文概要 Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装；只需暴露 19530（gRPC）与 9091（HTTP/WebUI）两个端口，即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面…...

编程新知 2026/1/31 8:08:07

多种风格导航菜单 HTML 实现（附源码）

下面我将为您展示 6 种不同风格的导航菜单实现，每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...

编程新知 2026/2/2 2:49:11

大语言模型（LLM）中的KV缓存压缩与动态稀疏注意力机制设计

随着大语言模型（LLM）参数规模的增长，推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长，而KV缓存的内存消耗可能高达数十GB（例如Llama2-7B处理100K token时需50GB内存&a…...

编程新知 2026/1/28 1:40:03

基于 TAPD 进行项目管理

起因自己写了个小工具，仓库用的Github。之前在用markdown进行需求管理，现在随着功能的增加，感觉有点难以管理了，所以用TAPD这个工具进行需求、Bug管理。操作流程注册 TAPD，需要提供一个企业名新建一个项目&#…...

编程新知 2026/1/24 14:15:44

IP如何挑？2025年海外专线IP如何购买？

你花了时间和预算买了IP，结果IP质量不佳，项目效率低下不说，还可能带来莫名的网络问题，是不是太闹心了？尤其是在面对海外专线IP时，到底怎么才能买到适合自己的呢？所以，挑IP绝对是个技…...

编程新知 2026/1/28 3:04:35

django blank 与 null的区别

1.blank blank控制表单验证时是否允许字段为空 2.null null控制数据库层面是否为空但是，要注意以下几点： Django的表单验证与null无关：null参数控制的是数据库层面字段是否可以为NULL，而blank参数控制的是Django表单验证时字…...

编程新知 2025/7/7 3:34:13

恶补电源：1.电桥

一、元器件的选择搜索并选择电桥，再multisim中选择FWB，就有各种型号的电桥: 电桥是用来干嘛的呢？ 它是一个由四个二极管搭成的“桥梁”形状的电路，用来把交流电（AC）变成直流电（DC）。…...

编程新知 2026/2/9 5:44:35