当前位置: 首页 > news >正文

240330-大模型资源-使用教程-部署方式-部分笔记

A. 大模型资源

  • Models - Hugging Face
  • HF-Mirror - Huggingface 镜像站
  • 模型库首页 · 魔搭社区

在这里插入图片描述

B. 使用教程

HuggingFace

  • HuggingFace 10分钟快速入门(一),利用Transformers,Pipeline探索AI。_哔哩哔哩_bilibili
  • HuggingFace快速入门(二),利用AI模型快速搭建APP。_哔哩哔哩_bilibili
  • HuggingFace 快速入门(三),HF的Agent快速搭建AI Agent_哔哩哔哩_bilibili
  • HuggingFace 快速入门(四),玩转HF上的模型_哔哩哔哩_bilibili

HF-Mirror

  • 如何快速下载huggingface模型——全方法总结 - 知乎
huggingface-cli download --resume-download mistralai/Mistral-7B-Instruct-v0.2 --local-dir Mistral-7B-Instruct-v0.2 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download google-t5/t5-small --local-dir t5-small --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/whisper-large-v3 --local-dir whisper-large-v3 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/whisper-large-v3 --local-dir whisper-large-v3 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/clip-vit-base-patch32 --local-dir clip-vit-base-patch32 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/clip-vit-large-patch14 --local-dir clip-vit-large-patch14 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download keremberke/yolov8m-table-extraction --local-dir yolov8m-table-extraction --local-dir-use-symlinks Falsehuggingface-cli download --resume-download merve/yolov9 --local-dir yolov9 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download stabilityai/stable-code-instruct-3b --local-dir stable-code-instruct-3b --local-dir-use-symlinks Falsehuggingface-cli download --resume-download stabilityai/stable-code-3b --local-dir stable-code-3b--local-dir-use-symlinks Falsehuggingface-cli download --resume-download defog/sqlcoder-7b-2 --local-dir sqlcoder-7b-2 --local-dir-use-symlinks False

魔搭社区

  • ModelScope 魔搭社区初探 - 知乎
  • 魔搭v1.3版本 Release Note (20230216) · 文档中心
from modelscope.hub.snapshot_download import snapshot_downloadmodel_dir = snapshot_download('iic/speech_fsmn_vad_zh-cn-16k-common-pytorch', cache_dir='speech_fsmn_vad_zh-cn-16k-common-pytorch')model_dir = snapshot_download('qwen/Qwen1.5-MoE-A2.7B', cache_dir='Qwen1.5-MoE-A2.7B')model_dir = snapshot_download('iic/speech_eres2net_large_sv_zh-cn_cnceleb_16k', cache_dir='speech_eres2net_large_sv_zh-cn_cnceleb_16k')model_dir = snapshot_download('iic/cv_ddsar_face-detection_iclr23-damofd', cache_dir='cv_ddsar_face-detection_iclr23-damofd')model_dir = snapshot_download('iic/Whisper-large-v3', cache_dir='Whisper-large-v3-iic')model_dir = snapshot_download('iic/nlp_bart_text-error-correction_chinese', cache_dir='nlp_bart_text-error-correction_chinese')model_dir = snapshot_download('iic/nlp_bart_text-error-correction_chinese-law', cache_dir='nlp_bart_text-error-correction_chinese-law')model_dir = snapshot_download('iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch', cache_dir='speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch')model_dir = snapshot_download('iic/cv_dla34_table-structure-recognition_cycle-centernet', cache_dir='cv_dla34_table-structure-recognition_cycle-centernet')model_dir = snapshot_download('iic/cv_resnet-transformer_table-structure-recognition_lore', cache_dir='cv_resnet-transformer_table-structure-recognition_lore') model_dir = snapshot_download('iic/cv_convnextTiny_ocr-recognition-general_damo', cache_dir='cv_convnextTiny_ocr-recognition-general_damo')model_dir = snapshot_download('iic/cv_resnet18_ocr-detection-db-line-level_damo', cache_dir='cv_resnet18_ocr-detection-db-line-level_damo')model_dir = snapshot_download('iic/cv_convnextTiny_ocr-recognition-document_damo', cache_dir='cv_convnextTiny_ocr-recognition-document_damo')model_dir = snapshot_download('iic/cv_resnet18_ocr-detection-line-level_damo', cache_dir='cv_resnet18_ocr-detection-line-level_damo')

C. 部署方式

  • 一键部署Google开源大模型Gemma,性能远超Mistral、LLama2 | 本地大模型部署,ollama助您轻松完成!_哔哩哔哩_bilibili
  • Windows系统本机运行Gemma最简步骤_哔哩哔哩_bilibili
  • ollama如何把gemma模型部署到D盘_哔哩哔哩_bilibili
  • Ollama如何把Gemma模型部署到D盘_方法二创建目录链接释放C盘空间_哔哩哔哩_bilibili
  • Ollama如何使用现有的GGUF文件_哔哩哔哩_bilibili
  • Ollama导入GGUF文件_哔哩哔哩_bilibili
  • Ollama wsarecv: An existing connection was forcibly closed by the remote host._哔哩哔哩_bilibili
  • OLLAMA_KEEP_ALIVE潜在问题分析_哔哩哔哩_bilibili
  • Ollama 运行 GGUF 模型
  • LangChain 与 ollama 携手python 环境演示 Hello World 构建属于自己的大模型应用
  • 人工智能大模型系列(七)使用 Ollama 和 CodeGPT 在 VSCode 中创建您自己的自定义 Copilot

D. 格式转换

  • 开源大模型GGUF量化(llama.cpp)与本地部署运行(ollama)教程 - 知乎

  • 揭开gguf神秘面纱——大模型CPU部署系列02 - 知乎

E. 代码生成

  • LLM 系列 | 21 : Code Llama实战(上篇) : 模型简介与试用
  • LLM系列 | 22 : Code Llama实战(下篇):本地部署、量化及GPT-4对比
  • Stability AI开源3B代码生成模型:可补全,还能Debug

F. YOLOV9

  • WongKinYiu/yolov9
  • YOLO v9训练自己数据集_yolov9训练自己的数据集-CSDN博客
  • 手把手教你在自己的数据集上训练YOLOv9! - 知乎

G. SAM

  • facebookresearch/segment-anything

H. Qwen1.5-MoE

  • Github官方GitHub - QwenLM/Qwen1.5: Qwen1.5 is the improved version of Qwen, the large language model series developed by Qwen team, Alibaba Cloud.
  • GPTQ版本运行失败Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能_哔哩哔哩_bilibili
  • 对应Chat版本的代码Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能 - 哔哩哔哩
  • 微信资料开源MOE再添一员:通义团队Qwen1.5 MOE A2.7B大模型
  • 如何选择模型Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁_哔哩哔哩_bilibili
  • 不同型号显卡在同一台机器上通过vllm加速推理双4090部署qwen72b大模型 每秒150tokens_哔哩哔哩_bilibili
  • Qwen-Agent及浏览器插件GitHub - QwenLM/Qwen-Agent: Agent framework and applications built upon Qwen1.5, featuring Function Calling, Code Interpreter, RAG, and Chrome extension.

相关文章:

240330-大模型资源-使用教程-部署方式-部分笔记

A. 大模型资源 Models - Hugging FaceHF-Mirror - Huggingface 镜像站模型库首页 魔搭社区 B. 使用教程 HuggingFace HuggingFace 10分钟快速入门(一),利用Transformers,Pipeline探索AI。_哔哩哔哩_bilibiliHuggingFace快速入…...

uni-app 富文本编辑器

<template><view class"container"><view>标题&#xff1a;<u-input placeholder"请输入标题"></u-input></view><view class"page-body"><view classwrapper><view classtoolbar tap"…...

3D汽车模型线上三维互动展示提供视觉盛宴

VR全景虚拟看车软件正在引领汽车展览行业迈向一个全新的时代&#xff0c;它不仅颠覆了传统展览的局限&#xff0c;还为参展者提供了前所未有的高效、便捷和互动体验。借助于尖端的vr虚拟现实技术、逼真的web3d开发、先进的云计算能力以及强大的大数据处理&#xff0c;这一在线展…...

如何在Flutter中进行网络请求?

Hello&#xff01;大家好&#xff0c;我是咕噜铁蛋&#xff0c;你们的好朋友&#xff01;今天&#xff0c;我想和大家分享一下在Flutter中如何进行网络请求。Flutter作为一个跨平台的开发框架&#xff0c;网络请求是其实现数据交互的重要一环。下面&#xff0c;我将详细介绍几种…...

node:ReferenceError: XMLHttpRequest is not defined

node&#xff1a;ReferenceError: XMLHttpRequest is not defined 1 前言 node执行如下代码&#xff1a; new XMLHttpRequest()报错提示&#xff1a;ReferenceError: XMLHttpRequest is not defined 2 解决 2.1 可能原因是没有安装xmlhttprequest npm install xmlhttpreq…...

PHP定时任务框架taskPHP3.0的学习记录1(TaskPHP、执行任务类的实操代码实例)

TaskPHP是一个基于PHP的定时任务框架&#xff0c;它提供了一个简单、灵活且易于使用的解决方案&#xff0c;用于在PHP环境中执行定时任务。下面是对TaskPHP框架的简要介绍&#xff1a; 简单易用&#xff1a;TaskPHP的设计目标是让定时任务的创建和管理变得简单。通过简单的配置…...

图腾柱PFC:HP1010为您的电动两轮车之旅提供绿色,高效,安全的动力

电动两轮车不仅为当今生活提供了便利&#xff0c;更是一种健康和绿色的出行方式。想象一下&#xff0c;在经过一整晚的充分休息&#xff0c;骑上爱车&#xff0c;满血复活的准备开始新的一天。您会愿意带着如何给心爱的两轮车充电的担心开始这一天吗&#xff1f; 随着越来越…...

动态规划-----背包类问题(0-1背包与完全背包)详解

目录 什么是背包问题&#xff1f; 动态规划问题的一般解决办法&#xff1a; 0-1背包问题&#xff1a; 0 - 1背包类问题 分割等和子集&#xff1a; 完全背包问题&#xff1a; 完全背包类问题 零钱兑换II: 什么是背包问题&#xff1f; 背包问题(Knapsack problem)是一种…...

通过 Docker 搭建 BookStack

文章目录 环境说明1、官方网站2、通过 Docker 部署总结 环境说明 操作系统版本&#xff1a;CentOS Linux release 7.9.2009 (Core) Docker 版本&#xff1a;Docker Engine - Community 24.0.2 BookStack 版本&#xff1a;23.02.3 MySQL 版本&#xff1a;8.0.32 1、官方网站 G…...

通俗易懂:什么是Java虚拟机(JVM)?它的主要作用是什么?

Java虚拟机&#xff08;Java Virtual Machine, JVM&#xff09;是一种软件实现的抽象计算机&#xff0c;它负责执行Java字节码&#xff08;Bytecode&#xff09;。Java程序并不是直接在物理计算机上运行&#xff0c;而是先由Java编译器将源代码编译成与平台无关的字节码&#x…...

[k8s] kubectl执行失败后等待一段时间再重试 (Shell实现)

使用Shell脚本实现功能&#xff1a; kubectl执行失败后&#xff0c;等待30秒后再重试&#xff0c;一共重试3次&#xff0c;代码如下&#xff1a; #!/bin/bashKUBECTL_BIN/var/lib/snapd/snap/bin/kubectlERR_MSG_K8S_NOTRUNNING"microk8s is not running" ERR_MSG_C…...

java中的static和单例模式

同一个类中&#xff0c;访问其类成员&#xff0c;可以省略类名不写 static&#xff1a;叫静态&#xff0c;可以修饰成员变量&#xff0c;成员方法。 成员变量按照有无static修饰&#xff0c;分为两种&#xff1a; 类变量&#xff1a;有static修饰&#xff0c;属于类&#xf…...

RabbitMQ相关总结

Broker 异步调用中用Broker进行事件订阅和调用&#xff0c;完成解耦 没有强依赖&#xff0c;不用担心级联失败 流量削峰 MQ 的下载 1.可以使用命令拉取镜像 docker pull rabbitmq:3-management 2.也可以直接去官网下载tar包&#xff0c;然后上传到虚拟机上面 spring AMQP…...

RAFT: Adapting Language Model to Domain Specific RAG

今天来介绍下伯克利大学3.15日新发的一篇paper,RAFT: Adapting Language Model to Domain Specific RAG 主要研究了如何构造训练数据来微调你的LLM,从而在LLM在垂直领域的RAG中表现更好。并且开源了代码:GitHub - ShishirPatil/gorilla: Gorilla: An API store for LLMs 主…...

第十五届蓝桥杯第三期模拟赛第十题 ← 上楼梯

【问题描述】 小蓝要上一个楼梯&#xff0c;楼梯共有 n 级台阶&#xff08;即小蓝总共要走 n 级&#xff09;。小蓝每一步可以走 a 级、b 级或 c 级台阶。 请问小蓝总共有多少种方案能正好走到楼梯顶端&#xff1f;【输入格式】 输入的第一行包含一个整数 n 。 第二行包含三个整…...

第四题:星期一

题目描述 本题为填空题&#xff0c;只需要算出结果后&#xff0c;在代码中使用输出语句将所填结果输出即可。 整个 20 世纪&#xff08;1901 年 1 月 1 日至 2000 年 12 月 31 日之间&#xff09;&#xff0c;一共有多少个星期一&#xff1f;(不要告诉我你不知道今天是星期几…...

Mamba: Linear-Time Sequence Modeling with Selective State Spaces(论文笔记)

What can I say? 2024年我还能说什么&#xff1f; Mamba out! 曼巴出来了&#xff01; 原文链接&#xff1a; [2312.00752] Mamba: Linear-Time Sequence Modeling with Selective State Spaces (arxiv.org) 原文笔记&#xff1a; What&#xff1a; Mamba: Linear-Time …...

2024蓝桥杯每日一题(区间DP)

备战2024年蓝桥杯 -- 每日一题 Python大学A组 试题一&#xff1a;游戏 试题二&#xff1a;石子合并 试题三&#xff1a;密码脱落 试题四&#xff1a;能量项链 试题一&#xff1a;游戏 【题目描述】 玩家一和玩家二共同玩一个小游戏。给定一个包含 N 个…...

LeetCode-2952. 需要添加的硬币的最小数量【贪心 数组 排序】

LeetCode-2952. 需要添加的硬币的最小数量【贪心 数组 排序】 题目描述&#xff1a;解题思路一&#xff1a;看提示主要是用贪心和排序。那我们肯定是首先对coins排序。然后依次遍历coins[i]&#xff0c;获取当前可以获取金额范围&#xff0c;和判断是否加入新硬币。判断规则如下…...

新书速递——《可解释AI实战(PyTorch版)》

本书旨在帮助你实施最新的可解释AI技术&#xff0c;以构建公平且可解释的AI系统。可解释AI是当今AI研究中的热门话题&#xff0c;但只有少数资源和指南涵盖了所有重要技术&#xff0c;这些技术对实践者来说非常有价值。本书旨在填补这一空白。 本书读者对象 本书既适合那些有兴…...

Linux-07 ubuntu 的 chrome 启动不了

文章目录 问题原因解决步骤一、卸载旧版chrome二、重新安装chorme三、启动不了&#xff0c;报错如下四、启动不了&#xff0c;解决如下 总结 问题原因 在应用中可以看到chrome&#xff0c;但是打不开(说明&#xff1a;原来的ubuntu系统出问题了&#xff0c;这个是备用的硬盘&a…...

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序

一、项目初始化与配置 1. 创建项目 ohpm init harmony/utility-payment-app 2. 配置权限 // module.json5 {"requestPermissions": [{"name": "ohos.permission.INTERNET"},{"name": "ohos.permission.GET_NETWORK_INFO"…...

QT: `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中&#xff0c;将 long long 类型转换为 QString 可以通过以下两种常用方法实现&#xff1a; 方法 1&#xff1a;使用 QString::number() 直接调用 QString 的静态方法 number()&#xff0c;将数值转换为字符串&#xff1a; long long value 1234567890123456789LL; …...

基于matlab策略迭代和值迭代法的动态规划

经典的基于策略迭代和值迭代法的动态规划matlab代码&#xff0c;实现机器人的最优运输 Dynamic-Programming-master/Environment.pdf , 104724 Dynamic-Programming-master/README.md , 506 Dynamic-Programming-master/generalizedPolicyIteration.m , 1970 Dynamic-Programm…...

iOS性能调优实战:借助克魔(KeyMob)与常用工具深度洞察App瓶颈

在日常iOS开发过程中&#xff0c;性能问题往往是最令人头疼的一类Bug。尤其是在App上线前的压测阶段或是处理用户反馈的高发期&#xff0c;开发者往往需要面对卡顿、崩溃、能耗异常、日志混乱等一系列问题。这些问题表面上看似偶发&#xff0c;但背后往往隐藏着系统资源调度不当…...

基于IDIG-GAN的小样本电机轴承故障诊断

目录 🔍 核心问题 一、IDIG-GAN模型原理 1. 整体架构 2. 核心创新点 (1) ​梯度归一化(Gradient Normalization)​​ (2) ​判别器梯度间隙正则化(Discriminator Gradient Gap Regularization)​​ (3) ​自注意力机制(Self-Attention)​​ 3. 完整损失函数 二…...

Vue3中的computer和watch

computed的写法 在页面中 <div>{{ calcNumber }}</div>script中 写法1 常用 import { computed, ref } from vue; let price ref(100);const priceAdd () > { //函数方法 price 1price.value ; }//计算属性 let calcNumber computed(() > {return ${p…...

鸿蒙HarmonyOS 5军旗小游戏实现指南

1. 项目概述 本军旗小游戏基于鸿蒙HarmonyOS 5开发&#xff0c;采用DevEco Studio实现&#xff0c;包含完整的游戏逻辑和UI界面。 2. 项目结构 /src/main/java/com/example/militarychess/├── MainAbilitySlice.java // 主界面├── GameView.java // 游戏核…...

React核心概念:State是什么?如何用useState管理组件自己的数据?

系列回顾&#xff1a; 在上一篇《React入门第一步》中&#xff0c;我们已经成功创建并运行了第一个React项目。我们学会了用Vite初始化项目&#xff0c;并修改了App.jsx组件&#xff0c;让页面显示出我们想要的文字。但是&#xff0c;那个页面是“死”的&#xff0c;它只是静态…...

深入解析 ReentrantLock:原理、公平锁与非公平锁的较量

ReentrantLock 是 Java 中 java.util.concurrent.locks 包下的一个重要类,用于实现线程同步,支持可重入性,并且可以选择公平锁或非公平锁的实现方式。下面将详细介绍 ReentrantLock 的实现原理以及公平锁和非公平锁的区别。 ReentrantLock 实现原理 基本架构 ReentrantLo…...