240330-大模型资源-使用教程-部署方式-部分笔记
A. 大模型资源
- Models - Hugging Face
- HF-Mirror - Huggingface 镜像站
- 模型库首页 · 魔搭社区

B. 使用教程
HuggingFace
- HuggingFace 10分钟快速入门(一),利用Transformers,Pipeline探索AI。_哔哩哔哩_bilibili
- HuggingFace快速入门(二),利用AI模型快速搭建APP。_哔哩哔哩_bilibili
- HuggingFace 快速入门(三),HF的Agent快速搭建AI Agent_哔哩哔哩_bilibili
- HuggingFace 快速入门(四),玩转HF上的模型_哔哩哔哩_bilibili
HF-Mirror
- 如何快速下载huggingface模型——全方法总结 - 知乎
huggingface-cli download --resume-download mistralai/Mistral-7B-Instruct-v0.2 --local-dir Mistral-7B-Instruct-v0.2 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download google-t5/t5-small --local-dir t5-small --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/whisper-large-v3 --local-dir whisper-large-v3 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/whisper-large-v3 --local-dir whisper-large-v3 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/clip-vit-base-patch32 --local-dir clip-vit-base-patch32 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/clip-vit-large-patch14 --local-dir clip-vit-large-patch14 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download keremberke/yolov8m-table-extraction --local-dir yolov8m-table-extraction --local-dir-use-symlinks Falsehuggingface-cli download --resume-download merve/yolov9 --local-dir yolov9 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download stabilityai/stable-code-instruct-3b --local-dir stable-code-instruct-3b --local-dir-use-symlinks Falsehuggingface-cli download --resume-download stabilityai/stable-code-3b --local-dir stable-code-3b--local-dir-use-symlinks Falsehuggingface-cli download --resume-download defog/sqlcoder-7b-2 --local-dir sqlcoder-7b-2 --local-dir-use-symlinks False
魔搭社区
- ModelScope 魔搭社区初探 - 知乎
- 魔搭v1.3版本 Release Note (20230216) · 文档中心
from modelscope.hub.snapshot_download import snapshot_downloadmodel_dir = snapshot_download('iic/speech_fsmn_vad_zh-cn-16k-common-pytorch', cache_dir='speech_fsmn_vad_zh-cn-16k-common-pytorch')model_dir = snapshot_download('qwen/Qwen1.5-MoE-A2.7B', cache_dir='Qwen1.5-MoE-A2.7B')model_dir = snapshot_download('iic/speech_eres2net_large_sv_zh-cn_cnceleb_16k', cache_dir='speech_eres2net_large_sv_zh-cn_cnceleb_16k')model_dir = snapshot_download('iic/cv_ddsar_face-detection_iclr23-damofd', cache_dir='cv_ddsar_face-detection_iclr23-damofd')model_dir = snapshot_download('iic/Whisper-large-v3', cache_dir='Whisper-large-v3-iic')model_dir = snapshot_download('iic/nlp_bart_text-error-correction_chinese', cache_dir='nlp_bart_text-error-correction_chinese')model_dir = snapshot_download('iic/nlp_bart_text-error-correction_chinese-law', cache_dir='nlp_bart_text-error-correction_chinese-law')model_dir = snapshot_download('iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch', cache_dir='speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch')model_dir = snapshot_download('iic/cv_dla34_table-structure-recognition_cycle-centernet', cache_dir='cv_dla34_table-structure-recognition_cycle-centernet')model_dir = snapshot_download('iic/cv_resnet-transformer_table-structure-recognition_lore', cache_dir='cv_resnet-transformer_table-structure-recognition_lore') model_dir = snapshot_download('iic/cv_convnextTiny_ocr-recognition-general_damo', cache_dir='cv_convnextTiny_ocr-recognition-general_damo')model_dir = snapshot_download('iic/cv_resnet18_ocr-detection-db-line-level_damo', cache_dir='cv_resnet18_ocr-detection-db-line-level_damo')model_dir = snapshot_download('iic/cv_convnextTiny_ocr-recognition-document_damo', cache_dir='cv_convnextTiny_ocr-recognition-document_damo')model_dir = snapshot_download('iic/cv_resnet18_ocr-detection-line-level_damo', cache_dir='cv_resnet18_ocr-detection-line-level_damo')
C. 部署方式
- 一键部署Google开源大模型Gemma,性能远超Mistral、LLama2 | 本地大模型部署,ollama助您轻松完成!_哔哩哔哩_bilibili
- Windows系统本机运行Gemma最简步骤_哔哩哔哩_bilibili
- ollama如何把gemma模型部署到D盘_哔哩哔哩_bilibili
- Ollama如何把Gemma模型部署到D盘_方法二创建目录链接释放C盘空间_哔哩哔哩_bilibili
- Ollama如何使用现有的GGUF文件_哔哩哔哩_bilibili
- Ollama导入GGUF文件_哔哩哔哩_bilibili
- Ollama wsarecv: An existing connection was forcibly closed by the remote host._哔哩哔哩_bilibili
- OLLAMA_KEEP_ALIVE潜在问题分析_哔哩哔哩_bilibili
- Ollama 运行 GGUF 模型
- LangChain 与 ollama 携手python 环境演示 Hello World 构建属于自己的大模型应用
- 人工智能大模型系列(七)使用 Ollama 和 CodeGPT 在 VSCode 中创建您自己的自定义 Copilot
D. 格式转换
-
开源大模型GGUF量化(llama.cpp)与本地部署运行(ollama)教程 - 知乎
-
揭开gguf神秘面纱——大模型CPU部署系列02 - 知乎
E. 代码生成
- LLM 系列 | 21 : Code Llama实战(上篇) : 模型简介与试用
- LLM系列 | 22 : Code Llama实战(下篇):本地部署、量化及GPT-4对比
- Stability AI开源3B代码生成模型:可补全,还能Debug
F. YOLOV9
- WongKinYiu/yolov9
- YOLO v9训练自己数据集_yolov9训练自己的数据集-CSDN博客
- 手把手教你在自己的数据集上训练YOLOv9! - 知乎
G. SAM
- facebookresearch/segment-anything
H. Qwen1.5-MoE
Github官方GitHub - QwenLM/Qwen1.5: Qwen1.5 is the improved version of Qwen, the large language model series developed by Qwen team, Alibaba Cloud.GPTQ版本运行失败Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能_哔哩哔哩_bilibili对应Chat版本的代码Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能 - 哔哩哔哩微信资料开源MOE再添一员:通义团队Qwen1.5 MOE A2.7B大模型如何选择模型Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁_哔哩哔哩_bilibili不同型号显卡在同一台机器上通过vllm加速推理双4090部署qwen72b大模型 每秒150tokens_哔哩哔哩_bilibiliQwen-Agent及浏览器插件GitHub - QwenLM/Qwen-Agent: Agent framework and applications built upon Qwen1.5, featuring Function Calling, Code Interpreter, RAG, and Chrome extension.
相关文章:
240330-大模型资源-使用教程-部署方式-部分笔记
A. 大模型资源 Models - Hugging FaceHF-Mirror - Huggingface 镜像站模型库首页 魔搭社区 B. 使用教程 HuggingFace HuggingFace 10分钟快速入门(一),利用Transformers,Pipeline探索AI。_哔哩哔哩_bilibiliHuggingFace快速入…...
uni-app 富文本编辑器
<template><view class"container"><view>标题:<u-input placeholder"请输入标题"></u-input></view><view class"page-body"><view classwrapper><view classtoolbar tap"…...
3D汽车模型线上三维互动展示提供视觉盛宴
VR全景虚拟看车软件正在引领汽车展览行业迈向一个全新的时代,它不仅颠覆了传统展览的局限,还为参展者提供了前所未有的高效、便捷和互动体验。借助于尖端的vr虚拟现实技术、逼真的web3d开发、先进的云计算能力以及强大的大数据处理,这一在线展…...
如何在Flutter中进行网络请求?
Hello!大家好,我是咕噜铁蛋,你们的好朋友!今天,我想和大家分享一下在Flutter中如何进行网络请求。Flutter作为一个跨平台的开发框架,网络请求是其实现数据交互的重要一环。下面,我将详细介绍几种…...
node:ReferenceError: XMLHttpRequest is not defined
node:ReferenceError: XMLHttpRequest is not defined 1 前言 node执行如下代码: new XMLHttpRequest()报错提示:ReferenceError: XMLHttpRequest is not defined 2 解决 2.1 可能原因是没有安装xmlhttprequest npm install xmlhttpreq…...
PHP定时任务框架taskPHP3.0的学习记录1(TaskPHP、执行任务类的实操代码实例)
TaskPHP是一个基于PHP的定时任务框架,它提供了一个简单、灵活且易于使用的解决方案,用于在PHP环境中执行定时任务。下面是对TaskPHP框架的简要介绍: 简单易用:TaskPHP的设计目标是让定时任务的创建和管理变得简单。通过简单的配置…...
图腾柱PFC:HP1010为您的电动两轮车之旅提供绿色,高效,安全的动力
电动两轮车不仅为当今生活提供了便利,更是一种健康和绿色的出行方式。想象一下,在经过一整晚的充分休息,骑上爱车,满血复活的准备开始新的一天。您会愿意带着如何给心爱的两轮车充电的担心开始这一天吗? 随着越来越…...
动态规划-----背包类问题(0-1背包与完全背包)详解
目录 什么是背包问题? 动态规划问题的一般解决办法: 0-1背包问题: 0 - 1背包类问题 分割等和子集: 完全背包问题: 完全背包类问题 零钱兑换II: 什么是背包问题? 背包问题(Knapsack problem)是一种…...
通过 Docker 搭建 BookStack
文章目录 环境说明1、官方网站2、通过 Docker 部署总结 环境说明 操作系统版本:CentOS Linux release 7.9.2009 (Core) Docker 版本:Docker Engine - Community 24.0.2 BookStack 版本:23.02.3 MySQL 版本:8.0.32 1、官方网站 G…...
通俗易懂:什么是Java虚拟机(JVM)?它的主要作用是什么?
Java虚拟机(Java Virtual Machine, JVM)是一种软件实现的抽象计算机,它负责执行Java字节码(Bytecode)。Java程序并不是直接在物理计算机上运行,而是先由Java编译器将源代码编译成与平台无关的字节码&#x…...
[k8s] kubectl执行失败后等待一段时间再重试 (Shell实现)
使用Shell脚本实现功能: kubectl执行失败后,等待30秒后再重试,一共重试3次,代码如下: #!/bin/bashKUBECTL_BIN/var/lib/snapd/snap/bin/kubectlERR_MSG_K8S_NOTRUNNING"microk8s is not running" ERR_MSG_C…...
java中的static和单例模式
同一个类中,访问其类成员,可以省略类名不写 static:叫静态,可以修饰成员变量,成员方法。 成员变量按照有无static修饰,分为两种: 类变量:有static修饰,属于类…...
RabbitMQ相关总结
Broker 异步调用中用Broker进行事件订阅和调用,完成解耦 没有强依赖,不用担心级联失败 流量削峰 MQ 的下载 1.可以使用命令拉取镜像 docker pull rabbitmq:3-management 2.也可以直接去官网下载tar包,然后上传到虚拟机上面 spring AMQP…...
RAFT: Adapting Language Model to Domain Specific RAG
今天来介绍下伯克利大学3.15日新发的一篇paper,RAFT: Adapting Language Model to Domain Specific RAG 主要研究了如何构造训练数据来微调你的LLM,从而在LLM在垂直领域的RAG中表现更好。并且开源了代码:GitHub - ShishirPatil/gorilla: Gorilla: An API store for LLMs 主…...
第十五届蓝桥杯第三期模拟赛第十题 ← 上楼梯
【问题描述】 小蓝要上一个楼梯,楼梯共有 n 级台阶(即小蓝总共要走 n 级)。小蓝每一步可以走 a 级、b 级或 c 级台阶。 请问小蓝总共有多少种方案能正好走到楼梯顶端?【输入格式】 输入的第一行包含一个整数 n 。 第二行包含三个整…...
第四题:星期一
题目描述 本题为填空题,只需要算出结果后,在代码中使用输出语句将所填结果输出即可。 整个 20 世纪(1901 年 1 月 1 日至 2000 年 12 月 31 日之间),一共有多少个星期一?(不要告诉我你不知道今天是星期几…...
Mamba: Linear-Time Sequence Modeling with Selective State Spaces(论文笔记)
What can I say? 2024年我还能说什么? Mamba out! 曼巴出来了! 原文链接: [2312.00752] Mamba: Linear-Time Sequence Modeling with Selective State Spaces (arxiv.org) 原文笔记: What: Mamba: Linear-Time …...
2024蓝桥杯每日一题(区间DP)
备战2024年蓝桥杯 -- 每日一题 Python大学A组 试题一:游戏 试题二:石子合并 试题三:密码脱落 试题四:能量项链 试题一:游戏 【题目描述】 玩家一和玩家二共同玩一个小游戏。给定一个包含 N 个…...
LeetCode-2952. 需要添加的硬币的最小数量【贪心 数组 排序】
LeetCode-2952. 需要添加的硬币的最小数量【贪心 数组 排序】 题目描述:解题思路一:看提示主要是用贪心和排序。那我们肯定是首先对coins排序。然后依次遍历coins[i],获取当前可以获取金额范围,和判断是否加入新硬币。判断规则如下…...
新书速递——《可解释AI实战(PyTorch版)》
本书旨在帮助你实施最新的可解释AI技术,以构建公平且可解释的AI系统。可解释AI是当今AI研究中的热门话题,但只有少数资源和指南涵盖了所有重要技术,这些技术对实践者来说非常有价值。本书旨在填补这一空白。 本书读者对象 本书既适合那些有兴…...
激活函数进化史:从Sigmoid到ELU,聊聊那些年我们踩过的‘梯度消失’和‘神经元死亡’的坑
激活函数进化史:从Sigmoid到ELU,聊聊那些年我们踩过的‘梯度消失’和‘神经元死亡’的坑 神经网络的世界里,激活函数就像神经元之间的"翻译官",负责将输入信号转化为有意义的输出。但这位翻译官的脾气可不太好琢磨——…...
WeChatExporter深度解析:如何三步搞定iOS微信聊天记录完整导出
WeChatExporter深度解析:如何三步搞定iOS微信聊天记录完整导出 【免费下载链接】WeChatExporter 一个可以快速导出、查看你的微信聊天记录的工具 项目地址: https://gitcode.com/gh_mirrors/wec/WeChatExporter 还在为无法备份微信聊天记录而烦恼吗ÿ…...
AT25SF041 SPI Flash驱动设计与嵌入式可靠性实践
1. AT25SF041 SPI Flash 存储器驱动深度解析AT25SF041 是由 Adesto(现为 Dialog Semiconductor)推出的 4 Mbit(512 KB)串行 NOR Flash 存储器,采用标准四线 SPI 接口(CLK、CS#、DI、DO)…...
终极解决方案:uesave-rs 让你轻松编辑虚幻引擎游戏存档
终极解决方案:uesave-rs 让你轻松编辑虚幻引擎游戏存档 【免费下载链接】uesave 项目地址: https://gitcode.com/gh_mirrors/ue/uesave 还在为游戏存档损坏而抓狂吗?面对一堆看不懂的二进制数据,想要修改游戏进度却无从下手ÿ…...
MultiHighlight插件深度解析:掌握代码高亮的艺术与科学
MultiHighlight插件深度解析:掌握代码高亮的艺术与科学 【免费下载链接】MultiHighlight Jetbrains IDE plugin: highlight identifiers with custom colors 🎨💡 项目地址: https://gitcode.com/gh_mirrors/mu/MultiHighlight 在复杂…...
手把手教你用R玩转MSigDB:从数据库下载、基因集构建到GSEA/GSVA完整流程
手把手教你用R玩转MSigDB:从数据库下载、基因集构建到GSEA/GSVA完整流程 如果你正在寻找一个权威的基因集数据库来支持你的转录组功能分析,MSigDB(Molecular Signatures Database)无疑是首选。作为Broad研究所维护的核心资源&…...
CentOS 7.6 + Intel Parallel Studio XE 2017:手把手搞定VASP 5.4.4编译环境(附License激活避坑指南)
CentOS 7.6环境下Intel编译器与VASP 5.4.4的深度配置实战 在计算材料科学领域,VASP作为电子结构计算的黄金标准工具,其性能高度依赖底层编译环境的优化。本文将带您深入探索如何在CentOS 7.6系统上,通过Intel Parallel Studio XE 2017构建高性…...
【Java 面试突击 · 06】从抽象类与接口辨析到 AQS 与线程池底层原理解析
目录 1. 简述抽象类与接口的区别 2. 简述内部类及其作用 3. Java 中的 AQS 了解吗? 4. Synchronized 的偏向锁、轻量级锁、重量级锁 5. Thread 和 Runnable 的区别? 6. 泛型中 extends 和 super 的区别? 7. JVM 内存中哪些是线程共享区…...
Linux下RTL8188无线网卡变身AP热点:从驱动安装到自动分配IP全流程(附避坑指南)
Linux下RTL8188无线网卡配置AP热点全攻略:从驱动到自动IP分配的实战指南 在嵌入式开发和物联网应用中,将无线网卡配置为接入点(AP)是常见需求。RTL8188系列USB无线网卡因其高性价比和广泛兼容性,成为开发者的热门选择。…...
像素时装锻造坊入门必看:预设咒语+Forge Scale滑块参数详解
像素时装锻造坊入门必看:预设咒语Forge Scale滑块参数详解 1. 工具介绍:像素时装锻造坊 像素时装锻造坊(Pixel Fashion Atelier)是一款基于Stable Diffusion与Anything-v5模型的图像生成工具。它采用独特的复古日系RPG界面设计&…...
