240330-大模型资源-使用教程-部署方式-部分笔记
A. 大模型资源
- Models - Hugging Face
- HF-Mirror - Huggingface 镜像站
- 模型库首页 · 魔搭社区

B. 使用教程
HuggingFace
- HuggingFace 10分钟快速入门(一),利用Transformers,Pipeline探索AI。_哔哩哔哩_bilibili
- HuggingFace快速入门(二),利用AI模型快速搭建APP。_哔哩哔哩_bilibili
- HuggingFace 快速入门(三),HF的Agent快速搭建AI Agent_哔哩哔哩_bilibili
- HuggingFace 快速入门(四),玩转HF上的模型_哔哩哔哩_bilibili
HF-Mirror
- 如何快速下载huggingface模型——全方法总结 - 知乎
huggingface-cli download --resume-download mistralai/Mistral-7B-Instruct-v0.2 --local-dir Mistral-7B-Instruct-v0.2 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download google-t5/t5-small --local-dir t5-small --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/whisper-large-v3 --local-dir whisper-large-v3 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/whisper-large-v3 --local-dir whisper-large-v3 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/clip-vit-base-patch32 --local-dir clip-vit-base-patch32 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/clip-vit-large-patch14 --local-dir clip-vit-large-patch14 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download keremberke/yolov8m-table-extraction --local-dir yolov8m-table-extraction --local-dir-use-symlinks Falsehuggingface-cli download --resume-download merve/yolov9 --local-dir yolov9 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download stabilityai/stable-code-instruct-3b --local-dir stable-code-instruct-3b --local-dir-use-symlinks Falsehuggingface-cli download --resume-download stabilityai/stable-code-3b --local-dir stable-code-3b--local-dir-use-symlinks Falsehuggingface-cli download --resume-download defog/sqlcoder-7b-2 --local-dir sqlcoder-7b-2 --local-dir-use-symlinks False
魔搭社区
- ModelScope 魔搭社区初探 - 知乎
- 魔搭v1.3版本 Release Note (20230216) · 文档中心
from modelscope.hub.snapshot_download import snapshot_downloadmodel_dir = snapshot_download('iic/speech_fsmn_vad_zh-cn-16k-common-pytorch', cache_dir='speech_fsmn_vad_zh-cn-16k-common-pytorch')model_dir = snapshot_download('qwen/Qwen1.5-MoE-A2.7B', cache_dir='Qwen1.5-MoE-A2.7B')model_dir = snapshot_download('iic/speech_eres2net_large_sv_zh-cn_cnceleb_16k', cache_dir='speech_eres2net_large_sv_zh-cn_cnceleb_16k')model_dir = snapshot_download('iic/cv_ddsar_face-detection_iclr23-damofd', cache_dir='cv_ddsar_face-detection_iclr23-damofd')model_dir = snapshot_download('iic/Whisper-large-v3', cache_dir='Whisper-large-v3-iic')model_dir = snapshot_download('iic/nlp_bart_text-error-correction_chinese', cache_dir='nlp_bart_text-error-correction_chinese')model_dir = snapshot_download('iic/nlp_bart_text-error-correction_chinese-law', cache_dir='nlp_bart_text-error-correction_chinese-law')model_dir = snapshot_download('iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch', cache_dir='speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch')model_dir = snapshot_download('iic/cv_dla34_table-structure-recognition_cycle-centernet', cache_dir='cv_dla34_table-structure-recognition_cycle-centernet')model_dir = snapshot_download('iic/cv_resnet-transformer_table-structure-recognition_lore', cache_dir='cv_resnet-transformer_table-structure-recognition_lore') model_dir = snapshot_download('iic/cv_convnextTiny_ocr-recognition-general_damo', cache_dir='cv_convnextTiny_ocr-recognition-general_damo')model_dir = snapshot_download('iic/cv_resnet18_ocr-detection-db-line-level_damo', cache_dir='cv_resnet18_ocr-detection-db-line-level_damo')model_dir = snapshot_download('iic/cv_convnextTiny_ocr-recognition-document_damo', cache_dir='cv_convnextTiny_ocr-recognition-document_damo')model_dir = snapshot_download('iic/cv_resnet18_ocr-detection-line-level_damo', cache_dir='cv_resnet18_ocr-detection-line-level_damo')
C. 部署方式
- 一键部署Google开源大模型Gemma,性能远超Mistral、LLama2 | 本地大模型部署,ollama助您轻松完成!_哔哩哔哩_bilibili
- Windows系统本机运行Gemma最简步骤_哔哩哔哩_bilibili
- ollama如何把gemma模型部署到D盘_哔哩哔哩_bilibili
- Ollama如何把Gemma模型部署到D盘_方法二创建目录链接释放C盘空间_哔哩哔哩_bilibili
- Ollama如何使用现有的GGUF文件_哔哩哔哩_bilibili
- Ollama导入GGUF文件_哔哩哔哩_bilibili
- Ollama wsarecv: An existing connection was forcibly closed by the remote host._哔哩哔哩_bilibili
- OLLAMA_KEEP_ALIVE潜在问题分析_哔哩哔哩_bilibili
- Ollama 运行 GGUF 模型
- LangChain 与 ollama 携手python 环境演示 Hello World 构建属于自己的大模型应用
- 人工智能大模型系列(七)使用 Ollama 和 CodeGPT 在 VSCode 中创建您自己的自定义 Copilot
D. 格式转换
-
开源大模型GGUF量化(llama.cpp)与本地部署运行(ollama)教程 - 知乎
-
揭开gguf神秘面纱——大模型CPU部署系列02 - 知乎
E. 代码生成
- LLM 系列 | 21 : Code Llama实战(上篇) : 模型简介与试用
- LLM系列 | 22 : Code Llama实战(下篇):本地部署、量化及GPT-4对比
- Stability AI开源3B代码生成模型:可补全,还能Debug
F. YOLOV9
- WongKinYiu/yolov9
- YOLO v9训练自己数据集_yolov9训练自己的数据集-CSDN博客
- 手把手教你在自己的数据集上训练YOLOv9! - 知乎
G. SAM
- facebookresearch/segment-anything
H. Qwen1.5-MoE
Github官方GitHub - QwenLM/Qwen1.5: Qwen1.5 is the improved version of Qwen, the large language model series developed by Qwen team, Alibaba Cloud.GPTQ版本运行失败Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能_哔哩哔哩_bilibili对应Chat版本的代码Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能 - 哔哩哔哩微信资料开源MOE再添一员:通义团队Qwen1.5 MOE A2.7B大模型如何选择模型Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁_哔哩哔哩_bilibili不同型号显卡在同一台机器上通过vllm加速推理双4090部署qwen72b大模型 每秒150tokens_哔哩哔哩_bilibiliQwen-Agent及浏览器插件GitHub - QwenLM/Qwen-Agent: Agent framework and applications built upon Qwen1.5, featuring Function Calling, Code Interpreter, RAG, and Chrome extension.
相关文章:
240330-大模型资源-使用教程-部署方式-部分笔记
A. 大模型资源 Models - Hugging FaceHF-Mirror - Huggingface 镜像站模型库首页 魔搭社区 B. 使用教程 HuggingFace HuggingFace 10分钟快速入门(一),利用Transformers,Pipeline探索AI。_哔哩哔哩_bilibiliHuggingFace快速入…...
uni-app 富文本编辑器
<template><view class"container"><view>标题:<u-input placeholder"请输入标题"></u-input></view><view class"page-body"><view classwrapper><view classtoolbar tap"…...
3D汽车模型线上三维互动展示提供视觉盛宴
VR全景虚拟看车软件正在引领汽车展览行业迈向一个全新的时代,它不仅颠覆了传统展览的局限,还为参展者提供了前所未有的高效、便捷和互动体验。借助于尖端的vr虚拟现实技术、逼真的web3d开发、先进的云计算能力以及强大的大数据处理,这一在线展…...
如何在Flutter中进行网络请求?
Hello!大家好,我是咕噜铁蛋,你们的好朋友!今天,我想和大家分享一下在Flutter中如何进行网络请求。Flutter作为一个跨平台的开发框架,网络请求是其实现数据交互的重要一环。下面,我将详细介绍几种…...
node:ReferenceError: XMLHttpRequest is not defined
node:ReferenceError: XMLHttpRequest is not defined 1 前言 node执行如下代码: new XMLHttpRequest()报错提示:ReferenceError: XMLHttpRequest is not defined 2 解决 2.1 可能原因是没有安装xmlhttprequest npm install xmlhttpreq…...
PHP定时任务框架taskPHP3.0的学习记录1(TaskPHP、执行任务类的实操代码实例)
TaskPHP是一个基于PHP的定时任务框架,它提供了一个简单、灵活且易于使用的解决方案,用于在PHP环境中执行定时任务。下面是对TaskPHP框架的简要介绍: 简单易用:TaskPHP的设计目标是让定时任务的创建和管理变得简单。通过简单的配置…...
图腾柱PFC:HP1010为您的电动两轮车之旅提供绿色,高效,安全的动力
电动两轮车不仅为当今生活提供了便利,更是一种健康和绿色的出行方式。想象一下,在经过一整晚的充分休息,骑上爱车,满血复活的准备开始新的一天。您会愿意带着如何给心爱的两轮车充电的担心开始这一天吗? 随着越来越…...
动态规划-----背包类问题(0-1背包与完全背包)详解
目录 什么是背包问题? 动态规划问题的一般解决办法: 0-1背包问题: 0 - 1背包类问题 分割等和子集: 完全背包问题: 完全背包类问题 零钱兑换II: 什么是背包问题? 背包问题(Knapsack problem)是一种…...
通过 Docker 搭建 BookStack
文章目录 环境说明1、官方网站2、通过 Docker 部署总结 环境说明 操作系统版本:CentOS Linux release 7.9.2009 (Core) Docker 版本:Docker Engine - Community 24.0.2 BookStack 版本:23.02.3 MySQL 版本:8.0.32 1、官方网站 G…...
通俗易懂:什么是Java虚拟机(JVM)?它的主要作用是什么?
Java虚拟机(Java Virtual Machine, JVM)是一种软件实现的抽象计算机,它负责执行Java字节码(Bytecode)。Java程序并不是直接在物理计算机上运行,而是先由Java编译器将源代码编译成与平台无关的字节码&#x…...
[k8s] kubectl执行失败后等待一段时间再重试 (Shell实现)
使用Shell脚本实现功能: kubectl执行失败后,等待30秒后再重试,一共重试3次,代码如下: #!/bin/bashKUBECTL_BIN/var/lib/snapd/snap/bin/kubectlERR_MSG_K8S_NOTRUNNING"microk8s is not running" ERR_MSG_C…...
java中的static和单例模式
同一个类中,访问其类成员,可以省略类名不写 static:叫静态,可以修饰成员变量,成员方法。 成员变量按照有无static修饰,分为两种: 类变量:有static修饰,属于类…...
RabbitMQ相关总结
Broker 异步调用中用Broker进行事件订阅和调用,完成解耦 没有强依赖,不用担心级联失败 流量削峰 MQ 的下载 1.可以使用命令拉取镜像 docker pull rabbitmq:3-management 2.也可以直接去官网下载tar包,然后上传到虚拟机上面 spring AMQP…...
RAFT: Adapting Language Model to Domain Specific RAG
今天来介绍下伯克利大学3.15日新发的一篇paper,RAFT: Adapting Language Model to Domain Specific RAG 主要研究了如何构造训练数据来微调你的LLM,从而在LLM在垂直领域的RAG中表现更好。并且开源了代码:GitHub - ShishirPatil/gorilla: Gorilla: An API store for LLMs 主…...
第十五届蓝桥杯第三期模拟赛第十题 ← 上楼梯
【问题描述】 小蓝要上一个楼梯,楼梯共有 n 级台阶(即小蓝总共要走 n 级)。小蓝每一步可以走 a 级、b 级或 c 级台阶。 请问小蓝总共有多少种方案能正好走到楼梯顶端?【输入格式】 输入的第一行包含一个整数 n 。 第二行包含三个整…...
第四题:星期一
题目描述 本题为填空题,只需要算出结果后,在代码中使用输出语句将所填结果输出即可。 整个 20 世纪(1901 年 1 月 1 日至 2000 年 12 月 31 日之间),一共有多少个星期一?(不要告诉我你不知道今天是星期几…...
Mamba: Linear-Time Sequence Modeling with Selective State Spaces(论文笔记)
What can I say? 2024年我还能说什么? Mamba out! 曼巴出来了! 原文链接: [2312.00752] Mamba: Linear-Time Sequence Modeling with Selective State Spaces (arxiv.org) 原文笔记: What: Mamba: Linear-Time …...
2024蓝桥杯每日一题(区间DP)
备战2024年蓝桥杯 -- 每日一题 Python大学A组 试题一:游戏 试题二:石子合并 试题三:密码脱落 试题四:能量项链 试题一:游戏 【题目描述】 玩家一和玩家二共同玩一个小游戏。给定一个包含 N 个…...
LeetCode-2952. 需要添加的硬币的最小数量【贪心 数组 排序】
LeetCode-2952. 需要添加的硬币的最小数量【贪心 数组 排序】 题目描述:解题思路一:看提示主要是用贪心和排序。那我们肯定是首先对coins排序。然后依次遍历coins[i],获取当前可以获取金额范围,和判断是否加入新硬币。判断规则如下…...
新书速递——《可解释AI实战(PyTorch版)》
本书旨在帮助你实施最新的可解释AI技术,以构建公平且可解释的AI系统。可解释AI是当今AI研究中的热门话题,但只有少数资源和指南涵盖了所有重要技术,这些技术对实践者来说非常有价值。本书旨在填补这一空白。 本书读者对象 本书既适合那些有兴…...
3分钟破解微信小程序加密包:wxappUnpacker极速解析实战指南
3分钟破解微信小程序加密包:wxappUnpacker极速解析实战指南 【免费下载链接】wxappUnpacker 项目地址: https://gitcode.com/gh_mirrors/wxappu/wxappUnpacker wxappUnpacker是一款专注于微信小程序逆向解析的开源工具,能够快速破解wxapkg格式(微…...
深度解析模型调参三剑客:Temperature、Top-k与Top-p的实战应用
1. 理解调参三剑客的核心逻辑 第一次接触大模型参数调整时,我被Temperature、Top-k和Top-p这三个参数搞得晕头转向。直到在电商文案生成项目中踩了坑才明白:这三个参数就像烹饪时的火候控制,用对了能让AI输出事半功倍。 Temperature本质上是个…...
告别bypy上传失败!用Aria2+百度云直链脚本,让服务器下载速度飙升5倍
告别bypy上传失败!用Aria2百度云直链脚本,让服务器下载速度飙升5倍 如果你经常需要将百度网盘中的大文件(比如几十GB的机器学习模型或数据集)传输到服务器上,一定对bypy的种种限制深有体会——速度慢、不稳定、大文件容…...
PyFluent:重新定义CFD仿真自动化的技术革命
PyFluent:重新定义CFD仿真自动化的技术革命 【免费下载链接】pyfluent 项目地址: https://gitcode.com/gh_mirrors/pyf/pyfluent 行业痛点分析:CFD工程师的效率困境 在现代工程设计流程中,计算流体动力学(CFD)…...
Prompt Optimizer
链接:https://pan.quark.cn/s/3d42e4512934Prompt Optimizer v2.2.1是一款开源AI提示词优化工具,致力于通过智能算法提升提示词质量,支持多模型集成和图像生成功能。它提供桌面应用、Docker部署等多种方式,帮助用户快速获得精准的…...
AI系统-7Pytorch数字识别实战及算子介绍
之前铺垫了神经网络的基础知识,这里使用编程工具Pytorch进行一个实战讲解。首先变成一个看得见、摸得着的程序和代码,然后再说后续怎么使用GPU/NPU硬件去优化。 本文主要参考ZOMI酱《AI系统》:https://chenzomi12.github.io/01Introduction/0…...
智慧生鲜配送:揭秘生鲜配送商城APP功能版块设计
在数字化消费浪潮中,生鲜配送商城APP成为居民采购食材的重要渠道。其功能版块设计聚焦用户需求,通过智能化、便捷化的操作体验,打造高效生鲜购物场景。以下揭秘其核心功能玩法,解析如何实现“从指尖到餐桌”的流畅服务。一、首页&…...
ai辅助开发:让快马生成智能助手,链接notepad下载与个性化代码推荐
今天想和大家分享一个有趣的实践:如何用AI辅助开发的方式,让Notepad这个老牌文本编辑器焕发新生。我们平时下载Notepad可能只是简单获取软件,但如果结合AI能力,就能把"下载-使用"的流程升级成"智能助手"体验。…...
从GigE Vision到千兆UDP:FPGA图像采集系统的灵活升级与10G MAC预留设计
从GigE Vision到千兆UDP:FPGA图像采集系统的灵活升级与10G MAC预留设计 在工业视觉和机器视觉领域,图像采集系统的带宽需求正以惊人的速度增长。随着4K、8K高分辨率相机的普及,以及多相机同步采集场景的增多,传统的千兆以太网接口…...
Verilog实战精要:从语法基础到高效状态机设计
1. Verilog语法基础:从硬件思维出发 第一次接触Verilog时,很多人会把它当成普通编程语言来学,结果发现处处碰壁。我当年在FPGA项目上栽的第一个跟头,就是把阻塞赋值用在了时钟触发的always块里,导致仿真结果和实际硬件…...
