当前位置: 首页 > news >正文

240330-大模型资源-使用教程-部署方式-部分笔记

A. 大模型资源

  • Models - Hugging Face
  • HF-Mirror - Huggingface 镜像站
  • 模型库首页 · 魔搭社区

在这里插入图片描述

B. 使用教程

HuggingFace

  • HuggingFace 10分钟快速入门(一),利用Transformers,Pipeline探索AI。_哔哩哔哩_bilibili
  • HuggingFace快速入门(二),利用AI模型快速搭建APP。_哔哩哔哩_bilibili
  • HuggingFace 快速入门(三),HF的Agent快速搭建AI Agent_哔哩哔哩_bilibili
  • HuggingFace 快速入门(四),玩转HF上的模型_哔哩哔哩_bilibili

HF-Mirror

  • 如何快速下载huggingface模型——全方法总结 - 知乎
huggingface-cli download --resume-download mistralai/Mistral-7B-Instruct-v0.2 --local-dir Mistral-7B-Instruct-v0.2 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download google-t5/t5-small --local-dir t5-small --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/whisper-large-v3 --local-dir whisper-large-v3 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/whisper-large-v3 --local-dir whisper-large-v3 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/clip-vit-base-patch32 --local-dir clip-vit-base-patch32 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download openai/clip-vit-large-patch14 --local-dir clip-vit-large-patch14 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download keremberke/yolov8m-table-extraction --local-dir yolov8m-table-extraction --local-dir-use-symlinks Falsehuggingface-cli download --resume-download merve/yolov9 --local-dir yolov9 --local-dir-use-symlinks Falsehuggingface-cli download --resume-download stabilityai/stable-code-instruct-3b --local-dir stable-code-instruct-3b --local-dir-use-symlinks Falsehuggingface-cli download --resume-download stabilityai/stable-code-3b --local-dir stable-code-3b--local-dir-use-symlinks Falsehuggingface-cli download --resume-download defog/sqlcoder-7b-2 --local-dir sqlcoder-7b-2 --local-dir-use-symlinks False

魔搭社区

  • ModelScope 魔搭社区初探 - 知乎
  • 魔搭v1.3版本 Release Note (20230216) · 文档中心
from modelscope.hub.snapshot_download import snapshot_downloadmodel_dir = snapshot_download('iic/speech_fsmn_vad_zh-cn-16k-common-pytorch', cache_dir='speech_fsmn_vad_zh-cn-16k-common-pytorch')model_dir = snapshot_download('qwen/Qwen1.5-MoE-A2.7B', cache_dir='Qwen1.5-MoE-A2.7B')model_dir = snapshot_download('iic/speech_eres2net_large_sv_zh-cn_cnceleb_16k', cache_dir='speech_eres2net_large_sv_zh-cn_cnceleb_16k')model_dir = snapshot_download('iic/cv_ddsar_face-detection_iclr23-damofd', cache_dir='cv_ddsar_face-detection_iclr23-damofd')model_dir = snapshot_download('iic/Whisper-large-v3', cache_dir='Whisper-large-v3-iic')model_dir = snapshot_download('iic/nlp_bart_text-error-correction_chinese', cache_dir='nlp_bart_text-error-correction_chinese')model_dir = snapshot_download('iic/nlp_bart_text-error-correction_chinese-law', cache_dir='nlp_bart_text-error-correction_chinese-law')model_dir = snapshot_download('iic/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch', cache_dir='speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch')model_dir = snapshot_download('iic/cv_dla34_table-structure-recognition_cycle-centernet', cache_dir='cv_dla34_table-structure-recognition_cycle-centernet')model_dir = snapshot_download('iic/cv_resnet-transformer_table-structure-recognition_lore', cache_dir='cv_resnet-transformer_table-structure-recognition_lore') model_dir = snapshot_download('iic/cv_convnextTiny_ocr-recognition-general_damo', cache_dir='cv_convnextTiny_ocr-recognition-general_damo')model_dir = snapshot_download('iic/cv_resnet18_ocr-detection-db-line-level_damo', cache_dir='cv_resnet18_ocr-detection-db-line-level_damo')model_dir = snapshot_download('iic/cv_convnextTiny_ocr-recognition-document_damo', cache_dir='cv_convnextTiny_ocr-recognition-document_damo')model_dir = snapshot_download('iic/cv_resnet18_ocr-detection-line-level_damo', cache_dir='cv_resnet18_ocr-detection-line-level_damo')

C. 部署方式

  • 一键部署Google开源大模型Gemma,性能远超Mistral、LLama2 | 本地大模型部署,ollama助您轻松完成!_哔哩哔哩_bilibili
  • Windows系统本机运行Gemma最简步骤_哔哩哔哩_bilibili
  • ollama如何把gemma模型部署到D盘_哔哩哔哩_bilibili
  • Ollama如何把Gemma模型部署到D盘_方法二创建目录链接释放C盘空间_哔哩哔哩_bilibili
  • Ollama如何使用现有的GGUF文件_哔哩哔哩_bilibili
  • Ollama导入GGUF文件_哔哩哔哩_bilibili
  • Ollama wsarecv: An existing connection was forcibly closed by the remote host._哔哩哔哩_bilibili
  • OLLAMA_KEEP_ALIVE潜在问题分析_哔哩哔哩_bilibili
  • Ollama 运行 GGUF 模型
  • LangChain 与 ollama 携手python 环境演示 Hello World 构建属于自己的大模型应用
  • 人工智能大模型系列(七)使用 Ollama 和 CodeGPT 在 VSCode 中创建您自己的自定义 Copilot

D. 格式转换

  • 开源大模型GGUF量化(llama.cpp)与本地部署运行(ollama)教程 - 知乎

  • 揭开gguf神秘面纱——大模型CPU部署系列02 - 知乎

E. 代码生成

  • LLM 系列 | 21 : Code Llama实战(上篇) : 模型简介与试用
  • LLM系列 | 22 : Code Llama实战(下篇):本地部署、量化及GPT-4对比
  • Stability AI开源3B代码生成模型:可补全,还能Debug

F. YOLOV9

  • WongKinYiu/yolov9
  • YOLO v9训练自己数据集_yolov9训练自己的数据集-CSDN博客
  • 手把手教你在自己的数据集上训练YOLOv9! - 知乎

G. SAM

  • facebookresearch/segment-anything

H. Qwen1.5-MoE

  • Github官方GitHub - QwenLM/Qwen1.5: Qwen1.5 is the improved version of Qwen, the large language model series developed by Qwen team, Alibaba Cloud.
  • GPTQ版本运行失败Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能_哔哩哔哩_bilibili
  • 对应Chat版本的代码Qwen1.5-MoE: 1/3的激活参数量达到7B模型的性能 - 哔哩哔哩
  • 微信资料开源MOE再添一员:通义团队Qwen1.5 MOE A2.7B大模型
  • 如何选择模型Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁_哔哩哔哩_bilibili
  • 不同型号显卡在同一台机器上通过vllm加速推理双4090部署qwen72b大模型 每秒150tokens_哔哩哔哩_bilibili
  • Qwen-Agent及浏览器插件GitHub - QwenLM/Qwen-Agent: Agent framework and applications built upon Qwen1.5, featuring Function Calling, Code Interpreter, RAG, and Chrome extension.

相关文章:

240330-大模型资源-使用教程-部署方式-部分笔记

A. 大模型资源 Models - Hugging FaceHF-Mirror - Huggingface 镜像站模型库首页 魔搭社区 B. 使用教程 HuggingFace HuggingFace 10分钟快速入门(一),利用Transformers,Pipeline探索AI。_哔哩哔哩_bilibiliHuggingFace快速入…...

uni-app 富文本编辑器

<template><view class"container"><view>标题&#xff1a;<u-input placeholder"请输入标题"></u-input></view><view class"page-body"><view classwrapper><view classtoolbar tap"…...

3D汽车模型线上三维互动展示提供视觉盛宴

VR全景虚拟看车软件正在引领汽车展览行业迈向一个全新的时代&#xff0c;它不仅颠覆了传统展览的局限&#xff0c;还为参展者提供了前所未有的高效、便捷和互动体验。借助于尖端的vr虚拟现实技术、逼真的web3d开发、先进的云计算能力以及强大的大数据处理&#xff0c;这一在线展…...

如何在Flutter中进行网络请求?

Hello&#xff01;大家好&#xff0c;我是咕噜铁蛋&#xff0c;你们的好朋友&#xff01;今天&#xff0c;我想和大家分享一下在Flutter中如何进行网络请求。Flutter作为一个跨平台的开发框架&#xff0c;网络请求是其实现数据交互的重要一环。下面&#xff0c;我将详细介绍几种…...

node:ReferenceError: XMLHttpRequest is not defined

node&#xff1a;ReferenceError: XMLHttpRequest is not defined 1 前言 node执行如下代码&#xff1a; new XMLHttpRequest()报错提示&#xff1a;ReferenceError: XMLHttpRequest is not defined 2 解决 2.1 可能原因是没有安装xmlhttprequest npm install xmlhttpreq…...

PHP定时任务框架taskPHP3.0的学习记录1(TaskPHP、执行任务类的实操代码实例)

TaskPHP是一个基于PHP的定时任务框架&#xff0c;它提供了一个简单、灵活且易于使用的解决方案&#xff0c;用于在PHP环境中执行定时任务。下面是对TaskPHP框架的简要介绍&#xff1a; 简单易用&#xff1a;TaskPHP的设计目标是让定时任务的创建和管理变得简单。通过简单的配置…...

图腾柱PFC:HP1010为您的电动两轮车之旅提供绿色,高效,安全的动力

电动两轮车不仅为当今生活提供了便利&#xff0c;更是一种健康和绿色的出行方式。想象一下&#xff0c;在经过一整晚的充分休息&#xff0c;骑上爱车&#xff0c;满血复活的准备开始新的一天。您会愿意带着如何给心爱的两轮车充电的担心开始这一天吗&#xff1f; 随着越来越…...

动态规划-----背包类问题(0-1背包与完全背包)详解

目录 什么是背包问题&#xff1f; 动态规划问题的一般解决办法&#xff1a; 0-1背包问题&#xff1a; 0 - 1背包类问题 分割等和子集&#xff1a; 完全背包问题&#xff1a; 完全背包类问题 零钱兑换II: 什么是背包问题&#xff1f; 背包问题(Knapsack problem)是一种…...

通过 Docker 搭建 BookStack

文章目录 环境说明1、官方网站2、通过 Docker 部署总结 环境说明 操作系统版本&#xff1a;CentOS Linux release 7.9.2009 (Core) Docker 版本&#xff1a;Docker Engine - Community 24.0.2 BookStack 版本&#xff1a;23.02.3 MySQL 版本&#xff1a;8.0.32 1、官方网站 G…...

通俗易懂:什么是Java虚拟机(JVM)?它的主要作用是什么?

Java虚拟机&#xff08;Java Virtual Machine, JVM&#xff09;是一种软件实现的抽象计算机&#xff0c;它负责执行Java字节码&#xff08;Bytecode&#xff09;。Java程序并不是直接在物理计算机上运行&#xff0c;而是先由Java编译器将源代码编译成与平台无关的字节码&#x…...

[k8s] kubectl执行失败后等待一段时间再重试 (Shell实现)

使用Shell脚本实现功能&#xff1a; kubectl执行失败后&#xff0c;等待30秒后再重试&#xff0c;一共重试3次&#xff0c;代码如下&#xff1a; #!/bin/bashKUBECTL_BIN/var/lib/snapd/snap/bin/kubectlERR_MSG_K8S_NOTRUNNING"microk8s is not running" ERR_MSG_C…...

java中的static和单例模式

同一个类中&#xff0c;访问其类成员&#xff0c;可以省略类名不写 static&#xff1a;叫静态&#xff0c;可以修饰成员变量&#xff0c;成员方法。 成员变量按照有无static修饰&#xff0c;分为两种&#xff1a; 类变量&#xff1a;有static修饰&#xff0c;属于类&#xf…...

RabbitMQ相关总结

Broker 异步调用中用Broker进行事件订阅和调用&#xff0c;完成解耦 没有强依赖&#xff0c;不用担心级联失败 流量削峰 MQ 的下载 1.可以使用命令拉取镜像 docker pull rabbitmq:3-management 2.也可以直接去官网下载tar包&#xff0c;然后上传到虚拟机上面 spring AMQP…...

RAFT: Adapting Language Model to Domain Specific RAG

今天来介绍下伯克利大学3.15日新发的一篇paper,RAFT: Adapting Language Model to Domain Specific RAG 主要研究了如何构造训练数据来微调你的LLM,从而在LLM在垂直领域的RAG中表现更好。并且开源了代码:GitHub - ShishirPatil/gorilla: Gorilla: An API store for LLMs 主…...

第十五届蓝桥杯第三期模拟赛第十题 ← 上楼梯

【问题描述】 小蓝要上一个楼梯&#xff0c;楼梯共有 n 级台阶&#xff08;即小蓝总共要走 n 级&#xff09;。小蓝每一步可以走 a 级、b 级或 c 级台阶。 请问小蓝总共有多少种方案能正好走到楼梯顶端&#xff1f;【输入格式】 输入的第一行包含一个整数 n 。 第二行包含三个整…...

第四题:星期一

题目描述 本题为填空题&#xff0c;只需要算出结果后&#xff0c;在代码中使用输出语句将所填结果输出即可。 整个 20 世纪&#xff08;1901 年 1 月 1 日至 2000 年 12 月 31 日之间&#xff09;&#xff0c;一共有多少个星期一&#xff1f;(不要告诉我你不知道今天是星期几…...

Mamba: Linear-Time Sequence Modeling with Selective State Spaces(论文笔记)

What can I say? 2024年我还能说什么&#xff1f; Mamba out! 曼巴出来了&#xff01; 原文链接&#xff1a; [2312.00752] Mamba: Linear-Time Sequence Modeling with Selective State Spaces (arxiv.org) 原文笔记&#xff1a; What&#xff1a; Mamba: Linear-Time …...

2024蓝桥杯每日一题(区间DP)

备战2024年蓝桥杯 -- 每日一题 Python大学A组 试题一&#xff1a;游戏 试题二&#xff1a;石子合并 试题三&#xff1a;密码脱落 试题四&#xff1a;能量项链 试题一&#xff1a;游戏 【题目描述】 玩家一和玩家二共同玩一个小游戏。给定一个包含 N 个…...

LeetCode-2952. 需要添加的硬币的最小数量【贪心 数组 排序】

LeetCode-2952. 需要添加的硬币的最小数量【贪心 数组 排序】 题目描述&#xff1a;解题思路一&#xff1a;看提示主要是用贪心和排序。那我们肯定是首先对coins排序。然后依次遍历coins[i]&#xff0c;获取当前可以获取金额范围&#xff0c;和判断是否加入新硬币。判断规则如下…...

新书速递——《可解释AI实战(PyTorch版)》

本书旨在帮助你实施最新的可解释AI技术&#xff0c;以构建公平且可解释的AI系统。可解释AI是当今AI研究中的热门话题&#xff0c;但只有少数资源和指南涵盖了所有重要技术&#xff0c;这些技术对实践者来说非常有价值。本书旨在填补这一空白。 本书读者对象 本书既适合那些有兴…...

3分钟破解微信小程序加密包:wxappUnpacker极速解析实战指南

3分钟破解微信小程序加密包&#xff1a;wxappUnpacker极速解析实战指南 【免费下载链接】wxappUnpacker 项目地址: https://gitcode.com/gh_mirrors/wxappu/wxappUnpacker wxappUnpacker是一款专注于微信小程序逆向解析的开源工具&#xff0c;能够快速破解wxapkg格式(微…...

深度解析模型调参三剑客:Temperature、Top-k与Top-p的实战应用

1. 理解调参三剑客的核心逻辑 第一次接触大模型参数调整时&#xff0c;我被Temperature、Top-k和Top-p这三个参数搞得晕头转向。直到在电商文案生成项目中踩了坑才明白&#xff1a;这三个参数就像烹饪时的火候控制&#xff0c;用对了能让AI输出事半功倍。 Temperature本质上是个…...

告别bypy上传失败!用Aria2+百度云直链脚本,让服务器下载速度飙升5倍

告别bypy上传失败&#xff01;用Aria2百度云直链脚本&#xff0c;让服务器下载速度飙升5倍 如果你经常需要将百度网盘中的大文件&#xff08;比如几十GB的机器学习模型或数据集&#xff09;传输到服务器上&#xff0c;一定对bypy的种种限制深有体会——速度慢、不稳定、大文件容…...

PyFluent:重新定义CFD仿真自动化的技术革命

PyFluent&#xff1a;重新定义CFD仿真自动化的技术革命 【免费下载链接】pyfluent 项目地址: https://gitcode.com/gh_mirrors/pyf/pyfluent 行业痛点分析&#xff1a;CFD工程师的效率困境 在现代工程设计流程中&#xff0c;计算流体动力学&#xff08;CFD&#xff09…...

Prompt Optimizer

链接&#xff1a;https://pan.quark.cn/s/3d42e4512934Prompt Optimizer v2.2.1是一款开源AI提示词优化工具&#xff0c;致力于通过智能算法提升提示词质量&#xff0c;支持多模型集成和图像生成功能。它提供桌面应用、Docker部署等多种方式&#xff0c;帮助用户快速获得精准的…...

AI系统-7Pytorch数字识别实战及算子介绍

之前铺垫了神经网络的基础知识&#xff0c;这里使用编程工具Pytorch进行一个实战讲解。首先变成一个看得见、摸得着的程序和代码&#xff0c;然后再说后续怎么使用GPU/NPU硬件去优化。 本文主要参考ZOMI酱《AI系统》&#xff1a;https://chenzomi12.github.io/01Introduction/0…...

智慧生鲜配送:揭秘生鲜配送商城APP功能版块设计

在数字化消费浪潮中&#xff0c;生鲜配送商城APP成为居民采购食材的重要渠道。其功能版块设计聚焦用户需求&#xff0c;通过智能化、便捷化的操作体验&#xff0c;打造高效生鲜购物场景。以下揭秘其核心功能玩法&#xff0c;解析如何实现“从指尖到餐桌”的流畅服务。一、首页&…...

ai辅助开发:让快马生成智能助手,链接notepad下载与个性化代码推荐

今天想和大家分享一个有趣的实践&#xff1a;如何用AI辅助开发的方式&#xff0c;让Notepad这个老牌文本编辑器焕发新生。我们平时下载Notepad可能只是简单获取软件&#xff0c;但如果结合AI能力&#xff0c;就能把"下载-使用"的流程升级成"智能助手"体验。…...

从GigE Vision到千兆UDP:FPGA图像采集系统的灵活升级与10G MAC预留设计

从GigE Vision到千兆UDP&#xff1a;FPGA图像采集系统的灵活升级与10G MAC预留设计 在工业视觉和机器视觉领域&#xff0c;图像采集系统的带宽需求正以惊人的速度增长。随着4K、8K高分辨率相机的普及&#xff0c;以及多相机同步采集场景的增多&#xff0c;传统的千兆以太网接口…...

Verilog实战精要:从语法基础到高效状态机设计

1. Verilog语法基础&#xff1a;从硬件思维出发 第一次接触Verilog时&#xff0c;很多人会把它当成普通编程语言来学&#xff0c;结果发现处处碰壁。我当年在FPGA项目上栽的第一个跟头&#xff0c;就是把阻塞赋值用在了时钟触发的always块里&#xff0c;导致仿真结果和实际硬件…...