如何利用国内镜像从huggingface上下载项目
1、利用镜像快速下载项目
在huggingface上下载模型时速度太慢,可以用下面的方法
pip install -U huggingface_hub
pip install huggingface-cliexport HF_ENDPOINT=https://hf-mirror.comhuggingface-cli download --resume-download shenzhi-wang/Llama3-8B-Chinese-Chat --local-dir /root/autodl-tmp/models/Llama3-8B-Chinese-Chat1
--resume-download:即使某次下载中断,下次还能从上次下载的位置开始
--local-dir:将文件下载到特定本地目录的示例
2、利用git lfs在hugging上下载项目,大文件下载过程可视化
下载模型(本部分讲解如何使用git lfs设置显示进度)
1)先设置环境变量:GIT_LFS_SKIP_SMUDGE
在终端输入以下命令,将环境变量GIT_LFS_SKIP_SMUDGE设置为1:
这条命令允许在克隆时,跳过下载lfs文件。
export GIT_LFS_SKIP_SMUDGE=1
见下图
2)使用git lfs pull,实时看到进度条
此时再克隆仓库时就会跳过lfs文件,快速的完成clone步骤,在克隆项目前需要配置git lfs
git lfs install
git clone 网址
git lfs pull

参考:Git LFS 实时显示进度条:让大文件克隆与推送体验更美好
git lfs install 介绍:
当你首次在一个 Git 仓库中启用 Git LFS 时,需要运行 git lfs install 来配置 Git LFS。之后,你就可以使用
git lfs track 来指定哪些文件类型需要通过 Git LFS 来管理,并在提交时自动处理大文件
常见场景:
首次安装 Git LFS 时: 当你第一次在机器上安装 Git LFS 时,需要运行 git lfs install 来初始化配置。这是确保 Git LFS 正常工作的必要步骤。
克隆一个 Git LFS 仓库后: 如果你刚刚克隆了一个包含 LFS 文件的仓库,在开始操作之前,运行 git lfs install 可以确保钩子和配置是正确的。
配置 Git LFS 时: 在使用 Git LFS 之前,你必须首先运行 git lfs install 来确保 LFS 的各项配置已经准备好。
2.2.2 Embedding 模型的下载
下载方法类似于下载Qwen

这里需要注意的是:
我是想并行下载Embedding模型,所以又开了一个窗口,忽视了要再进行一次环境变量的设置,导致第一次是拉取失败(即在克隆项目时也在克隆lfs文件),重新设置环境变量就可以克隆项目与下载文件分离开
为什么每次都需要设置环境变量:
通常你只需要设置一次环境变量,它的作用会持续在当前的 shell会话中。但如果你每次打开一个新的终端窗口或者重新启动计算机,环境变量会丢失。因此,如果每次都需要手动设置它,可能是因为:
1)环境变量没有永久化: 环境变量 GIT_LFS_SKIP_SMUDGE=1 只在当前 shell会话中生效。如果每次都要重新设置,说明这个变量没有被持久化到系统配置中。
2)Shell 配置文件未修改: 如果你希望每次打开新的终端窗口时自动设置该环境变量,你需要将 export GIT_LFS_SKIP_SMUDGE=1 添加到你的 shell 配置文件(如 .bashrc、.bash_profile、.zshrc 等)中。
如何持久化环境变量:
为了避免每次手动设置,你可以将这行命令添加到你的 shell 配置文件中:
1、打开你的 shell 配置文件,例如:
1)对于 Bash:~/.bashrc 或 ~/.bash_profile
2)对于 Zsh:~/.zshrc
添加以下行:export GIT_LFS_SKIP_SMUDGE=1
3)保存文件并重载配置文件:
source ~/.bashrc# 对于 Bash
source ~/.zshrc# 对于 Zsh
这样,每次打开终端时,GIT_LFS_SKIP_SMUDGE=1 就会自动设置,而不需要手动配置。
2.2.3 Reranker 模型的下载
同上,见下图

相关文章:
如何利用国内镜像从huggingface上下载项目
1、利用镜像快速下载项目 在huggingface上下载模型时速度太慢,可以用下面的方法 pip install -U huggingface_hub pip install huggingface-cliexport HF_ENDPOINThttps://hf-mirror.comhuggingface-cli download --resume-download shenzhi-wang/Llama3-8B-Chine…...
pandas常用操作
pandas是Python中用于数据操作和分析的强大库。以下是一些常用的操作: ### 1. 读取数据 - **从CSV文件读取**: python import pandas as pd df pd.read_csv(path/to/file.csv) - **从Excel文件读取**: python df pd.read_exc…...
linux使用
文章目录 前言操作系统的作用组成二、安装linux系统安装VMware Workstation安装ubuntu图形化,命令行finalshell快照目录理解命令执行命令格式常用命令lscdmkdir 前言 本文讲解认识与使用linux操作系统 操作系统的作用 操作系统是用户和计算机的桥梁。比如我们输入…...
基于豆瓣2025电影数据可视化分析系统的设计与实现
✔️本项目旨在通过对豆瓣电影数据进行综合分析与可视化展示,构建一个基于Python的大数据可视化系统。通过数据爬取收集、清洗、分析豆瓣电影数据,我们提供了一个全面的电影信息平台,为用户提供深入了解电影产业趋势、影片评价与演员表现的工…...
基于Python的深度学习音乐推荐系统(有配套论文)
音乐推荐系统 提供实时音乐推荐功能,根据用户行为和偏好动态调整推荐内容 Python、Django、深度学习、卷积神经网络 、算法 数据库:MySQL 系统包含角色:管理员、用户 管理员功能:用户管理、系统设置、音乐管理、音乐推荐管理、系…...
远程计算机无conda情况下配置python虚拟环境
1. 按照正常流程,根据远程计算机的IP地址/用户名/密码,通过pycharm进行部署 部署流程为: pycharm主菜单--> 工具-->部署 -->配置 **注意,pycharm的远程部署必须是专业版 2. 配置远程python解释器 上图是配置SSH解释器的截图&…...
强化学习-价值学习算法
Sarsa 理论解释 Sarsa是基于时序差分算法的,它的公式非常简单且易理解,不像策略梯度算法那样需要复杂的推导过程。 Sarsa的核心函数是 Q ( s , a ) Q(s, a) Q(s,a),它的含义是在状态 s s s下执行 a a a,在后续轨迹中获取的期望…...
Golang深度学习
前言 在2009年,Google公司发布了一种新的编程语言,名为Go(或称为Golang),旨在提高编程效率、简化并发编程,并提供强大的标准库支持。Go语言的设计者们希望通过Go语言能够解决软件开发中的一些长期存在的问…...
基于推荐算法的在线课程推荐系统设计与实现
开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…...
es和kibana安装
es安装 安装 wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-8.17.1-linux-x86_64.tar.gz 参考: https://www.cnblogs.com/shamo89/p/18504053 https://blog.csdn.net/u012899618/article/details/130383429 解压 tar -zxvf elastic…...
本地部署Anything LLM+Ollama+DeepSeek R1打造AI智能知识库教程
文章目录 前言1. 本地部署OllamaDeepSeek2. 本地安装Anything LLM3. 配置与使用演示4. 远程调用大模型5. 安装内网穿透6. 配置固定公网地址 前言 本文主要介绍如何在Windows电脑上本地部署Ollama并接入DeepSeek R1大模型,然后使用强大的开源AI工具Anything LLM结合…...
zyNo.25
SSRF漏洞 在了解ssrf漏洞前先了解curl命令的使用 1.curl命令的使用 基本格式:curl<参数值>请求地址 get请求:curl http://127.0.0.1 post请求:curl -X POST -d "a1&b2" http://127.0.0.1/(其中,使用-X参…...
Spring框架基本使用(Maven详解)
前言: 当我们创建项目的时候,第一步少不了搭建环境的相关准备工作。 那么如果想让我们的项目做起来方便快捷,应该引入更多的管理工具,帮我们管理。 Maven的出现帮我们大大解决了管理的难题!! Maven…...
关于前后端分离跨域问题——使用DeepSeek分析查错
我前端使用ant design vue pro框架,后端使用kratos框架开发。因为之前也解决过跨域问题,正常是在后端的http请求中加入中间件,设置跨域需要通过的字段即可,代码如下所示: func NewHTTPServer(c *conf.Server, s *conf…...
三层渗透测试-DMZ区域 二三层设备区域
DMZ区域渗透 信息收集 首先先进行信息收集,这里我们可以选择多种的信息收集方式,例如nmap如此之类的,我的建议是,可以通过自己现有的手里小工具,例如无影,密探这种工具,进行一个信息收集。以免…...
领航Linux UDP:构建高效网络新纪元
欢迎来到 破晓的历程的 博客 ⛺️不负时光,不负己✈️ 文章目录 引言Udp和Tcp的异同相同点不同点总结 1.1、socket1.2、bind1.3、recvfrom1.4、sendto2.1、代码2.1、说明3.1、代码3.2、说明 引言 在前几篇博客中,我们学习了Linux网络编程中的一些概念。…...
基于MATLAB的均匀面阵MUSIC算法DOA估计仿真
基于MATLAB的均匀面阵MUSIC算法DOA估计仿真 文章目录 前言一、二维MUSIC算法原理二、二维MUSIC算法MATLAB仿真三、MATLAB源代码总结 前言 \;\;\;\;\; 在波达角估计算法中,MUSIC 算法与ESPRIT算法属于特征结构子空间算法,是波达角估计算法中的基石。在前面…...
HTML/CSS中后代选择器
1.作用:选中指定元素中,符合要求的后代元素. 2.语法:选择器1 选择器2 选择器3 ...... 选择器n(使用空格隔开) 3.举例: /* 选中ul中的所有li */ul li{color: red;}/* 选中类名为subject元素中的所有li */.subject li{color: blue;}/* 选中类名为subject元素中的所有类名为f…...
深入解析「卡顿帧堆栈」 | UWA GPM 2.0 技术细节与常见问题
在游戏开发过程中,卡顿问题一直是影响玩家体验的关键因素。UWA GPM 2.0全新推出的「卡顿帧堆栈」功能,专为研发团队提供精准、高效的卡顿分析方案,能够直观呈现游戏运行时的堆栈信息,助力团队迅速找到性能瓶颈。该功能一经上线&am…...
推荐几款较好的开源成熟框架
一. 若依: 1. 官方网站:https://doc.ruoyi.vip/ruoyi/ 2. 若依SpringBootVueElement 的后台管理系统:https://gitee.com/y_project/RuoYi-Vue 3. 若依SpringBootVueElement 的后台管理系统:https://gitee.com/y_project/RuoYi-Cl…...
Zotero重复文献合并插件:5分钟彻底清理重复条目的终极指南
Zotero重复文献合并插件:5分钟彻底清理重复条目的终极指南 【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为Zotero文献库中堆…...
CnOpenData 税收调查企业实用新型专利授权质量统计表
税收是支撑国家长期发展的根本基础。作为服务财税改革、加强财税管理的一项重要基础性工作,全国税收调查工作为税收政策制定提供了扎实的数据支撑;同时,它对于学者准确掌握税源情况、窥探经济发展形势起到重要作用。参与全国税收调查的企业分…...
遗传算法原理与Python实现详解
1. 遗传算法基础概念解析遗传算法(Genetic Algorithm)是一种模拟自然选择过程的优化算法,它通过模拟生物进化中的选择、交叉和变异机制来寻找最优解。这种算法特别适合解决复杂的非线性问题,在机器学习、工程优化和金融建模等领域都有广泛应用。我第一次…...
980 元入局!中小企业 AI 搜索获客轻量化方案
中小企业的线上获客,始终绕不开三大痛点:获客成本高企、专业技术门槛高、试错风险大。传统 SEM 投放单次点击成本动辄数十元,SEO 优化周期长达数月,而 AI 搜索时代的流量红利,又因技术壁垒难以触达。对于中小企业而言&…...
AI伦理困境:当你的代码可能被用于作恶时——一位软件测试工程师的视角与行动指南
从技术“守门人”到伦理“吹哨人”在传统的软件开发生命周期中,软件测试工程师的核心职责是保障软件的质量、功能与安全性,扮演着技术交付前的最后一道“守门人”。然而,随着人工智能技术的深度渗透,尤其是机器学习模型被集成到各…...
字体放大,导航栏按钮间隙变小
屏幕总宽度(固定不变) |<-------------------------------------------------->|旧方案(字体变大时崩): | margin |[back(变大)]| margin |[home(变大)]| margin |←固定px→ ←固定px→ …...
Hugging Face空格处理差异与NLP模型优化实践
1. 项目概述在自然语言处理领域,空格字符的处理看似简单却暗藏玄机。最近我在使用Hugging Face生态时,发现不同模型对空格字符的处理方式存在显著差异,这直接影响了文本预处理的效果和模型输出质量。本文将深入分析Hugging Face工具链中空格字…...
开源大语言模型应用可观测性平台OpenLIT:从原理到生产实践
1. 项目概述:一个开源大语言模型应用的可观测性平台最近在折腾大语言模型应用,从简单的聊天机器人到复杂的RAG系统,部署上线后总会遇到一堆头疼事:为什么用户的问题响应突然变慢了?是模型推理卡住了,还是向…...
AIGC如何重塑软件开发流程:从工具应用到流程再造
1. 项目概述:当开源社区遇上生成式AI最近在GitHub上闲逛,又看到了Phodal(左耳朵耗子)的新项目aigc。说实话,这个名字本身就充满了想象空间——AIGC,人工智能生成内容,这几乎是过去一年里技术圈最…...
TensorRT-LLM与Triton部署AI编程助手实战
1. 基于TensorRT-LLM和Triton的AI编程助手部署指南在当今软件开发领域,AI编程助手正迅速成为开发者日常工作的标配工具。根据行业预测,到2025年,80%的产品开发生命周期将使用生成式AI进行代码编写。本文将手把手教你如何利用NVIDIA TensorRT-…...
