寒武纪MLU370部署deepseek r1
文章目录
- 前言
- 一、平台环境准备
- 二、模型下载
- 三、环境安装
- 四、代码修改
- 五、运行效果
前言
DeepSeek-R1拥有卓越的性能,在数学、代码和推理任务上可与OpenAI o1媲美。其采用的大规模强化学习技术,仅需少量标注数据即可显著提升模型性能,为大模型训练提供了新思路。此外,DeepSeek-R1构建了智能训练场,通过动态生成题目和实时验证解题过程等方式,提升模型推理能力。该模型完全开源,采用MIT许可协议,并开源了多个小型模型,进一步降低了AI应用门槛,赋能开源社区发展
一、平台环境准备
镜像选择:pytorch:v24.12-torch2.5.0-torchmlu1.24.0-ubuntu22.04-py310
卡选择:任意一款MLU3系列及以上卡
二、模型下载
apt install git-lfs
git-lfs clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B.git
三、环境安装
pip install transformers accelerate
四、代码修改
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch###+
import torch_mlu###+
import torch_mlu.utils.gpu_migration###+
model_name = "/workspace/volume/guojunceshi2/DeepSeek-R1-Distill-Qwen-14B"model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype=torch.float16,###+device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)prompt = "我只有3000元,帮我制定一份南京3天游"
messages = [{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)generated_ids = model.generate(**model_inputs,max_new_tokens=512
)
generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)
五、运行效果
/torch/venv3/pytorch/lib/python3.10/site-packages/torch_mlu/mlu/__init__.py:379: UserWarning: Linear memory is not supported on this device. Falling back to common memory. (Triggered internally at /torch_mlu/torch_mlu/csrc/framework/core/caching_allocator.cpp:718.)torch_mlu._MLUC._mlu_init()
[WARNING][/torch_mlu/torch_mlu/csrc/utils/version.cpp:133][operator()][process:22535][thread:140454997248896]: Cambricon NEUWARE minimum version requirements not met! Require DRIVER minimum verion is 6.2.8-1, but current version is 5.10.29-1
Loading checkpoint shards: 100%|█████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:13<00:00, 3.49s/it]
Setting `pad_token_id` to `eos_token_id`:151643 for open-end generation.
[2025-01-31 21:51:38.846151][CNNL][WARNING][22535][Card:0]: [cnnlGetReduceOpWorkspaceSize] is deprecated and will be removed in future release. Use [cnnlGetReduceOpWorkspaceSize_v2] instead.
[2025-01-31 21:51:38.846271][CNNL][WARNING][22535][Card:0]: [cnnlReduce] is deprecated and will be removed in future release. Use [cnnlReduce_v2] instead.
<think>
嗯,用户说他只有3000元,想让我帮他制定一份南京3天游的计划。首先,我得考虑他的预算情况,3000元在3天里怎么分配比较合理。通常,旅游费用包括交通、住宿、餐饮和景点门票,所以我要平衡这些部分。他可能是一个独自旅行或者和朋友一起,不太清楚南京有哪些必去的景点,所以需要推荐一些经典的地方。南京作为六朝古都,有很多历史文化景点,比如中山陵、夫子庙、秦淮河这些,都是不能错过的。交通方面,南京的地铁很方便,可以建议他买地铁一日票或者多日票,这样比较划算。另外,景点之间的距离可能有点远,所以交通费用需要考虑进去。住宿的话,3000元大概可以住三星级到四星级的酒店,或者选择经济型连锁酒店,这样每天大概1000元左右。可能的话,住在新街口或者夫子庙附近,交通便利,方便游玩。餐饮方面,南京的小吃很出名,比如盐水鸭、汤包等,预算要留出一部分来品尝当地美食。每顿饭大概控制在50-100元,这样3天下来餐饮费用大约500-800元。景点门票方面,中山陵免费,夫子庙免费,但有些景点可能需要门票,比如明孝陵、总统府等,这些加起来可能需要300-500元。接下来,我得安排每天的行程,尽量让行程紧凑但不过于劳累。第一天可以安排中山陵、明孝陵和紫金山天文台,这些地方都在紫金山附近,比较集中。第二天集中在老城区,夫子庙、秦淮河、南京博物馆,晚上可以去新街口和夫子庙附近逛逛。第三天安排总统府、南京大屠杀纪念馆和玄武湖公园,这样既有历史又有自然景观。还要考虑一些小贴士,比如交通卡的购买,景点的开放时间,以及当地的美食推荐。这样用户在旅行中会更方便。最后,检查一下总预算是否在3000元左右,可能需要做一些调整,比如住宿选择更便宜的选项,或者减少一些景点,但尽量让行程丰富又不超支。
</think>好的!以下是一个适合预算约3000元的南京3天游行程建议。南京是一个历史悠久的城市,既有丰富的历史文化景点,也有现代化的城市风光。以下是详细的行程安排:---### **第一天:历史文化之旅**
**交通预算**:约100元(地铁或公交)
**住宿预算**:约1000元(经济型酒店或青年旅舍)
**餐饮预算**:约300元#### 上午:
1. **中山陵**(免费) - 南京的标志性景点,民国建筑的代表,登顶可以俯瞰南京全景。- 建议早晨前往,避免人流过多。#### 下午:
2. **明孝陵**(门票:70元) - 明代皇家陵寝,世界文化遗产,建筑宏伟,适合拍照。- 建议参观祾恩殿和石像生。3. **紫金山天文台**(门票:20元) - 如果时间充裕,可以顺便参观,感受科学与历史的结合。#### 晚上:
4. **晚餐**:尝试南京特色美食,如盐水鸭、鸭血粉丝汤、小笼包等。推荐去新街口或夫子庙附近的餐厅。
5. **住宿**:建议住在夫子庙或新街口附近,方便第二天游玩。---### **第二天:古城与现代生活**
**交通预算**:约80元
**景点预算**:约100元
**餐饮预算**:约300元#### 上午:
1. **夫子庙秦淮风光带**(免费) - 漫步秦淮河畔,感受古都风情,可以租一只小船在河上漂流(约50元/小时)。- 推荐在夫子庙附近购买一些南京特产,如云锦、雨花石等。2. **南京博物馆**(免费) - 如果时间充裕,可以参观,了解南京的历史文化。#### 下午:
3. **总统府**(门票:80元) - 近代历史的重要遗址,建筑风格中西合璧,适合拍照。4. **鼓楼公园**(免费) - 如果时间允许,可以顺便逛逛,感受南京的慢生活。#### 晚上:
5. **新街口/夫子庙夜景** - 晚上可以在夫子庙附近散步,欣赏夜晚的秦淮河灯光秀。
6. **晚餐**:尝试南京火锅或烤肉,推荐“巷子深”或“南京大牌档”。---### **第三天:自然与休闲**
**交通预算**:约80元
**景点预算**:约100元
**餐饮预算**:约300元#### 上午:
1. **玄武湖公园**(免费) - 南京最大的城市公园,适合散步、骑行或划船。- 可以租一辆共享单车(约3元/小时)或租船游湖(约40元/小时)。2. **南京大屠杀纪念馆**(门票:免费) - 了解历史,感受和平的重要性。#### 下午:
3. **中山植物园**(门票:50元) - 如果时间充裕,可以顺便参观,感受自然与植物的美妙结合。#### 晚上:
4. **返程准备** - 根据返程时间,前往南京南站或机场,结束愉快的南京之旅。---### **总预算估算**:
- **交通**:约300元(包括市内交通和景点之间交通)
- **住宿**:约1000元
- **餐饮**:约900元
- **景点门票**:约500元
- **其他**:约200元(纪念品、小吃等)**总计**:约3000元---### **小贴士**:
1. 南京的地铁非常方便,可以购买地铁一日票(20元/人),覆盖大部分景点。
2. 南京的景点大多集中在主城区,步行或骑行即可。
3. 南京小吃种类繁多,记得尝试地道的盐水鸭和鸭血粉丝汤!希望这份行程能帮助你玩转南京,祝你旅途愉快!
/opt/py3.10/lib/python3.10/tempfile.py:860: ResourceWarning: Implicitly cleaning up <TemporaryDirectory '/tmp/tmp0sdoxr7m'>_warnings.warn(warn_message, ResourceWarning)
相关文章:
寒武纪MLU370部署deepseek r1
文章目录 前言一、平台环境准备二、模型下载三、环境安装四、代码修改五、运行效果 前言 DeepSeek-R1拥有卓越的性能,在数学、代码和推理任务上可与OpenAI o1媲美。其采用的大规模强化学习技术,仅需少量标注数据即可显著提升模型性能,为大模…...

Python NumPy(10):NumPy 统计函数
1 NumPy 统计函数 NumPy 提供了很多统计函数,用于从数组中查找最小元素,最大元素,百分位标准差和方差等。 1.1 numpy.amin() 和 numpy.amax() numpy.amin() 用于计算数组中的元素沿指定轴的最小值。 numpy.amin(a, axisNone, outNone, keep…...

Ubuntu下的Doxygen+VScode实现C/C++接口文档自动生成
Ubuntu下的DoxygenVScode实现C/C接口文档自动生成 Chapter1 Ubuntu下的DoxygenVScode实现C/C接口文档自动生成1、 Doxygen简介1. 安装Doxygen1)方法一:2)方法二:2. doxygen注释自动生成插件3. doxygen注释基本语法4. doxygen的生成…...
【字符串两大注意事项】
表达字符串的方式 1.双引号:"hello world" 2.字符指针:char* ptr "hello world" 3.字符数组:char arr[] "hello world"辨析 项目表示方式代表含义内存分布1“hello world”字符串字面量字符串常量就是数据…...
jmap命令详解
jmap 用于生成 heap dump 文件,如果不使用这个命令,还可以使用-XX:HeapDumpOnOutOfMemoryError参数来让虚拟机出现 OOM 的时候自动生成 dump 文件。 jmap 不仅可以生成 dump 文件,还可以查询finalize执行队列、Java 堆的详细信息,…...

微机原理与接口技术期末大作业——4位抢答器仿真
在微机原理与接口技术的学习旅程中,期末大作业成为了检验知识掌握程度与实践能力的关键环节。本次我选择设计并仿真一个 4 位抢答器系统,通过这个项目,深入探索 8086CPU 及其接口技术的实际应用。附完整压缩包下载。 一、系统设计思路 &…...
FOC核心原理的C语言实现
概述 应用FOC算法,比如无人机、电动汽车或工业电机控制。因此,除了理论,还需要提供实用的实现步骤、常见问题及解决方案,比如如何获取电机的位置信息(编码器或传感器),如何处理电流采样&#x…...

基于互联网+智慧水务信息化整体解决方案
智慧水务的概述与发展背景 智慧水务是基于互联网、云计算、大数据、物联网等先进技术,对水务行业的工程建设、生产管理、管网运营、营销服务及企业综合管理等业务进行全面智慧化管理的创新模式。它旨在解决水务企业分散经营、管理水平不高、投资不足等问题。 水务…...
【信息系统项目管理师-选择真题】2005下半年综合知识答案和详解
更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 【第1题】【第2题】【第3题】【第4题】【第5题】【第6题】【第7~8题】【第9~10题】【第11题】【第12题】【第13题】【第14题】【第15题】【第16题】【第17题】【第18题】【第19题】【第20题】【第21题】【第22题…...

计算机毕业设计Python+CNN卷积神经网络考研院校推荐系统 考研分数线预测 考研推荐系统 考研爬虫 考研大数据 Hadoop 大数据毕设 机器学习
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...
第十一章 F - H 开头的术语
文章目录 第十一章 F - H 开头的术语文件流 (file stream)最终类 (final class)最终方法 (final method)最终属性 (final property)外键 (foreign key)基础 (foundation) 以 G 开头的术语全局 (global)全局数据库 (globals database)全局目录 (global directory)全局唯一标识符…...

深度研究新范式:通过Ollama和DeepSeek R1实现自动化研究
引言 在信息时代,海量数据的产生与传播速度前所未有地加快,这既为研究者提供了丰富的资源,也带来了信息筛选与处理的巨大挑战。 传统研究方法往往依赖于研究者的个人知识库、文献检索技能以及时间投入,但面对指数级增长的数据量…...

深度学习的应用
目录 一、机器视觉 1.1 应用场景 1.2 常见的计算机视觉任务 1.2.1 图像分类 1.2.2 目标检测 1.2.3 图像分割 二、自然语言处理 三、推荐系统 3.1 常用的推荐系统算法实现方案 四、图像分类实验补充 4.1 CIFAR-100 数据集实验 实验代码 4.2 CIFAR-10 实验代码 深…...

基于51单片机和WS2812B彩色灯带的流水灯
目录 系列文章目录前言一、效果展示二、原理分析三、各模块代码四、主函数总结 系列文章目录 前言 用彩色灯带按自己想法DIY一条流水灯,谁不喜欢呢? 所用单片机:STC15W204S (也可以用其他1T单片机,例如,S…...
DFS(深度优先搜索)与回溯算法详解
DFS(深度优先搜索)与回溯算法详解 一、DFS 基础 1. 什么是DFS? 深度优先搜索(Depth-First Search,DFS)是一种用于遍历或搜索树或图的算法。其核心思想是: 一条路走到黑:从起点出发…...

服务器虚拟化技术详解与实战:架构、部署与优化
📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 引言 在现代 IT 基础架构中,服务器虚拟化已成为提高资源利用率、降低运维成本、提升系统灵活性的重要手段。通过服务…...

数据分析系列--②RapidMiner导入数据和存储过程
一、下载数据 二、导入数据 1. 在本地计算机中创建3个文件夹 2. 从本地选择.csv或.xlsx 三、界面说明 四、存储过程 1.保存 Congratulations, you are done. 一、下载数据 点击下载AssociationAnalysisData.xlsx数据集 二、导入数据 1. 在本地计算机中创建3个文件夹 2. 从…...

CSS 背景与边框:从基础到高级应用
CSS 背景与边框:从基础到高级应用 1. CSS 背景样式1.1 背景颜色示例代码:设置背景颜色 1.2 背景图像示例代码:设置背景图像 1.3 控制背景平铺行为示例代码:控制背景平铺 1.4 调整背景图像大小示例代码:调整背景图像大小…...

国内外人工智能AI工具网站大全(一键收藏,应有尽有)
本文由 大侠(AhcaoZhu)原创,转载请声明。 链接: https://blog.csdn.net/Ahcao2008 国内外人工智能AI工具网站大全(一键收藏,应有尽有) 摘要一、AI写作工具二、AI图像工具2.1、常用AI图像工具2.2、AI图片插画生成2.3、AI图片背景移…...
Java中初步使用websocket(springBoot版本)
一、什么是websocket WebSocket是一种在Web应用程序中实现实时双向通信的协议。它为浏览器和服务器之间提供了一种持久连接,在一个连接上可以双向传输数据。相比传统的HTTP协议,WebSocket具有更低的延迟和更高的效率。 WebSocket使用了类似于握手的方式来…...

Linux应用开发之网络套接字编程(实例篇)
服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …...

多云管理“拦路虎”:深入解析网络互联、身份同步与成本可视化的技术复杂度
一、引言:多云环境的技术复杂性本质 企业采用多云策略已从技术选型升维至生存刚需。当业务系统分散部署在多个云平台时,基础设施的技术债呈现指数级积累。网络连接、身份认证、成本管理这三大核心挑战相互嵌套:跨云网络构建数据…...
脑机新手指南(八):OpenBCI_GUI:从环境搭建到数据可视化(下)
一、数据处理与分析实战 (一)实时滤波与参数调整 基础滤波操作 60Hz 工频滤波:勾选界面右侧 “60Hz” 复选框,可有效抑制电网干扰(适用于北美地区,欧洲用户可调整为 50Hz)。 平滑处理&…...

【入坑系列】TiDB 强制索引在不同库下不生效问题
文章目录 背景SQL 优化情况线上SQL运行情况分析怀疑1:执行计划绑定问题?尝试:SHOW WARNINGS 查看警告探索 TiDB 的 USE_INDEX 写法Hint 不生效问题排查解决参考背景 项目中使用 TiDB 数据库,并对 SQL 进行优化了,添加了强制索引。 UAT 环境已经生效,但 PROD 环境强制索…...
在rocky linux 9.5上在线安装 docker
前面是指南,后面是日志 sudo dnf config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo sudo dnf install docker-ce docker-ce-cli containerd.io -y docker version sudo systemctl start docker sudo systemctl status docker …...

PL0语法,分析器实现!
简介 PL/0 是一种简单的编程语言,通常用于教学编译原理。它的语法结构清晰,功能包括常量定义、变量声明、过程(子程序)定义以及基本的控制结构(如条件语句和循环语句)。 PL/0 语法规范 PL/0 是一种教学用的小型编程语言,由 Niklaus Wirth 设计,用于展示编译原理的核…...
Device Mapper 机制
Device Mapper 机制详解 Device Mapper(简称 DM)是 Linux 内核中的一套通用块设备映射框架,为 LVM、加密磁盘、RAID 等提供底层支持。本文将详细介绍 Device Mapper 的原理、实现、内核配置、常用工具、操作测试流程,并配以详细的…...
《C++ 模板》
目录 函数模板 类模板 非类型模板参数 模板特化 函数模板特化 类模板的特化 模板,就像一个模具,里面可以将不同类型的材料做成一个形状,其分为函数模板和类模板。 函数模板 函数模板可以简化函数重载的代码。格式:templa…...

R语言速释制剂QBD解决方案之三
本文是《Quality by Design for ANDAs: An Example for Immediate-Release Dosage Forms》第一个处方的R语言解决方案。 第一个处方研究评估原料药粒径分布、MCC/Lactose比例、崩解剂用量对制剂CQAs的影响。 第二处方研究用于理解颗粒外加硬脂酸镁和滑石粉对片剂质量和可生产…...
IP如何挑?2025年海外专线IP如何购买?
你花了时间和预算买了IP,结果IP质量不佳,项目效率低下不说,还可能带来莫名的网络问题,是不是太闹心了?尤其是在面对海外专线IP时,到底怎么才能买到适合自己的呢?所以,挑IP绝对是个技…...