寒武纪MLU370部署deepseek r1
文章目录
- 前言
- 一、平台环境准备
- 二、模型下载
- 三、环境安装
- 四、代码修改
- 五、运行效果
前言
DeepSeek-R1拥有卓越的性能,在数学、代码和推理任务上可与OpenAI o1媲美。其采用的大规模强化学习技术,仅需少量标注数据即可显著提升模型性能,为大模型训练提供了新思路。此外,DeepSeek-R1构建了智能训练场,通过动态生成题目和实时验证解题过程等方式,提升模型推理能力。该模型完全开源,采用MIT许可协议,并开源了多个小型模型,进一步降低了AI应用门槛,赋能开源社区发展
一、平台环境准备
镜像选择:pytorch:v24.12-torch2.5.0-torchmlu1.24.0-ubuntu22.04-py310
卡选择:任意一款MLU3系列及以上卡
二、模型下载
apt install git-lfs
git-lfs clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B.git
三、环境安装
pip install transformers accelerate
四、代码修改
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch###+
import torch_mlu###+
import torch_mlu.utils.gpu_migration###+
model_name = "/workspace/volume/guojunceshi2/DeepSeek-R1-Distill-Qwen-14B"model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype=torch.float16,###+device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)prompt = "我只有3000元,帮我制定一份南京3天游"
messages = [{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)generated_ids = model.generate(**model_inputs,max_new_tokens=512
)
generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)
五、运行效果
/torch/venv3/pytorch/lib/python3.10/site-packages/torch_mlu/mlu/__init__.py:379: UserWarning: Linear memory is not supported on this device. Falling back to common memory. (Triggered internally at /torch_mlu/torch_mlu/csrc/framework/core/caching_allocator.cpp:718.)torch_mlu._MLUC._mlu_init()
[WARNING][/torch_mlu/torch_mlu/csrc/utils/version.cpp:133][operator()][process:22535][thread:140454997248896]: Cambricon NEUWARE minimum version requirements not met! Require DRIVER minimum verion is 6.2.8-1, but current version is 5.10.29-1
Loading checkpoint shards: 100%|█████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:13<00:00, 3.49s/it]
Setting `pad_token_id` to `eos_token_id`:151643 for open-end generation.
[2025-01-31 21:51:38.846151][CNNL][WARNING][22535][Card:0]: [cnnlGetReduceOpWorkspaceSize] is deprecated and will be removed in future release. Use [cnnlGetReduceOpWorkspaceSize_v2] instead.
[2025-01-31 21:51:38.846271][CNNL][WARNING][22535][Card:0]: [cnnlReduce] is deprecated and will be removed in future release. Use [cnnlReduce_v2] instead.
<think>
嗯,用户说他只有3000元,想让我帮他制定一份南京3天游的计划。首先,我得考虑他的预算情况,3000元在3天里怎么分配比较合理。通常,旅游费用包括交通、住宿、餐饮和景点门票,所以我要平衡这些部分。他可能是一个独自旅行或者和朋友一起,不太清楚南京有哪些必去的景点,所以需要推荐一些经典的地方。南京作为六朝古都,有很多历史文化景点,比如中山陵、夫子庙、秦淮河这些,都是不能错过的。交通方面,南京的地铁很方便,可以建议他买地铁一日票或者多日票,这样比较划算。另外,景点之间的距离可能有点远,所以交通费用需要考虑进去。住宿的话,3000元大概可以住三星级到四星级的酒店,或者选择经济型连锁酒店,这样每天大概1000元左右。可能的话,住在新街口或者夫子庙附近,交通便利,方便游玩。餐饮方面,南京的小吃很出名,比如盐水鸭、汤包等,预算要留出一部分来品尝当地美食。每顿饭大概控制在50-100元,这样3天下来餐饮费用大约500-800元。景点门票方面,中山陵免费,夫子庙免费,但有些景点可能需要门票,比如明孝陵、总统府等,这些加起来可能需要300-500元。接下来,我得安排每天的行程,尽量让行程紧凑但不过于劳累。第一天可以安排中山陵、明孝陵和紫金山天文台,这些地方都在紫金山附近,比较集中。第二天集中在老城区,夫子庙、秦淮河、南京博物馆,晚上可以去新街口和夫子庙附近逛逛。第三天安排总统府、南京大屠杀纪念馆和玄武湖公园,这样既有历史又有自然景观。还要考虑一些小贴士,比如交通卡的购买,景点的开放时间,以及当地的美食推荐。这样用户在旅行中会更方便。最后,检查一下总预算是否在3000元左右,可能需要做一些调整,比如住宿选择更便宜的选项,或者减少一些景点,但尽量让行程丰富又不超支。
</think>好的!以下是一个适合预算约3000元的南京3天游行程建议。南京是一个历史悠久的城市,既有丰富的历史文化景点,也有现代化的城市风光。以下是详细的行程安排:---### **第一天:历史文化之旅**
**交通预算**:约100元(地铁或公交)
**住宿预算**:约1000元(经济型酒店或青年旅舍)
**餐饮预算**:约300元#### 上午:
1. **中山陵**(免费) - 南京的标志性景点,民国建筑的代表,登顶可以俯瞰南京全景。- 建议早晨前往,避免人流过多。#### 下午:
2. **明孝陵**(门票:70元) - 明代皇家陵寝,世界文化遗产,建筑宏伟,适合拍照。- 建议参观祾恩殿和石像生。3. **紫金山天文台**(门票:20元) - 如果时间充裕,可以顺便参观,感受科学与历史的结合。#### 晚上:
4. **晚餐**:尝试南京特色美食,如盐水鸭、鸭血粉丝汤、小笼包等。推荐去新街口或夫子庙附近的餐厅。
5. **住宿**:建议住在夫子庙或新街口附近,方便第二天游玩。---### **第二天:古城与现代生活**
**交通预算**:约80元
**景点预算**:约100元
**餐饮预算**:约300元#### 上午:
1. **夫子庙秦淮风光带**(免费) - 漫步秦淮河畔,感受古都风情,可以租一只小船在河上漂流(约50元/小时)。- 推荐在夫子庙附近购买一些南京特产,如云锦、雨花石等。2. **南京博物馆**(免费) - 如果时间充裕,可以参观,了解南京的历史文化。#### 下午:
3. **总统府**(门票:80元) - 近代历史的重要遗址,建筑风格中西合璧,适合拍照。4. **鼓楼公园**(免费) - 如果时间允许,可以顺便逛逛,感受南京的慢生活。#### 晚上:
5. **新街口/夫子庙夜景** - 晚上可以在夫子庙附近散步,欣赏夜晚的秦淮河灯光秀。
6. **晚餐**:尝试南京火锅或烤肉,推荐“巷子深”或“南京大牌档”。---### **第三天:自然与休闲**
**交通预算**:约80元
**景点预算**:约100元
**餐饮预算**:约300元#### 上午:
1. **玄武湖公园**(免费) - 南京最大的城市公园,适合散步、骑行或划船。- 可以租一辆共享单车(约3元/小时)或租船游湖(约40元/小时)。2. **南京大屠杀纪念馆**(门票:免费) - 了解历史,感受和平的重要性。#### 下午:
3. **中山植物园**(门票:50元) - 如果时间充裕,可以顺便参观,感受自然与植物的美妙结合。#### 晚上:
4. **返程准备** - 根据返程时间,前往南京南站或机场,结束愉快的南京之旅。---### **总预算估算**:
- **交通**:约300元(包括市内交通和景点之间交通)
- **住宿**:约1000元
- **餐饮**:约900元
- **景点门票**:约500元
- **其他**:约200元(纪念品、小吃等)**总计**:约3000元---### **小贴士**:
1. 南京的地铁非常方便,可以购买地铁一日票(20元/人),覆盖大部分景点。
2. 南京的景点大多集中在主城区,步行或骑行即可。
3. 南京小吃种类繁多,记得尝试地道的盐水鸭和鸭血粉丝汤!希望这份行程能帮助你玩转南京,祝你旅途愉快!
/opt/py3.10/lib/python3.10/tempfile.py:860: ResourceWarning: Implicitly cleaning up <TemporaryDirectory '/tmp/tmp0sdoxr7m'>_warnings.warn(warn_message, ResourceWarning)
相关文章:

寒武纪MLU370部署deepseek r1
文章目录 前言一、平台环境准备二、模型下载三、环境安装四、代码修改五、运行效果 前言 DeepSeek-R1拥有卓越的性能,在数学、代码和推理任务上可与OpenAI o1媲美。其采用的大规模强化学习技术,仅需少量标注数据即可显著提升模型性能,为大模…...

Python NumPy(10):NumPy 统计函数
1 NumPy 统计函数 NumPy 提供了很多统计函数,用于从数组中查找最小元素,最大元素,百分位标准差和方差等。 1.1 numpy.amin() 和 numpy.amax() numpy.amin() 用于计算数组中的元素沿指定轴的最小值。 numpy.amin(a, axisNone, outNone, keep…...

Ubuntu下的Doxygen+VScode实现C/C++接口文档自动生成
Ubuntu下的DoxygenVScode实现C/C接口文档自动生成 Chapter1 Ubuntu下的DoxygenVScode实现C/C接口文档自动生成1、 Doxygen简介1. 安装Doxygen1)方法一:2)方法二:2. doxygen注释自动生成插件3. doxygen注释基本语法4. doxygen的生成…...

【字符串两大注意事项】
表达字符串的方式 1.双引号:"hello world" 2.字符指针:char* ptr "hello world" 3.字符数组:char arr[] "hello world"辨析 项目表示方式代表含义内存分布1“hello world”字符串字面量字符串常量就是数据…...

jmap命令详解
jmap 用于生成 heap dump 文件,如果不使用这个命令,还可以使用-XX:HeapDumpOnOutOfMemoryError参数来让虚拟机出现 OOM 的时候自动生成 dump 文件。 jmap 不仅可以生成 dump 文件,还可以查询finalize执行队列、Java 堆的详细信息,…...

微机原理与接口技术期末大作业——4位抢答器仿真
在微机原理与接口技术的学习旅程中,期末大作业成为了检验知识掌握程度与实践能力的关键环节。本次我选择设计并仿真一个 4 位抢答器系统,通过这个项目,深入探索 8086CPU 及其接口技术的实际应用。附完整压缩包下载。 一、系统设计思路 &…...

FOC核心原理的C语言实现
概述 应用FOC算法,比如无人机、电动汽车或工业电机控制。因此,除了理论,还需要提供实用的实现步骤、常见问题及解决方案,比如如何获取电机的位置信息(编码器或传感器),如何处理电流采样&#x…...

基于互联网+智慧水务信息化整体解决方案
智慧水务的概述与发展背景 智慧水务是基于互联网、云计算、大数据、物联网等先进技术,对水务行业的工程建设、生产管理、管网运营、营销服务及企业综合管理等业务进行全面智慧化管理的创新模式。它旨在解决水务企业分散经营、管理水平不高、投资不足等问题。 水务…...

【信息系统项目管理师-选择真题】2005下半年综合知识答案和详解
更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 【第1题】【第2题】【第3题】【第4题】【第5题】【第6题】【第7~8题】【第9~10题】【第11题】【第12题】【第13题】【第14题】【第15题】【第16题】【第17题】【第18题】【第19题】【第20题】【第21题】【第22题…...

计算机毕业设计Python+CNN卷积神经网络考研院校推荐系统 考研分数线预测 考研推荐系统 考研爬虫 考研大数据 Hadoop 大数据毕设 机器学习
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...

第十一章 F - H 开头的术语
文章目录 第十一章 F - H 开头的术语文件流 (file stream)最终类 (final class)最终方法 (final method)最终属性 (final property)外键 (foreign key)基础 (foundation) 以 G 开头的术语全局 (global)全局数据库 (globals database)全局目录 (global directory)全局唯一标识符…...

深度研究新范式:通过Ollama和DeepSeek R1实现自动化研究
引言 在信息时代,海量数据的产生与传播速度前所未有地加快,这既为研究者提供了丰富的资源,也带来了信息筛选与处理的巨大挑战。 传统研究方法往往依赖于研究者的个人知识库、文献检索技能以及时间投入,但面对指数级增长的数据量…...

深度学习的应用
目录 一、机器视觉 1.1 应用场景 1.2 常见的计算机视觉任务 1.2.1 图像分类 1.2.2 目标检测 1.2.3 图像分割 二、自然语言处理 三、推荐系统 3.1 常用的推荐系统算法实现方案 四、图像分类实验补充 4.1 CIFAR-100 数据集实验 实验代码 4.2 CIFAR-10 实验代码 深…...

基于51单片机和WS2812B彩色灯带的流水灯
目录 系列文章目录前言一、效果展示二、原理分析三、各模块代码四、主函数总结 系列文章目录 前言 用彩色灯带按自己想法DIY一条流水灯,谁不喜欢呢? 所用单片机:STC15W204S (也可以用其他1T单片机,例如,S…...

DFS(深度优先搜索)与回溯算法详解
DFS(深度优先搜索)与回溯算法详解 一、DFS 基础 1. 什么是DFS? 深度优先搜索(Depth-First Search,DFS)是一种用于遍历或搜索树或图的算法。其核心思想是: 一条路走到黑:从起点出发…...

服务器虚拟化技术详解与实战:架构、部署与优化
📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 引言 在现代 IT 基础架构中,服务器虚拟化已成为提高资源利用率、降低运维成本、提升系统灵活性的重要手段。通过服务…...

数据分析系列--②RapidMiner导入数据和存储过程
一、下载数据 二、导入数据 1. 在本地计算机中创建3个文件夹 2. 从本地选择.csv或.xlsx 三、界面说明 四、存储过程 1.保存 Congratulations, you are done. 一、下载数据 点击下载AssociationAnalysisData.xlsx数据集 二、导入数据 1. 在本地计算机中创建3个文件夹 2. 从…...

CSS 背景与边框:从基础到高级应用
CSS 背景与边框:从基础到高级应用 1. CSS 背景样式1.1 背景颜色示例代码:设置背景颜色 1.2 背景图像示例代码:设置背景图像 1.3 控制背景平铺行为示例代码:控制背景平铺 1.4 调整背景图像大小示例代码:调整背景图像大小…...

国内外人工智能AI工具网站大全(一键收藏,应有尽有)
本文由 大侠(AhcaoZhu)原创,转载请声明。 链接: https://blog.csdn.net/Ahcao2008 国内外人工智能AI工具网站大全(一键收藏,应有尽有) 摘要一、AI写作工具二、AI图像工具2.1、常用AI图像工具2.2、AI图片插画生成2.3、AI图片背景移…...

Java中初步使用websocket(springBoot版本)
一、什么是websocket WebSocket是一种在Web应用程序中实现实时双向通信的协议。它为浏览器和服务器之间提供了一种持久连接,在一个连接上可以双向传输数据。相比传统的HTTP协议,WebSocket具有更低的延迟和更高的效率。 WebSocket使用了类似于握手的方式来…...

2025年大年初一篇,C#调用GPU并行计算推荐
C#调用GPU库的主要目的是利用GPU的并行计算能力,加速计算密集型任务,提高程序性能,支持大规模数据处理,优化资源利用,满足特定应用场景的需求,并提升用户体验。在需要处理大量并行数据或进行复杂计算的场景…...

K8S ReplicaSet 控制器
一、理论介绍 今天我们来实验 ReplicaSet 控制器(也叫工作负载)。官网描述如下: 1、是什么? ReplicaSet 副本集, 维护一组稳定的副本 Pod 集合。 2、为什么需要? 解决 pod 被删除了,不能自我恢…...

FreeRTOS学习 --- 任务调度
开启任务调度器 作用:用于启动任务调度器,任务调度器启动后, FreeRTOS 便会开始进行任务调度 该函数内部实现,如下: 1、创建空闲任务(优先级最低) 2、如果使能软件定时器,则创建定…...

【小鱼闪闪】单片机开发工具——米思齐软件下载安装(图文)
浏览器打开网址 mixly.org, 在软件平台选择mixly离线版。 最新版本为3.0,会支持audinio, ESP32、ESP8266 , 可以选择下载安装器或者完整版。 这里选择下载安装器,下载后运行“一键更新.bat”,即可自动下载最新版本的M…...

MFC开发,给对话框添加垂直滚动条并解决鼠标滚动响应的问题
无论在使用QT或者MFC进行界面开发时,都会出现在一个对话框里面存在好多的选项,导致对话框变得非常长或者非常大,就会显现的不美观,在这种情况下通常是添加一个页面的滚动条来解决这个问题,下面我们就来介绍给MFC的对话…...

动态规划DP 最长上升子序列模型 导弹防御模型(题目分析+C++完整代码实现)
概览检索 动态规划DP 最长上升子序列模型 导弹防御系统 原题链接 AcWiing 187. 导弹防御系统 题目描述 为了对抗附近恶意国家的威胁,R国更新了他们的导弹防御系统。 一套防御系统的导弹拦截高度要么一直 严格单调 上升要么一直 严格单调 下降。 例如࿰…...

LevelDB 源码阅读:写入键值的工程实现和优化细节
读、写键值是 KV 数据库中最重要的两个操作,LevelDB 中提供了一个 Put 接口,用于写入键值对。使用方法很简单: leveldb::Status status leveldb::DB::Open(options, "./db", &db); status db->Put(leveldb::WriteOptions…...

药店药品销售管理系统的设计与实现
标题:药店药品销售管理系统的设计与实现 内容:1.摘要 摘要:本文介绍了药店药品销售管理系统的设计与实现。该系统旨在提高药店的运营效率和管理水平,通过信息化手段实现药品销售、库存管理、财务管理等功能。本文详细阐述了系统的需求分析、设计思路、技…...

人格分裂(交互问答)-小白想懂Elasticsearch
通过交互式追问了解一个中间件 ? 啥是Elasticsearch ! 分布式搜索和分析引擎 ? 为啥是分布式搜索,单体难道用不了吗 ? 实际上是说这个东西可以分布式部署 ! 单机可用但扩展性差,分布式通过分片、副本和负载均衡实现海量数据存储与高并发处理 ? 提…...

【论文投稿-第八届智能制造与自动化学术会议(IMA 2025)】HTML, CSS, JavaScript:三者的联系与区别
大会官网:www.icamima.org 目录 前言 一、HTML(超文本标记语言):网页的骨架 HTML 的作用: 例子: 总结: 二、CSS(层叠样式表):网页的外观设计 CSS 的…...