寒武纪MLU370部署deepseek r1
文章目录
- 前言
- 一、平台环境准备
- 二、模型下载
- 三、环境安装
- 四、代码修改
- 五、运行效果
前言
DeepSeek-R1拥有卓越的性能,在数学、代码和推理任务上可与OpenAI o1媲美。其采用的大规模强化学习技术,仅需少量标注数据即可显著提升模型性能,为大模型训练提供了新思路。此外,DeepSeek-R1构建了智能训练场,通过动态生成题目和实时验证解题过程等方式,提升模型推理能力。该模型完全开源,采用MIT许可协议,并开源了多个小型模型,进一步降低了AI应用门槛,赋能开源社区发展
一、平台环境准备
镜像选择:pytorch:v24.12-torch2.5.0-torchmlu1.24.0-ubuntu22.04-py310
卡选择:任意一款MLU3系列及以上卡
二、模型下载
apt install git-lfs
git-lfs clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B.git
三、环境安装
pip install transformers accelerate
四、代码修改
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch###+
import torch_mlu###+
import torch_mlu.utils.gpu_migration###+
model_name = "/workspace/volume/guojunceshi2/DeepSeek-R1-Distill-Qwen-14B"model = AutoModelForCausalLM.from_pretrained(model_name,torch_dtype=torch.float16,###+device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)prompt = "我只有3000元,帮我制定一份南京3天游"
messages = [{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)generated_ids = model.generate(**model_inputs,max_new_tokens=512
)
generated_ids = [output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)
五、运行效果
/torch/venv3/pytorch/lib/python3.10/site-packages/torch_mlu/mlu/__init__.py:379: UserWarning: Linear memory is not supported on this device. Falling back to common memory. (Triggered internally at /torch_mlu/torch_mlu/csrc/framework/core/caching_allocator.cpp:718.)torch_mlu._MLUC._mlu_init()
[WARNING][/torch_mlu/torch_mlu/csrc/utils/version.cpp:133][operator()][process:22535][thread:140454997248896]: Cambricon NEUWARE minimum version requirements not met! Require DRIVER minimum verion is 6.2.8-1, but current version is 5.10.29-1
Loading checkpoint shards: 100%|█████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:13<00:00, 3.49s/it]
Setting `pad_token_id` to `eos_token_id`:151643 for open-end generation.
[2025-01-31 21:51:38.846151][CNNL][WARNING][22535][Card:0]: [cnnlGetReduceOpWorkspaceSize] is deprecated and will be removed in future release. Use [cnnlGetReduceOpWorkspaceSize_v2] instead.
[2025-01-31 21:51:38.846271][CNNL][WARNING][22535][Card:0]: [cnnlReduce] is deprecated and will be removed in future release. Use [cnnlReduce_v2] instead.
<think>
嗯,用户说他只有3000元,想让我帮他制定一份南京3天游的计划。首先,我得考虑他的预算情况,3000元在3天里怎么分配比较合理。通常,旅游费用包括交通、住宿、餐饮和景点门票,所以我要平衡这些部分。他可能是一个独自旅行或者和朋友一起,不太清楚南京有哪些必去的景点,所以需要推荐一些经典的地方。南京作为六朝古都,有很多历史文化景点,比如中山陵、夫子庙、秦淮河这些,都是不能错过的。交通方面,南京的地铁很方便,可以建议他买地铁一日票或者多日票,这样比较划算。另外,景点之间的距离可能有点远,所以交通费用需要考虑进去。住宿的话,3000元大概可以住三星级到四星级的酒店,或者选择经济型连锁酒店,这样每天大概1000元左右。可能的话,住在新街口或者夫子庙附近,交通便利,方便游玩。餐饮方面,南京的小吃很出名,比如盐水鸭、汤包等,预算要留出一部分来品尝当地美食。每顿饭大概控制在50-100元,这样3天下来餐饮费用大约500-800元。景点门票方面,中山陵免费,夫子庙免费,但有些景点可能需要门票,比如明孝陵、总统府等,这些加起来可能需要300-500元。接下来,我得安排每天的行程,尽量让行程紧凑但不过于劳累。第一天可以安排中山陵、明孝陵和紫金山天文台,这些地方都在紫金山附近,比较集中。第二天集中在老城区,夫子庙、秦淮河、南京博物馆,晚上可以去新街口和夫子庙附近逛逛。第三天安排总统府、南京大屠杀纪念馆和玄武湖公园,这样既有历史又有自然景观。还要考虑一些小贴士,比如交通卡的购买,景点的开放时间,以及当地的美食推荐。这样用户在旅行中会更方便。最后,检查一下总预算是否在3000元左右,可能需要做一些调整,比如住宿选择更便宜的选项,或者减少一些景点,但尽量让行程丰富又不超支。
</think>好的!以下是一个适合预算约3000元的南京3天游行程建议。南京是一个历史悠久的城市,既有丰富的历史文化景点,也有现代化的城市风光。以下是详细的行程安排:---### **第一天:历史文化之旅**
**交通预算**:约100元(地铁或公交)
**住宿预算**:约1000元(经济型酒店或青年旅舍)
**餐饮预算**:约300元#### 上午:
1. **中山陵**(免费) - 南京的标志性景点,民国建筑的代表,登顶可以俯瞰南京全景。- 建议早晨前往,避免人流过多。#### 下午:
2. **明孝陵**(门票:70元) - 明代皇家陵寝,世界文化遗产,建筑宏伟,适合拍照。- 建议参观祾恩殿和石像生。3. **紫金山天文台**(门票:20元) - 如果时间充裕,可以顺便参观,感受科学与历史的结合。#### 晚上:
4. **晚餐**:尝试南京特色美食,如盐水鸭、鸭血粉丝汤、小笼包等。推荐去新街口或夫子庙附近的餐厅。
5. **住宿**:建议住在夫子庙或新街口附近,方便第二天游玩。---### **第二天:古城与现代生活**
**交通预算**:约80元
**景点预算**:约100元
**餐饮预算**:约300元#### 上午:
1. **夫子庙秦淮风光带**(免费) - 漫步秦淮河畔,感受古都风情,可以租一只小船在河上漂流(约50元/小时)。- 推荐在夫子庙附近购买一些南京特产,如云锦、雨花石等。2. **南京博物馆**(免费) - 如果时间充裕,可以参观,了解南京的历史文化。#### 下午:
3. **总统府**(门票:80元) - 近代历史的重要遗址,建筑风格中西合璧,适合拍照。4. **鼓楼公园**(免费) - 如果时间允许,可以顺便逛逛,感受南京的慢生活。#### 晚上:
5. **新街口/夫子庙夜景** - 晚上可以在夫子庙附近散步,欣赏夜晚的秦淮河灯光秀。
6. **晚餐**:尝试南京火锅或烤肉,推荐“巷子深”或“南京大牌档”。---### **第三天:自然与休闲**
**交通预算**:约80元
**景点预算**:约100元
**餐饮预算**:约300元#### 上午:
1. **玄武湖公园**(免费) - 南京最大的城市公园,适合散步、骑行或划船。- 可以租一辆共享单车(约3元/小时)或租船游湖(约40元/小时)。2. **南京大屠杀纪念馆**(门票:免费) - 了解历史,感受和平的重要性。#### 下午:
3. **中山植物园**(门票:50元) - 如果时间充裕,可以顺便参观,感受自然与植物的美妙结合。#### 晚上:
4. **返程准备** - 根据返程时间,前往南京南站或机场,结束愉快的南京之旅。---### **总预算估算**:
- **交通**:约300元(包括市内交通和景点之间交通)
- **住宿**:约1000元
- **餐饮**:约900元
- **景点门票**:约500元
- **其他**:约200元(纪念品、小吃等)**总计**:约3000元---### **小贴士**:
1. 南京的地铁非常方便,可以购买地铁一日票(20元/人),覆盖大部分景点。
2. 南京的景点大多集中在主城区,步行或骑行即可。
3. 南京小吃种类繁多,记得尝试地道的盐水鸭和鸭血粉丝汤!希望这份行程能帮助你玩转南京,祝你旅途愉快!
/opt/py3.10/lib/python3.10/tempfile.py:860: ResourceWarning: Implicitly cleaning up <TemporaryDirectory '/tmp/tmp0sdoxr7m'>_warnings.warn(warn_message, ResourceWarning)
相关文章:
寒武纪MLU370部署deepseek r1
文章目录 前言一、平台环境准备二、模型下载三、环境安装四、代码修改五、运行效果 前言 DeepSeek-R1拥有卓越的性能,在数学、代码和推理任务上可与OpenAI o1媲美。其采用的大规模强化学习技术,仅需少量标注数据即可显著提升模型性能,为大模…...
Python NumPy(10):NumPy 统计函数
1 NumPy 统计函数 NumPy 提供了很多统计函数,用于从数组中查找最小元素,最大元素,百分位标准差和方差等。 1.1 numpy.amin() 和 numpy.amax() numpy.amin() 用于计算数组中的元素沿指定轴的最小值。 numpy.amin(a, axisNone, outNone, keep…...
Ubuntu下的Doxygen+VScode实现C/C++接口文档自动生成
Ubuntu下的DoxygenVScode实现C/C接口文档自动生成 Chapter1 Ubuntu下的DoxygenVScode实现C/C接口文档自动生成1、 Doxygen简介1. 安装Doxygen1)方法一:2)方法二:2. doxygen注释自动生成插件3. doxygen注释基本语法4. doxygen的生成…...
【字符串两大注意事项】
表达字符串的方式 1.双引号:"hello world" 2.字符指针:char* ptr "hello world" 3.字符数组:char arr[] "hello world"辨析 项目表示方式代表含义内存分布1“hello world”字符串字面量字符串常量就是数据…...
jmap命令详解
jmap 用于生成 heap dump 文件,如果不使用这个命令,还可以使用-XX:HeapDumpOnOutOfMemoryError参数来让虚拟机出现 OOM 的时候自动生成 dump 文件。 jmap 不仅可以生成 dump 文件,还可以查询finalize执行队列、Java 堆的详细信息,…...
微机原理与接口技术期末大作业——4位抢答器仿真
在微机原理与接口技术的学习旅程中,期末大作业成为了检验知识掌握程度与实践能力的关键环节。本次我选择设计并仿真一个 4 位抢答器系统,通过这个项目,深入探索 8086CPU 及其接口技术的实际应用。附完整压缩包下载。 一、系统设计思路 &…...
FOC核心原理的C语言实现
概述 应用FOC算法,比如无人机、电动汽车或工业电机控制。因此,除了理论,还需要提供实用的实现步骤、常见问题及解决方案,比如如何获取电机的位置信息(编码器或传感器),如何处理电流采样&#x…...
基于互联网+智慧水务信息化整体解决方案
智慧水务的概述与发展背景 智慧水务是基于互联网、云计算、大数据、物联网等先进技术,对水务行业的工程建设、生产管理、管网运营、营销服务及企业综合管理等业务进行全面智慧化管理的创新模式。它旨在解决水务企业分散经营、管理水平不高、投资不足等问题。 水务…...
【信息系统项目管理师-选择真题】2005下半年综合知识答案和详解
更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 【第1题】【第2题】【第3题】【第4题】【第5题】【第6题】【第7~8题】【第9~10题】【第11题】【第12题】【第13题】【第14题】【第15题】【第16题】【第17题】【第18题】【第19题】【第20题】【第21题】【第22题…...
计算机毕业设计Python+CNN卷积神经网络考研院校推荐系统 考研分数线预测 考研推荐系统 考研爬虫 考研大数据 Hadoop 大数据毕设 机器学习
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...
第十一章 F - H 开头的术语
文章目录 第十一章 F - H 开头的术语文件流 (file stream)最终类 (final class)最终方法 (final method)最终属性 (final property)外键 (foreign key)基础 (foundation) 以 G 开头的术语全局 (global)全局数据库 (globals database)全局目录 (global directory)全局唯一标识符…...
深度研究新范式:通过Ollama和DeepSeek R1实现自动化研究
引言 在信息时代,海量数据的产生与传播速度前所未有地加快,这既为研究者提供了丰富的资源,也带来了信息筛选与处理的巨大挑战。 传统研究方法往往依赖于研究者的个人知识库、文献检索技能以及时间投入,但面对指数级增长的数据量…...
深度学习的应用
目录 一、机器视觉 1.1 应用场景 1.2 常见的计算机视觉任务 1.2.1 图像分类 1.2.2 目标检测 1.2.3 图像分割 二、自然语言处理 三、推荐系统 3.1 常用的推荐系统算法实现方案 四、图像分类实验补充 4.1 CIFAR-100 数据集实验 实验代码 4.2 CIFAR-10 实验代码 深…...
基于51单片机和WS2812B彩色灯带的流水灯
目录 系列文章目录前言一、效果展示二、原理分析三、各模块代码四、主函数总结 系列文章目录 前言 用彩色灯带按自己想法DIY一条流水灯,谁不喜欢呢? 所用单片机:STC15W204S (也可以用其他1T单片机,例如,S…...
DFS(深度优先搜索)与回溯算法详解
DFS(深度优先搜索)与回溯算法详解 一、DFS 基础 1. 什么是DFS? 深度优先搜索(Depth-First Search,DFS)是一种用于遍历或搜索树或图的算法。其核心思想是: 一条路走到黑:从起点出发…...
服务器虚拟化技术详解与实战:架构、部署与优化
📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 引言 在现代 IT 基础架构中,服务器虚拟化已成为提高资源利用率、降低运维成本、提升系统灵活性的重要手段。通过服务…...
数据分析系列--②RapidMiner导入数据和存储过程
一、下载数据 二、导入数据 1. 在本地计算机中创建3个文件夹 2. 从本地选择.csv或.xlsx 三、界面说明 四、存储过程 1.保存 Congratulations, you are done. 一、下载数据 点击下载AssociationAnalysisData.xlsx数据集 二、导入数据 1. 在本地计算机中创建3个文件夹 2. 从…...
CSS 背景与边框:从基础到高级应用
CSS 背景与边框:从基础到高级应用 1. CSS 背景样式1.1 背景颜色示例代码:设置背景颜色 1.2 背景图像示例代码:设置背景图像 1.3 控制背景平铺行为示例代码:控制背景平铺 1.4 调整背景图像大小示例代码:调整背景图像大小…...
国内外人工智能AI工具网站大全(一键收藏,应有尽有)
本文由 大侠(AhcaoZhu)原创,转载请声明。 链接: https://blog.csdn.net/Ahcao2008 国内外人工智能AI工具网站大全(一键收藏,应有尽有) 摘要一、AI写作工具二、AI图像工具2.1、常用AI图像工具2.2、AI图片插画生成2.3、AI图片背景移…...
Java中初步使用websocket(springBoot版本)
一、什么是websocket WebSocket是一种在Web应用程序中实现实时双向通信的协议。它为浏览器和服务器之间提供了一种持久连接,在一个连接上可以双向传输数据。相比传统的HTTP协议,WebSocket具有更低的延迟和更高的效率。 WebSocket使用了类似于握手的方式来…...
【Linux】shell脚本忽略错误继续执行
在 shell 脚本中,可以使用 set -e 命令来设置脚本在遇到错误时退出执行。如果你希望脚本忽略错误并继续执行,可以在脚本开头添加 set e 命令来取消该设置。 举例1 #!/bin/bash# 取消 set -e 的设置 set e# 执行命令,并忽略错误 rm somefile…...
练习(含atoi的模拟实现,自定义类型等练习)
一、结构体大小的计算及位段 (结构体大小计算及位段 详解请看:自定义类型:结构体进阶-CSDN博客) 1.在32位系统环境,编译选项为4字节对齐,那么sizeof(A)和sizeof(B)是多少? #pragma pack(4)st…...
STM32F4基本定时器使用和原理详解
STM32F4基本定时器使用和原理详解 前言如何确定定时器挂载在哪条时钟线上配置及使用方法参数配置PrescalerCounter ModeCounter Periodauto-reload preloadTrigger Event Selection 中断配置生成的代码及使用方法初始化代码基本定时器触发DCA或者ADC的代码讲解中断代码定时启动…...
2.Vue编写一个app
1.src中重要的组成 1.1main.ts // 引入createApp用于创建应用 import { createApp } from "vue"; // 引用App根组件 import App from ./App.vue;createApp(App).mount(#app)1.2 App.vue 其中要写三种标签 <template> <!--html--> </template>…...
在 Nginx Stream 层“改写”MQTT ngx_stream_mqtt_filter_module
1、为什么要修改 CONNECT 报文? 多租户隔离:自动为接入设备追加租户前缀,后端按 ClientID 拆分队列。零代码鉴权:将入站用户名替换为 OAuth Access-Token,后端 Broker 统一校验。灰度发布:根据 IP/地理位写…...
【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力
引言: 在人工智能快速发展的浪潮中,快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型(LLM)。该模型代表着该领域的重大突破,通过独特方式融合思考与非思考…...
return this;返回的是谁
一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请,不同级别的经理有不同的审批权限: // 抽象处理者:审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...
AI+无人机如何守护濒危物种?YOLOv8实现95%精准识别
【导读】 野生动物监测在理解和保护生态系统中发挥着至关重要的作用。然而,传统的野生动物观察方法往往耗时耗力、成本高昂且范围有限。无人机的出现为野生动物监测提供了有前景的替代方案,能够实现大范围覆盖并远程采集数据。尽管具备这些优势…...
GO协程(Goroutine)问题总结
在使用Go语言来编写代码时,遇到的一些问题总结一下 [参考文档]:https://www.topgoer.com/%E5%B9%B6%E5%8F%91%E7%BC%96%E7%A8%8B/goroutine.html 1. main()函数默认的Goroutine 场景再现: 今天在看到这个教程的时候,在自己的电…...
【从零开始学习JVM | 第四篇】类加载器和双亲委派机制(高频面试题)
前言: 双亲委派机制对于面试这块来说非常重要,在实际开发中也是经常遇见需要打破双亲委派的需求,今天我们一起来探索一下什么是双亲委派机制,在此之前我们先介绍一下类的加载器。 目录 编辑 前言: 类加载器 1. …...
