当前位置: 首页 > article >正文

Cosmos-Reason1-7B智能体(Agent)开发入门:构建你的第一个AI助手

Cosmos-Reason1-7B智能体Agent开发入门构建你的第一个AI助手你是不是也好奇那些能帮你查天气、订行程、甚至写代码的AI助手到底是怎么做出来的感觉它们背后有一套复杂的逻辑离我们普通人很远。其实没那么神秘。今天我就带你用Cosmos-Reason1-7B这个模型从零开始动手搭建一个你自己的AI智能体。我们不做复杂的理论铺垫直接上手目标就是让你在半小时内看到一个能理解你意图、调用工具、并给出建议的“天气出行小助手”活过来。整个过程就像搭积木我们会一块一块地拼起来先让模型学会“思考”和“规划”再教它使用“工具”比如查天气最后让它学会“记忆”对话历史。听起来是不是挺有意思那咱们就开始吧。1. 动手之前先认识你的“积木块”在开始敲代码之前咱们得先搞清楚几个核心概念。别担心我用大白话给你解释保证一听就懂。智能体Agent是什么你可以把它想象成一个有“脑子”、有“手”、还有“记事本”的虚拟助手。脑子模型就是Cosmos-Reason1-7B它负责理解你说的话思考该怎么做。手工具比如一个查询天气的接口、一个计算器Agent可以用这些“手”去执行具体操作。记事本记忆用来记住你们之前的对话这样它就不会问重复的问题回答也更连贯。我们这次要做的就是教会这个“脑子”如何指挥“手”去干活并且把重要的东西记在“记事本”上。为什么选Cosmos-Reason1-7B简单说它特别擅长“推理”和“规划”。普通的聊天模型可能只会接着你的话往下说但Cosmos-Reason1-7B能像人一样先在心里把任务拆解成几步“用户要出行建议那我得先知道他要去哪、什么时候去。好第一步问他目的地。第二步查那里的天气。第三步根据天气给建议。” 这种“分步骤思考”的能力正是构建智能体的核心。2. 环境准备给你的助手安个家我们得先找个地方把模型跑起来。这里我推荐使用星图GPU平台它预置了环境我们不用操心复杂的安装和配置能快速进入正题。2.1 获取模型与基础环境首先你需要有一个可以运行模型的Python环境3.8以上版本并且安装一些必要的库。打开你的终端或命令行执行下面的命令# 安装核心的模型加载和对话库 pip install transformers torch # 安装一个帮助我们构建Agent的轻量级框架这里以LangChain为例因为它生态丰富例子多 pip install langchain langchain-community # 安装requests库用于后面调用天气API pip install requests接下来我们需要获取Cosmos-Reason1-7B模型。你可以在ModelScope或Hugging Face等模型社区找到它。这里假设我们从ModelScope加载from transformers import AutoTokenizer, AutoModelForCausalLM model_name AI-ModelScope/Cosmos-Reason1-7B tokenizer AutoTokenizer.from_pretrained(model_name, trust_remote_codeTrue) model AutoModelForCausalLM.from_pretrained(model_name, trust_remote_codeTrue, torch_dtypetorch.float16, device_mapauto)这段代码会把模型和分词器下载到本地。torch.float16表示用半精度加载节省显存device_map“auto”会自动把模型分配到可用的GPU上。2.2 快速验证模型环境搭好了我们先跟模型打个招呼确保它能正常工作。def simple_chat(prompt): inputs tokenizer(prompt, return_tensorspt).to(model.device) outputs model.generate(**inputs, max_new_tokens200) response tokenizer.decode(outputs[0], skip_special_tokensTrue) # 只截取模型生成的部分去掉我们的提问 return response[len(prompt):] test_prompt 你好请介绍一下你自己。 print(simple_chat(test_prompt))如果运行后能看到一段连贯的自我介绍恭喜你模型的“脑子”已经准备就绪了3. 核心实战打造天气出行助手现在进入最有趣的部分——赋予这个“脑子”行动能力。我们将分三步走造工具、定规则、串流程。3.1 第一步制造“工具手”工具就是Agent能调用的外部函数。我们先造一个最简单的——模拟查询天气。import requests import json def get_weather(city: str) - str: 模拟获取城市天气信息。 参数: city: 城市名例如“北京” 返回: 一个描述天气的字符串 # 这里为了演示我们模拟一个返回结果。 # 在实际应用中你可以替换成真正的天气API比如和风天气、OpenWeatherMap等。 weather_data { 北京: 晴朗温度25℃微风紫外线强度中等适合户外活动。, 上海: 多云温度28℃东南风3级湿度较高建议携带雨具。, 广州: 雷阵雨温度30℃南风4级有短时强降水出行请注意安全。, 深圳: 阵雨转多云温度29℃湿度大体感闷热。 } if city in weather_data: return f{city}的天气情况是{weather_data[city]} else: return f抱歉暂时没有{city}的天气信息。 # 测试一下工具 print(get_weather(北京))运行一下你会看到输出了“北京的天气情况是...”。看第一只“手”做好了。3.2 第二步编写“思考指南”我们需要告诉模型什么时候该思考什么时候该用工具。这通过编写“提示词”来实现。提示词就像给模型的工作说明书。from langchain.prompts import PromptTemplate from langchain.chains import LLMChain from langchain.llms import HuggingFacePipeline from transformers import pipeline # 首先将我们的模型包装成LangChain能用的格式 hf_pipeline pipeline( text-generation, modelmodel, tokenizertokenizer, max_new_tokens200, temperature0.1, # 温度调低让输出更确定、更可靠 ) llm HuggingFacePipeline(pipelinehf_pipeline) # 定义核心的Agent提示词模板 agent_prompt_template 你是一个乐于助人的出行助手。你的任务是理解用户的需求并通过使用工具来获取信息最终给出贴心的建议。 你可以使用的工具 1. get_weather(city: str)查询指定城市的天气详情。 请严格按照以下格式思考和回应 思考我需要先理解用户想做什么然后决定是否需要使用工具以及使用哪个工具。 行动如果需要使用工具就在这里写出工具调用格式为 工具名: 参数。例如get_weather: 北京。如果不需要工具就写 无。 观察这是工具返回的结果或者你对当前情况的分析。 最终答案在获得所有必要信息后给用户一个完整、友好的回答。 现在开始对话 用户{user_input} 历史对话{chat_history} 思考{agent_scratchpad} PROMPT PromptTemplate( input_variables[user_input, chat_history, agent_scratchpad], templateagent_prompt_template ) # 创建一个链将提示词和模型结合起来 agent_chain LLMChain(llmllm, promptPROMPT)这段代码是核心中的核心。我们定义了一个严格的“思考-行动-观察”格式强迫模型按照这个逻辑来工作。agent_scratchpad这个变量就是用来记录它每一步的思考和工具返回结果的。3.3 第三步组装并运行你的Agent现在我们把工具、提示词和记忆系统组装起来并写一个主循环让它跑起来。from langchain.memory import ConversationBufferMemory # 初始化记忆让Agent能记住对话历史 memory ConversationBufferMemory(memory_keychat_history, input_keyuser_input) # 一个简单的工具调用解析和执行函数 def parse_and_execute_action(action_str): if action_str.strip() 无: return 无需使用工具。 if action_str.startswith(get_weather:): city action_str.split(:)[1].strip() return get_weather(city) else: return f未知的行动指令: {action_str} # 主对话函数 def run_agent_conversation(): print(天气出行助手已启动输入‘退出’来结束对话。) chat_history while True: user_input input(\n你) if user_input.lower() in [退出, exit, quit]: print(助手再见祝你旅途愉快) break # 初始化思考过程 scratchpad 思考 max_steps 5 # 防止无限循环 final_answer None for step in range(max_steps): # 生成模型响应包含思考和行动 full_response agent_chain.run({ user_input: user_input, chat_history: chat_history, agent_scratchpad: scratchpad }) # 解析响应提取“行动”部分 lines full_response.split(\n) action None for line in lines: if line.startswith(行动): action line[3:].strip() # 去掉“行动” break # 执行工具调用获取观察结果 observation parse_and_execute_action(action) scratchpad f\n{full_response}\n观察{observation} # 检查响应中是否有“最终答案” for line in lines: if line.startswith(最终答案): final_answer line[5:].strip() # 去掉“最终答案” break if final_answer: print(f助手{final_answer}) # 将本轮对话存入历史 memory.save_context({user_input: user_input}, {output: final_answer}) chat_history memory.load_memory_variables({})[chat_history] break if not final_answer: print(助手我好像有点混乱了我们重新开始吧。) # 运行助手 if __name__ __main__: run_agent_conversation()保存并运行这个完整的脚本。你会看到一个命令行交互界面。试着输入“我明天想去北京天气怎么样” 看看你的Agent是如何一步步思考、调用天气工具并最终给你建议的。4. 效果初探与优化方向运行起来后你可能会发现它有时候能完美工作有时候又会“犯傻”。这很正常我们的第一个版本还很基础。这里有几个你马上可以尝试的优化点增强工具能力把模拟天气函数换成真实的天气API让它提供更精确的温度、湿度、风速、未来几小时预报等信息。改进提示词在提示词里加入更多例子教模型在不同场景下该如何反应。比如用户说“北京和上海哪个天气好”你应该教它分别查询两个城市再比较。增加更多工具比如加入一个suggest_activity(weather)工具根据天气情况晴朗、下雨推荐室内或室外活动。使用更成熟的框架我们上面用的是一个非常简化的自制循环。在实际项目中我强烈建议使用 LangChain 或 LlamaIndex 等框架内置的AgentExecutor它们已经帮你处理好了复杂的循环、错误处理和工具调用逻辑更稳定也更强大。5. 总结走完这一趟你应该已经感受到了构建一个基础智能体并没有想象中那么难。关键就是把“模型思考”、“工具调用”和“任务规划”这几个环节打通。我们今天做的这个“天气出行助手”虽然简单但已经包含了智能体最核心的骨架。你完全可以在这个基础上发挥想象力添加更多工具比如查询航班、推荐餐厅、翻译语言把它打造成你的专属多功能助手。动手试试吧从修改提示词、增加一个新工具开始。你会发现看着自己创造的AI从笨拙到逐渐聪明起来这个过程本身就充满了乐趣和成就感。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

相关文章:

Cosmos-Reason1-7B智能体(Agent)开发入门:构建你的第一个AI助手

Cosmos-Reason1-7B智能体(Agent)开发入门:构建你的第一个AI助手 你是不是也好奇,那些能帮你查天气、订行程、甚至写代码的AI助手,到底是怎么做出来的?感觉它们背后有一套复杂的逻辑,离我们普通…...

避坑指南:Python图片转视频常见问题及优化技巧(基于imageio 2.31.1)

Python图片转视频实战:从性能优化到高级技巧(基于imageio 2.31.1) 当你需要将数百张高分辨率图片转换为流畅视频时,是否遇到过内存爆炸、编码格式混乱或输出文件异常的问题?作为计算机视觉开发中的基础操作&#xff0c…...

nRF52832开发环境搭建:从编译到烧录的完整实践(基于Ubuntu 22.04和nRF5 SDK 15.3/17.1双版本)

nRF52832开发环境搭建:从编译到烧录的完整实践(基于Ubuntu 22.04和nRF5 SDK 15.3/17.1双版本) 在嵌入式开发领域,nRF52832作为Nordic Semiconductor推出的高性能蓝牙低功耗SoC,凭借其优异的射频性能和丰富的外设资源&a…...

ESP32-S3蓝牙配网实战:从零开始配置你的物联网设备(附完整代码)

ESP32-S3蓝牙配网实战:从零开始配置你的物联网设备(附完整代码) 在物联网开发中,设备首次连接网络往往是个令人头疼的问题。想象一下,你刚拿到一个全新的智能设备,没有屏幕,没有键盘&#xff0…...

中文纠错模型横向评测:MacBERT/T5/ChatGLM在SIGHAN2015上的表现对比

中文纠错模型实战评测:MacBERT、T5与ChatGLM的技术博弈 在智能输入法、OCR后处理等场景中,中文文本纠错技术直接影响着用户体验。当用户输入"今天新情很好"时,系统能否准确纠正为"今天心情很好",背后是语言模…...

2.数据采集基础知识

import requests from bs4 import BeautifulSoup#数据采集基础知识:豆瓣读书T250的数据获取 for i in range(0,10):url "https://book.douban.com/top250"header {"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, …...

MogFace-CVPR22效果惊艳展示:10张复杂合影人脸检测结果对比图集

MogFace-CVPR22效果惊艳展示:10张复杂合影人脸检测结果对比图集 1. 核心能力概览 MogFace(CVPR 2022)作为当前最先进的人脸检测模型之一,在复杂场景下展现出了令人印象深刻的能力。这个基于ResNet101架构的模型,专门…...

TM8211双通道16位DAC驱动实践:从音频到高精度信号生成

1. TM8211芯片基础解析:不只是音频DAC TM8211这颗双通道16位DAC芯片在电子爱好者圈子里常被当作音频解码器使用,但它的能力远不止于此。我第一次接触这颗芯片是在一个工业传感器校准项目中,当时需要生成微伏级精度的参考电压,市面…...

Psins静基座仿真精解:从IMU数据生成到误差传播理论验证

1. 静基座仿真与IMU数据生成基础 静基座仿真是惯性导航系统验证中最基础也最重要的场景之一。想象一下你的手机放在桌面上完全静止的状态——这就是静基座条件的直观体现。在这种环境下,我们可以排除运动带来的干扰,专注于分析惯性测量单元(I…...

玩转汽车数据流:用Torque Pro打造你的车载性能监控系统(支持GPS轨迹记录)

玩转汽车数据流:用Torque Pro打造你的车载性能监控系统(支持GPS轨迹记录) 在智能汽车时代,数据已经成为理解车辆状态的最佳语言。对于热爱技术的车主来说,能够实时获取并分析爱车的各项性能指标,不仅是一种…...

网络安全、计算机网络、理论技术+企业级的产品实践经验相结合

Part1 网络安全产品 终端侦测与响应系统(EDR) 网络侦测与响应系统(NDR) 多引擎脆弱性(漏洞)扫描(VAS) 网络安全威胁情报中心(TIS) 多源日志审计监测系统&…...

Verilog实战:手把手教你用CORDIC算法实现16位反正切函数(附完整代码)

Verilog实战:从零构建16位CORDIC反正切函数的工程实践 在FPGA开发中,数学函数的硬件实现一直是性能优化的关键环节。当标准IP核无法满足定制化需求时,自主实现核心算法就成为工程师的必备技能。本文将带您深入CORDIC算法的Verilog实现细节&am…...

AudioLDM-S企业应用:智能客服语音反馈系统

AudioLDM-S企业应用:智能客服语音反馈系统 1. 引言 想象一下这样的场景:一位焦急的客户拨通客服热线,等待解决问题的方案。传统的语音应答系统往往只能提供机械、单一的回复,让人感到冷漠和失望。但现在,借助AudioLD…...

RINEX格式解析:从GPS数据采集到多源接收机协同处理

1. RINEX格式:GPS数据处理的"普通话" 第一次接触GPS数据处理时,我被各种接收机厂商的专有数据格式搞得晕头转向。就像不同地区的人说着各自的方言,Trimble的.dat文件、Leica的.m00文件、Topcon的.t02文件彼此互不相通。直到遇到RIN…...

从描述到演示:基于 nano banana pro 的 PPT 智能生成框架,如何重塑内容创作流程

1. 当PPT制作遇上AI:一场效率革命的开端 每次临近汇报截止日期,办公室里总会响起此起彼伏的键盘敲击声和叹气声。我见过太多同事为了调整PPT的版式熬夜到凌晨,也见过不少设计师因为客户反复修改配色方案而抓狂。直到去年接触到Banana-slides这…...

DETR Revolution: How Transformers are Redefining End-to-End Object Detection

1. DETR如何颠覆传统目标检测范式 第一次看到DETR(Detection Transformer)的检测结果时,我盯着屏幕愣了好几秒——那些整齐排列的预测框就像是被某种魔法直接"印"在图像上,完全跳过了传统检测器中那些繁琐的后处理步骤。…...

PDF-Extract-Kit-1.0性能优化:利用CUDA加速模型推理

PDF-Extract-Kit-1.0性能优化:利用CUDA加速模型推理 1. 为什么需要GPU加速PDF处理 处理PDF文档其实是个挺耗资源的活儿,特别是当你要从复杂的PDF里提取内容时。想想看,一页PDF可能包含文字、图片、表格、公式等多种元素,每个都需…...

使用Jungo WinDriver v14.3.0进行PCIE DMA通信测试:基于XAPP1052的实战教程

PCIe DMA通信实战:基于Jungo WinDriver与Xilinx FPGA的高效数据传输指南 在FPGA与主机间实现高速数据传输始终是硬件开发者面临的核心挑战之一。PCIe DMA技术凭借其高带宽和低延迟特性,成为解决这一问题的黄金方案。本文将带您深入探索如何利用Jungo Wi…...

ADB设置手机代理的两种方法对比:哪种更适合你的抓包需求?

ADB设置手机代理的两种方法对比:哪种更适合你的抓包需求? 在移动应用开发和测试过程中,网络抓包是必不可少的调试手段。无论是分析API请求、排查网络问题,还是进行安全测试,设置手机代理都是第一步。ADB作为Android开…...

【绝密军工级实践】:无操作系统、无标准库、无调试器——如何对12KB汇编混合C裸机Bootloader实施全路径覆盖验证?

第一章:C 语言裸机程序形式化验证工具概览在资源受限、无操作系统支撑的裸机嵌入式环境中,C 语言编写的固件必须满足功能正确性、内存安全与实时行为可预测等严苛要求。形式化验证工具通过数学建模与逻辑推理,为这类程序提供超越传统测试的可…...

eBPF uprobe 实战:从符号解析到动态追踪用户程序

1. 初识eBPF uprobe:用户空间的黑盒探测器 第一次接触eBPF uprobe时,我正面临一个棘手问题:如何在不修改代码的情况下监控一个第三方闭源程序的内部函数调用?传统方案要么需要重新编译,要么会引入性能损耗。直到发现了…...

免安装光谱分析工具:一键计算CIE三刺激值与色温(CCT)

1. 光谱分析工具的核心功能解析 第一次接触光谱分析时,我也被各种专业术语搞得头晕眼花。直到发现这款免安装工具,才真正体会到什么叫"开箱即用"。它最厉害的地方在于,不需要配置环境、不用折腾依赖库,解压后双击就能直…...

C 程序设计文件操作核心知识点梳理

文件操作是 C 语言实现 “数据持久化” 的核心能力,能将程序中的数据写入磁盘文件,或从磁盘文件读取数据到程序中,是编程考核中综合应用的高频考点。本文从文件操作基础、文件的打开与关闭、文件的读写操作、文件定位与进阶操作四大维度&…...

UI-TARS-desktop真实效果:Qwen3-4B-Instruct对复杂GUI界面(如VS Code/Chrome DevTools)理解能力展示

UI-TARS-desktop真实效果:Qwen3-4B-Instruct对复杂GUI界面(如VS Code/Chrome DevTools)理解能力展示 想象一下,你正在开发一个复杂的网页应用,需要频繁地在VS Code里写代码,然后切换到Chrome浏览器&#x…...

手把手教你玩转国产数据库生态:从openGauss社区到华为云GaussDB的兼容认证实战指南

国产数据库生态实战指南:从开源社区到云端落地的全链路解析 在数字化转型浪潮下,国产数据库正迎来前所未有的发展机遇。随着信创产业的深入推进,越来越多的企业开始将核心业务系统从传统商业数据库迁移至国产数据库平台。本文将带您深入探索国…...

Java入门基础

Java用于场景: 桌面应用开发、企业级应用开发、移动应用开发、服务器系统、大数据开发、游戏开发 Java 三大技术平台 JavaSE、JavaEE、JavaME 主要学习前两个,JavaME已经淘汰 JDK的下载和安装 下载地址:https://www.oracle.com jdk需要…...

CODESYS文件操作进阶:用批处理脚本实现PLC与PC的实时数据备份(Windows/Linux双平台)

CODESYS文件操作进阶:用批处理脚本实现PLC与PC的实时数据备份(Windows/Linux双平台) 在工业自动化领域,数据备份的重要性不言而喻。对于使用CODESYS平台的工程师来说,如何实现PLC与PC之间的实时数据同步是一个常见但颇…...

避开这3个坑!致远OA连接第三方系统的安全部署指南(附银河麒麟系统适配方案)

致远OA系统集成安全部署实战:从风险规避到银河麒麟系统适配 当企业数字化转型进入深水区,OA系统与ERP等第三方系统的集成已成为提升运营效率的关键路径。然而,某省属国企在去年的一次系统对接中,因权限配置不当导致近3万条采购数据…...

Zotero Citation插件全攻略:解决Word文献引用难题的技术方案

Zotero Citation插件全攻略:解决Word文献引用难题的技术方案 【免费下载链接】zotero-citation Make Zoteros citation in Word easier and clearer. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-citation 诊断环境兼容性 核心价值:提前…...

基于深度学习的玉米虫害检测系统(YOLOv12/v11/v8/v5模型+数据集)(源码+lw+部署文档+讲解等)

摘要 随着全球农业生产的现代化和生物技术的进步,虫害防治已成为农业管理中的一项重要任务。玉米作为全球最重要的粮食作物之一,其虫害的监测和管理直接影响到粮食安全和农业经济。传统的虫害检测方法往往依赖于人工观察,不仅耗时耗力&#x…...