当前位置：首页 > article >正文

开源微调混合推理模型：cogito-v1-preview-qwen-32B

article 2026/2/8 10:59:57

在这里插入图片描述

一、模型概述

1.1 模型特点

Cogito v1-preview-qwen-32B 是一款基于指令微调的生成式语言模型（LLM），具有以下特点：

支持直接回答（标准模式）和自我反思后再回答（推理模式）。
使用 Iterated Distillation and Amplification (IDA) 方法进行训练，这是一种可扩展且高效的对齐策略。
优化了编码、STEM、指令遵循和通用帮助能力，多语言、编码和工具调用能力显著优于同尺寸模型。
支持超过 30 种语言，上下文长度为 128k。

1.2 性能比较

在标准模式下，与 Llama 和 Qwen 指令模型相比，性能更优。
在推理模式下，与 DeepSeek 的 R1 和 Qwen 的 QwQ 模型相比，性能更优。
Livebench 全球平均评分显示，Cogito v1-preview-32B 在行业基准测试中表现优异。

二、模型使用方法

2.1 标准模式

默认情况下，模型以标准模式运行。以下是使用示例：

import transformers
import torchmodel_id = "deepcogito/cogito-v1-preview-qwen-32B"
pipeline = transformers.pipeline("text-generation",model=model_id,model_kwargs={"torch_dtype": torch.bfloat16},device_map="auto",
)messages = [{"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},{"role": "user", "content": "Give me a short introduction to LLMs."},
]outputs = pipeline(messages, max_new_tokens=512)
print(outputs[0]["generated_text"])

2.2 启用深度思考

可以通过以下两种方法启用深度思考功能：

方法 1：添加系统提示

DEEP_THINKING_INSTRUCTION = "Enable deep thinking subroutine."
messages = [{"role": "system", "content": DEEP_THINKING_INSTRUCTION},{"role": "user", "content": "Write a bash script that takes a matrix..."},
]outputs = pipeline(messages, max_new_tokens=512)
print(outputs[0]["generated_text"])

方法 2：设置 `enable_thinking=True`

from transformers import AutoModelForCausalLM, AutoTokenizermodel_name = "deepcogito/cogito-v1-preview-qwen-32B"
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype="auto", device_map="auto")
tokenizer = AutoTokenizer.from_pretrained(model_name)messages = [{"role": "system", "content": "You are a pirate chatbot..."},{"role": "user", "content": "Give me a short introduction to LLMs."},
]text = tokenizer.apply_chat_template(messages,tokenize=False,add_generation_prompt=True,enable_thinking=True,
)model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
generated_ids = model.generate(**model_inputs, max_new_tokens=512)
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

三、工具调用

3.1 工具定义与调用

Cogito 模型支持工具调用（单次、并行、多次和并行多次），以下是一个示例：

def get_current_temperature(location: str) -> float:"""Get the current temperature at a location."""return 22.0  # 实际应用中应调用真实 APImessages = [{"role": "user", "content": "Hey, what's the temperature in Paris right now?"}]text = tokenizer.apply_chat_template(messages,tools=[get_current_temperature],add_generation_prompt=True,enable_thinking=True,
)model_inputs = tokenizer(text, return_tensors="pt", add_special_tokens=False).to(model.device)
outputs = model.generate(**model_inputs, max_new_tokens=512)
output_text = tokenizer.batch_decode(outputs)[0][len(text):]
print(output_text)

3.2 工具调用结果处理

如果模型生成了工具调用，可以将结果添加到对话中：

tool_call = {"name": "get_current_temperature", "arguments": {"location": "Paris, France"}}
messages.append({"role": "assistant", "tool_calls": [{"type": "function", "function": tool_call}]})
messages.append({"role": "tool", "name": "get_current_temperature", "content": "22.0"})text = tokenizer.apply_chat_template(messages,tools=[get_current_temperature],add_generation_prompt=True,enable_thinking=True,
)model_inputs = tokenizer(text, return_tensors="pt", add_special_tokens=False).to(model.device)
outputs = model.generate(**model_inputs, max_new_tokens=512)
output_text = tokenizer.batch_decode(outputs)[0][len(text):]
print(output_text)

四、总结

Cogito v1-preview-qwen-32B 是一款功能强大的生成式语言模型，支持多语言、深度思考和工具调用，适用于多种应用场景。通过合理的配置和使用，可以充分发挥其性能优势。

开源微调混合推理模型：cogito-v1-preview-qwen-32B

一、模型概述 1.1 模型特点 Cogito v1-preview-qwen-32B 是一款基于指令微调的生成式语言模型（LLM），具有以下特点： 支持直接回答（标准模式）和自我反思后再回答（推理模式）。使用 I…...

编程日记 2026/2/4 21:31:05

Golang｜Channel 相关用法理解

文章目录用 channel 作为并发小容器channel 的遍历channel 导致的死锁问题用 channel 传递信号用 channel 并行处理文件用channel 限制接口的并发请求量用 channel 限制协程的总数量用 channel 作为并发小容器注意这里的 ok 如果为 false，表示此时不仅channel为空…...

编程日记 2026/2/4 21:31:00

C++ - #命名空间 #输入、输出 #缺省参数 #函数重载 #引用 # const 引用 #inline #nullptr

文章目录前言一、实现C版本的hello world 二、命名空间 1、namespace 的价值 2、namespace 的定义 (1.域会影响一个编译器编译语法时的查找规则 (2、域会影响生命周期 (3、命名空间域只能定义在全局 (4、编译器会自动合并相同命名空间中的内容 (5、C标准库放在命名…...

编程日记 2026/2/5 3:15:49

Spring Boot 应用程序中配置使用consul

配置是 Spring Boot 应用程序中的一部分，主要用于配置服务端口、应用名称、Consul 服务发现以及健康检查等功能。以下是对每个部分的详细解释： 1. server.port server:port: 8080作用：指定 Spring Boot 应用程序运行的端口号。解释&#xf…...

编程日记 2026/1/8 12:30:32

JSON处理工具/框架的常见类型及详解，以Java语言为例

以下是JSON处理工具/框架的常见类型及详解，以Java语言为例： 一、主流JSON处理工具对比 Jackson（推荐） 特点：高性能、功能丰富，支持注解（如JsonProperty）、树形模型（Json…...

编程日记 2026/2/4 21:30:59

4. k8s核心概念 pod deployment service

以下是 Kubernetes 的核心概念详解，涵盖 Pod、Service、Deployment 和 Node，以及它们之间的关系和实际应用场景： 1. Pod 定义与作用 • 最小部署单元：Pod 是 Kubernetes 中可创建和管理的最小计算单元，包含一个或多个…...

编程日记 2026/1/6 14:27:27

c++中max函数怎么使用?

在C中，std::max函数是一个在 <algorithm> 标准库头文件中定义的函数模板，用于确定两个或更多个数值之间的最大值。下面是对std::max函数的基本介绍和使用示例： 函数原型： template <class T> constexpr const T&…...

编程日记 2025/12/2 2:39:56

使用Redis实现分布式限流

一、限流场景与算法选择 1.1 为什么需要分布式限流在高并发系统中，API接口的突发流量可能导致服务雪崩。传统的单机限流方案在分布式环境下存在局限，需要借助Redis等中间件实现集群级流量控制。 1.2 令牌桶算法优势允许突发流量：稳定速…...

编程日记 2025/12/1 4:40:08

中间件--ClickHouse-1--基础介绍（列式存储，MPP架构，分布式计算，SQL支持，向量化执行，亿万级数据秒级查询）

1、概述 ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。它由俄罗斯的互联网巨头Yandex为解决其内部数据分析需求而开发，并于2016年开源。专为大规模数据分析，实时数据分析和复杂查询设计，具有高性能、实时数据和可扩展性等…...

编程日记 2026/2/4 21:30:54

Java中的经典排序算法：插入排序、希尔排序、选择排序、堆排序与冒泡排序（如果想知道Java中有关插入排序、希尔排序、选择排序、堆排序与冒泡排序的知识点，那么只看这一篇就足够了！）

前言：排序算法是计算机科学中的基础问题之一，它在数据处理、搜索算法以及各种优化问题中占有重要地位，本文将详细介绍几种经典的排序算法：插入排序、选择排序、堆排序和冒泡排序。 ✨✨✨这里是秋刀鱼不做梦的BLOG ✨✨✨想要了解…...

编程日记 2026/2/4 21:30:54

K8S+Prometheus+Consul+alertWebhook实现全链路服务自动发现与监控、告警配置实战

系列文章目录 k8s服务注册到consul prometheus监控标签文章目录系列文章目录前言一、环境二、Prometheus部署1.下载2.部署3.验证三、kube-prometheus添加自定义监控项1.准备yaml文件2.创建新的secret并应用到prometheus3.将yaml文件应用到集群4.重启prometheus-k8s pod5.访…...

编程日记 2026/2/4 21:31:59

uniapp-商城-25-顶部模块高度计算

计算高度： 使用computed进行顶部模块的计算。总高度：bartotalHeight log 介绍--收款码这一条目也就是上一章节的title的高度计算 bodybarheight。在该组件中： js部分的代码： 包含了导出的名字： shop-head…...

编程日记 2026/2/4 21:30:56

Proxmox VE 网络配置命令大全

如果对 Proxmox VE 全栈管理感兴趣，可以关注“Proxmox VE 全栈管理”专栏，后续文章将围绕该体系，从多个维度深入展开。概要：Proxmox VE 网络配置灵活，满足虚拟化组网需求。基础靠桥接实现虚拟机与物理网络互联&#x…...

编程日记 2025/12/5 4:44:53

非关系型数据库（NoSQL）与关系型数据库（RDBMS）的比较

非关系型数据库（NoSQL）与关系型数据库（RDBMS）的比较一、引言二、非关系型数据库（NoSQL）2.1 优势三、关系型数据库（RDBMS）3.1 优势四、结论 💖The Begin💖…...

编程日记 2026/2/4 21:30:57

如何使元素原地旋转 - WPF .NET Framework | Microsoft Learn <ButtonRenderTransformOrigin"0.5,0.5"HorizontalAlignment"Left">Hello,World<Button.RenderTransform><RotateTransform x:Name"MyAnimatedTransform" Angle"…...

编程日记 2025/12/1 13:58:45

蓝桥杯2024国B数星星

小明正在一棵树上数星星，这棵树有 n 个结点 1,2,⋯,n。他定义树上的一个子图 G 是一颗星星，当且仅当 G 同时满足： G 是一棵树。G 中存在某个结点，其度数为 ∣VG∣−1。其中 ∣VG∣ 表示这个子图含有的结点数。两颗星星不相…...

编程日记 2026/2/4 21:32:04

Ubuntu 系统上通过终端安装 Google Chrome 浏览器

使用终端安装前，需要配置好终端使用了代理。参考文章：https://blog.csdn.net/yangshuo1281/article/details/147262633?spm1011.2415.3001.5331 转自风车首先，添加 Google Chrome 的软件源和密钥： # 下载并添加 Google 的签…...

编程日记 2025/12/2 0:05:20

中科院1区顶刊Expert Systems with Applications ESO：增强型蛇形算法，性能不错

Snake Optimizer（SO）是一种优化效果良好的新颖算法，但由于自然规律的限制，在探索和开发阶段参数更多是固定值，因此SO算法很快陷入局部优化并慢慢收敛。本文通过引入新颖的基于对立的学习策略和新的动态更新机制&#x…...

编程日记 2026/2/4 21:30:56

zk（Zookeeper）实现分布式锁

Zookeeper实现分布式锁 1，zk中锁的种类： 读锁：大家都可以读，要想上读锁的前提：之前的锁没有写锁写锁：只有得到写锁的才能写。要想上写锁的前提是：之前没有任何锁 2，zk如何上读锁创…...

编程日记 2025/12/4 2:45:14

自我生成，自我训练：大模型用合成数据实现“自我学习”机制实战解析

目录自我生成，自我训练：大模型用合成数据实现“自我学习”机制实战解析一、什么是自我学习机制？ 二、实现机制：如何用合成数据实现自我训练？ ✅ 方式一：Prompt强化生成 → 自我采样再训练 ✅ 方式二…...

编程日记 2025/12/1 16:13:41

【Vue】从 MVC 到 MVVM：前端架构演变与 Vue 的实践之路

个人博客：haichenyi.com。感谢关注一. 目录一–目录二–架构模式的演变背景三–MVC：经典的分层起点四–MVP：面向接口的解耦尝试五–MVVM：数据驱动的终极形态六–Vue：MVVM 的现代化实践二. 架构模…...

编程日记 2026/2/6 6:55:06

prototype`和`proto`有什么区别？如何手动修改一个对象的原型？

在 JavaScript 中，prototype 和 __proto__ 都与原型链相关，但它们的角色和用途有本质区别： 1. prototype 和 __proto__ 的区别特性prototype__proto__归属对象仅函数对象拥有（如构造函数）所有对象默认拥有&#xff0…...

编程日记 2026/2/6 6:10:55

Flask+Influxdb+grafna构建电脑性能实时监控系统

Influx下载地址，这里下载了以下版本influxdb-1.8.5_windows_amd64.zip 运行前需要先启动Influx数据库： 管理员方式运行cmd->F:->cd F:\influxdb\influxdb-1.8.5-1->influxd -config influxdb.conf，以influxdb.conf配置文件启动数…...

编程日记 2026/2/4 21:33:44

关于链接库

在 C# 中，链接库主要分为两种类型：托管链接库和非托管链接库，以下为你详细介绍它们的特点和导入方式： 托管链接库特点托管链接库通常是用 .NET 兼容的语言（如 C#、VB.NET 等）编写的，运行在…...

编程日记 2025/12/5 11:37:37

若伊微服务版本教程（自参）

第一步若伊官网下载源码 https://ruoyi.vip/ RuoYi-Cloud: 🎉 基于Spring Boot、Spring Cloud & Alibaba的分布式微服务架构权限管理系统，同时提供了 Vue3 的版本 git clone 到本地目录如下： 第二部参考官网运行部署说明环境部署…...

编程日记 2026/2/4 21:30:58

数据库性能优化(sql优化)_分布式优化思路01_yxy

数据库性能优化_分布式优化思路01 1 分布式数据库的独特挑战2 分布式新增操作符介绍2.1 数据交换操作符(ESEND/ERECV)：2.2 数据迭代操作符GI：3 核心优化策略(一)_分区裁剪优化3.1 普通分区裁剪3.2 动态分区裁剪1 分布式数据库的独特挑战在分布式数据库系统中，核心为数据被…...

编程日记 2025/12/1 0:05:31

ESP32与STM32哪种更适合初学者？

目录 1、ESP32：物联网时代的“网红” 2、STM32：工业界的“常青树” 3、到底谁更容易？ 无论是刚入坑的小白，还是想扩展技术栈的老鸟，在选择主力 MCU 时，学习曲线绝对是重要的考量因素。ESP32 以其强大的 …...

编程日记 2026/2/4 21:33:38

秒杀秒抢系统开发：飞算 JavaAI 工具如何应对高并发难题？

秒杀、秒抢活动已成为电商促销与吸引流量的常用手段。然而，此类活动所带来的高并发访问，对系统性能构成了巨大挑战。如何确保系统在高并发场景下依然能够稳定、高效运行，成为开发者亟待解决的关键问题。飞算 JavaAI 工具作为一款功能强大的开…...

编程日记 2026/2/4 21:31:04

未启用CUDA支持的PyTorch环境** 中使用GPU加速解决方案

1. 错误原因分析根本问题：当前安装的PyTorch是CPU版本，无法调用GPU硬件加速。当运行以下代码时会报错：model YOLO("yolov8n.pt").to("cuda") # 或 .cuda()2. 解决方案步骤步骤1：验证CUDA可用性在Pyth…...

编程日记 2025/12/2 13:43:32

C# 将Excel格式文件导入到界面中，用datagridview显示

界面按钮不做介绍。主要代码： //用于获取从上一个页面传过来datagridview标题 public DataTable GetHeader { get; set; } private void UI_EXPINFO_Load(object sender, EventArgs e) { //页面加载显示listbox1中可…...

编程日记 2026/2/3 5:00:10