当前位置：首页 > news >正文

DeepSeek R1 与 OpenAI O1：机器学习模型的巅峰对决

news 2025/11/30 21:19:39

在这里插入图片描述
我的个人主页
我的专栏：人工智能领域、java-数据结构、Javase、C语言，希望能帮助到大家！！！点赞👍收藏❤

一、引言

在机器学习的广袤天地中，大型语言模型（LLM）无疑是最为璀璨的明珠。它们凭借卓越的语言理解与生成能力，正以前所未有的方式重塑着我们与信息交互的模式。DeepSeek R1和OpenAI O1作为其中的佼佼者，代表了当前技术的前沿水准，在架构设计、训练方法、性能表现以及应用场景等诸多层面展开了一场激烈的“巅峰对决”。深入探究这两个模型的各个方面，不仅能让我们洞察机器学习技术的演进脉络，还能为相关领域的研究与实践提供宝贵的借鉴。

二、模型架构探秘

（一）DeepSeek R1

在这里插入图片描述

强化学习框架基石
DeepSeek R1以DeepSeek - V3 - Base模型为依托，开创性地采用群组相对策略优化（GRPO）作为核心强化学习（RL）框架。GRPO赋予模型强大的自主探索能力，在面对复杂任务时，模型如同一位智慧的探险家，能够依据GRPO自主尝试不同的思路链（CoT）流程。以数学证明任务为例，它不再局限于常规的推理路径，而是多角度、全方位地探索，直至觅得最优解。这种自主探索特性，使模型在处理复杂推理任务时展现出卓越的灵活性与智能性。
冷启动策略的精妙之处
RL训练初期的稳定性至关重要，DeepSeek R1引入少量精心筛选的高质量长CoT示例进行微调，以此开启冷启动。这些示例宛如航海中的灯塔，为模型训练指引方向。比如在训练模型理解复杂故事逻辑时，从海量故事文本中精挑细选具有代表性、逻辑结构复杂的故事，并附上详尽的逻辑分析。模型在这些数据的引导下，能更精准地理解上下文关系，把握情节发展脉络，为后续深度训练筑牢根基。
多阶段训练的协同效应
DeepSeek R1的训练过程恰似一场精心编排的交响乐，涵盖两个RL阶段和两个监督微调（SFT）阶段。RL阶段如同激昂的乐章，助力模型在复杂任务空间中探寻并优化推理模式，模型在此阶段仿若勇敢的探索者，不断积累经验。SFT阶段则如细腻的前奏，为模型的推理与非推理能力奠定基础。两个阶段紧密协作，使模型在面对各类复杂任务时都能游刃有余。
蒸馏技术的神奇魔法
为提升小模型的性能，DeepSeek R1运用蒸馏技术，将大模型的推理模式巧妙迁移至小模型。这一技术如同知识的传递使者，例如，大模型经长时间训练积累了丰富知识与高效推理模式，通过蒸馏，小模型不仅具备类似推理能力，还因结构简单而运行速度更快、资源占用更少，极大拓展了模型的应用范围。

（二）OpenAI O1

Transformer架构的卓越效能
OpenAI O1基于Transformer架构精心搭建，该架构在自然语言处理领域堪称“瑞士军刀”。其核心优势在于能高效处理和生成文本，尤其是在处理长序列数据时，凭借自注意力机制，可轻松捕捉文本中的长期依赖关系。无论是长篇小说的复杂情节，还是复杂技术文档的严谨逻辑，OpenAI O1都能应对自如，生成的文本连贯且逻辑清晰。
思维链提示策略的智慧之光
面对复杂查询，OpenAI O1采用思维链提示策略，如同为模型配备了一位睿智的解题导师。模型通过逐步迭代的方式将复杂问题拆解为多个简单步骤，依次推理求解。以复杂数学应用题为例，模型先分析题目条件，明确已知与所求，再列出解题步骤并逐步推导，最终得出准确答案。这一策略显著提升了模型处理复杂问题的能力。
安全训练机制的保驾护航
在信息繁杂的时代，模型生成内容的安全性与合规性至关重要。OpenAI O1实施新颖的安全训练方法，借助模型自身的推理能力，严格遵守安全和协调准则。训练过程中，模型如同严谨的审查员，对生成内容进行严格筛查，杜绝有害、虚假或违反道德伦理的表述，为模型的广泛应用提供了坚实保障。

三、训练方法剖析

（一）数据准备

DeepSeek R1的数据雕琢之路
DeepSeek R1在数据选择上精益求精，尤其注重冷启动长CoT数据的质量。这些数据多源自专业领域的权威文献、前沿学术论文及复杂实际问题解决案例。例如，在医学领域训练时，会从医学专业期刊的高质量论文中提取数据。在预处理阶段，DeepSeek R1如技艺精湛的工匠，对数据进行清洗、标注等精细操作，去除噪声与错误信息，添加准确标注，确保数据的准确性与一致性，为模型训练奠定坚实基础。
OpenAI O1的大规模数据整合策略
OpenAI O1采用大规模多源数据整合策略，数据涵盖互联网文本、书籍、新闻等。为确保数据质量，运用先进的采样和过滤技术，去除重复与低质量数据，如同沙中淘金。同时，对数据进行标准化处理，统一格式、归一化词法和句法，使数据符合模型输入要求，便于模型高效学习。

（二）训练优化

DeepSeek R1的强化学习优化之旅
训练过程中，DeepSeek R1以GRPO为核心的RL优化算法，如同睿智的领航员，依据模型反馈动态调整训练策略。在逻辑推理训练中，当模型推理结果与正确答案有偏差时，GRPO算法会依据优化规则微调模型参数，使模型不断改进推理方法，提升性能，从而在复杂任务中迅速找到最佳解决方案。
OpenAI O1的多维度优化策略
OpenAI O1采用多种优化技术，构建全方位优化体系。自适应学习率调整是重要手段之一，训练早期，较大学习率使模型快速探索参数空间；训练后期，学习率降低，模型精细调整参数，提高性能。此外，梯度裁剪技术防止梯度爆炸或消失，确保训练稳定收敛，使模型始终保持良好训练状态。

以下为简单示意DeepSeek R1基于GRPO的训练代码片段：

import torch
import torch.nn as nn
from deepseek_rl_framework import GRPO# 定义DeepSeek R1模型
class DeepSeekR1(nn.Module):def __init__(self):super(DeepSeekR1, self).__init__()# 模型结构定义，例如Transformer的一些层等self.layer1 = nn.TransformerEncoderLayer(d_model = 512, nhead = 8)self.layer2 = nn.TransformerEncoderLayer(d_model = 512, nhead = 8)def forward(self, x):# 前向传播逻辑x = self.layer1(x)x = self.layer2(x)return x# 初始化模型
model = DeepSeekR1()# 定义GRPO优化器
optimizer = GRPO(model.parameters(), lr = 0.001, gamma = 0.99)# 训练数据
train_data = torch.randn(100, 32, 512)  # 假设数据格式为(batch_size, sequence_length, feature_dim)for epoch in range(100):for batch in train_data:# 前向传播output = model(batch)# 计算损失，这里假设是一个简单的均方误差损失loss = torch.mean((output - target) ** 2)# 反向传播和优化optimizer.zero_grad()loss.backward()optimizer.step()

以下为简单示意OpenAI O1中使用自适应学习率调整的代码片段：

import torch
import torch.nn as nn
from torch.optim import AdamW# 定义OpenAI O1类似的模型结构
class OpenAIO1Like(nn.Module):def __init__(self):super(OpenAIO1Like, self).__init__()# 模型结构定义，例如Transformer的一些层等self.layer1 = nn.TransformerEncoderLayer(d_model = 512, nhead = 8)self.layer2 = nn.TransformerEncoderLayer(d_model = 512, nhead = 8)def forward(self, x):# 前向传播逻辑x = self.layer1(x)x = self.layer2(x)return x# 初始化模型
model = OpenAIO1Like()# 定义AdamW优化器，带有自适应学习率调整
optimizer = AdamW(model.parameters(), lr = 0.001, betas = (0.9, 0.999), eps = 1e - 8)# 训练数据
train_data = torch.randn(100, 32, 512)  # 假设数据格式为(batch_size, sequence_length, feature_dim)for epoch in range(100):for batch in train_data:# 前向传播output = model(batch)# 计算损失，这里假设是一个简单的均方误差损失loss = torch.mean((output - target) ** 2)# 反向传播和优化optimizer.zero_grad()loss.backward()optimizer.step()

四、性能基准比较

（一）推理任务

DeepSeek R1的推理壮举
在AIME 2024和MATH - 500等极具挑战性的推理任务中，DeepSeek R1表现卓越。在AIME 2024中，它取得了79.8% Pass@1的优异成绩；在MATH - 500测试里，获得了97.3%的高分，与OpenAI O1 - 1217相当，部分指标甚至更优。这表明DeepSeek R1在复杂数学推理、逻辑推导等任务中实力强劲，能深入理解问题本质，运用精妙推理策略得出准确答案，为实际应用中的复杂推理提供有力支持。
OpenAI O1的推理优势
OpenAI O1在推理任务领域同样表现出色，尤其在科学、技术、工程和数学（STEM）领域的复杂推理问题上优势明显。无论是探索物理奥秘还是解析工程技术难题，OpenAI O1都能凭借深厚知识储备和强大推理能力，精准理解问题并给出详尽准确解答，在STEM领域的推理任务中占据重要地位。

（二）编码任务

DeepSeek R1的编码达人之路
DeepSeek R1在编码任务方面堪称“编码达人”。在Codeforces竞赛中，它达到专家级水平，获得2,029 Elo评级，表现优于96.3%的人类参与者。这充分证明其在代码生成、调试等方面能力卓越，能快速理解需求，生成高效准确代码，如同经验丰富的程序员，依据不同编程场景运用恰当技巧和逻辑编写高质量代码。
OpenAI O1的编码助力
OpenAI O1在编码基准测试中表现良好，是开发人员的得力助手。它能根据开发人员的需求描述，快速生成相关代码框架和关键代码片段，协助构建和执行多步骤工作流程。在开发复杂Web应用程序时，OpenAI O1可协助设计数据库架构、编写后端接口代码等，提高开发效率和代码质量。

（三）知识基准

DeepSeek R1的知识拼图
在MMLU等基于知识的基准测试中，DeepSeek R1展现出一定知识储备实力。虽表现略逊于OpenAI O1 - 1217，但优于众多闭源模型。这表明它在一般知识掌握上具有优势，但在知识广度和深度上与OpenAI O1相比仍有提升空间。面对专业小众领域知识问题，DeepSeek R1需进一步提高回答的准确性和完整性。
OpenAI O1的知识宝库
OpenAI O1在知识基准测试中宛如一座知识宝库，展现出惊人的知识覆盖和准确性。无论是历史文化、科学技术还是日常生活常识，它都能快速准确回答各类知识问题。对世界知识的广泛涉猎和对常识的精准理解，使其在知识问答任务中表现出色，能为用户提供有价值的信息。

五、成本与可访问性对比

（一）成本方面

DeepSeek R1的低成本优势
DeepSeek R1在成本方面优势显著。据传其训练成本仅600万美元，在大型语言模型训练成本中性价比极高。使用成本也非常亲民，输入代币每100万个代币0.55美元，产出代币每100万代币2.19美元。这使得更多研究机构和开发者能够负担得起，为其广泛应用和推广提供有力支持，无论是小型创业公司还是学术研究团队，都能在有限预算内利用其强大功能开展创新研究和应用开发。
OpenAI O1的高成本考量
与DeepSeek R1相比，OpenAI O1的训练成本高昂，据传约5亿美元。如此高昂的训练成本，使得只有具备强大资金实力的机构才能承担研发和训练。使用成本方面，OpenAI O1也相对较高，输入代币每100万个代币15.00美元，输出代币每100万代币60.00美元。高成本使用模式对成本敏感的用户和研究机构设置了较高门槛，限制了其在某些场景下的广泛应用。

（二）可访问性方面

DeepSeek R1的开源魅力
DeepSeek R1以开源形式发布，这一举措为机器学习领域打开了知识宝库的大门。研究人员和开发者可自由获取模型权重，深入研究模型结构和原理，并基于开源代码进行二次开发和定制化改进。开源模式极大促进了技术交流与创新，不同地区和背景的研究人员可共同参与模型优化和应用拓展。例如，一些研究团队基于DeepSeek R1的开源代码，针对特定领域（如生物信息学）进行优化，开发出更适合该领域的语言模型应用。
OpenAI O1的访问模式
OpenAI O1通常以API形式提供给用户使用，用户需申请访问权限，并遵循一定的使用规则和收费标准。这种访问模式在一定程度上保障了模型的安全性和商业运营，但也限制了部分用户的直接使用。对于一些希望深入研究模型内部结构或进行大规模定制化开发的用户来说，API访问可能无法满足其需求。不过，通过API，OpenAI O1能够为广大用户提供便捷的服务接入，使得不同行业的开发者可以快速将其集成到自己的应用中，如聊天机器人、智能写作助手等。

六、应用场景分析

（一）DeepSeek R1的应用领域

科研辅助
在科研领域，DeepSeek R1凭借其强大的推理能力和对复杂知识的理解，为科研人员提供了有力的辅助。例如在数学研究中，它可以帮助研究人员探索新的证明思路，验证猜想。在物理领域，对于一些复杂的理论推导，DeepSeek R1能够通过对大量文献的学习和自身的推理，为研究人员提供新的视角和启发。此外，在跨学科研究中，它能够整合不同领域的知识，促进学科间的融合与创新。
智能编程助手
作为智能编程助手，DeepSeek R1的编码能力使其在软件开发过程中发挥重要作用。它可以根据开发人员的需求快速生成代码模板，自动完成一些重复性的代码编写工作，提高开发效率。同时，在代码调试阶段，它能够分析代码逻辑，定位潜在的错误，并提供解决方案。例如，在开发大型项目时，开发团队可以利用DeepSeek R1快速搭建项目框架，加速项目开发进程。
教育领域创新
在教育领域，DeepSeek R1可作为个性化学习工具。它能够根据学生的学习进度和知识掌握情况，提供针对性的学习内容和指导。例如，对于数学学习困难的学生，它可以通过详细的推理步骤讲解数学问题，帮助学生理解解题思路。在语言学习方面，它可以模拟真实的语言环境，与学生进行对话练习，提高学生的语言应用能力。

（二）OpenAI O1的应用方向

专业领域咨询
在专业领域，如医学、法律等，OpenAI O1凭借其丰富的知识储备和准确的推理能力，可作为专业咨询工具。医生可以借助它辅助诊断病情，分析病例中的复杂症状和潜在病因。律师则可以利用它查找相关法律条文，分析类似案例，为案件提供有力的支持。例如，在疑难病症的诊断中，OpenAI O1可以综合分析患者的症状、病史、检查结果等信息，为医生提供诊断建议。
内容创作与优化
在内容创作领域，OpenAI O1展现出强大的实力。它可以生成高质量的文章、故事、诗歌等各种类型的文本。同时，对于已有的内容，它能够进行优化和润色，提高文本的逻辑性和可读性。例如，媒体机构可以利用它快速生成新闻报道的初稿，作家可以借助它获取创作灵感，优化作品内容。
智能客服与交互系统
OpenAI O1在智能客服和交互系统中应用广泛。它能够快速理解用户的问题，并给出准确、友好的回答。在复杂的客户咨询场景中，它可以通过多轮对话，深入了解用户需求，提供个性化的解决方案。例如，电商平台的智能客服可以利用OpenAI O1快速处理客户的咨询和投诉，提高客户满意度。

七、未来发展展望

（一）DeepSeek R1的发展路径

提升多语言能力
针对当前在多语言环境中存在的语言混合等问题，DeepSeek R1未来可能会着重提升多语言处理能力。通过优化模型架构和训练数据，使其能够更好地适应不同语言的语法、语义和文化背景，实现更准确、流畅的多语言交互。这将有助于扩大其在全球范围内的应用，满足不同地区用户的需求。比如在跨国企业的办公沟通、国际教育资源共享等场景中，为用户提供更优质的多语言服务。
拓展知识领域
尽管DeepSeek R1在现有知识基准测试中表现不错，但仍有提升空间。未来它可能会进一步拓展知识领域，不仅在数学、代码和自然语言推理等方面持续深化，还会向更多专业领域进军，如医学、物理学、生物学等。通过与各领域专家合作，引入更多专业知识数据进行训练，使模型能够更好地理解和处理复杂的专业问题，为科研人员、专业从业者提供更精准的知识支持和解决方案，助力各领域的创新发展。
强化多模态功能
目前OpenAI O1在图像分析等多模态功能上有所突破，DeepSeek R1也可能会加快在多模态领域的研发。未来可能会结合图像、音频等多种模态数据进行训练，实现文本与图像、音频等信息的融合理解和生成。例如在智能安防领域，能够同时对视频画面和音频信息进行分析，实现更精准的异常行为检测和预警；在智能教育领域，支持图文并茂的学习资料生成和讲解，提升学习体验。
优化服务性能
随着用户数量的增加和应用场景的丰富，DeepSeek R1需要不断优化服务性能。一方面，提升模型的响应速度，减少用户等待时间，尤其是在处理大规模复杂任务时，确保能够快速给出结果。另一方面，增强服务的稳定性，降低系统故障率，保障用户能够持续、稳定地使用服务。此外，还可能会进一步优化成本效益，在提供高质量服务的同时，降低运营成本，使更多用户和企业能够受益于该模型。
深化与硬件的协同
DeepSeek通过工程化能力创新，实现了大模型训练和推理算力成本的极致优化。未来，DeepSeek R1有望与更多硬件厂商深入合作，进一步优化在不同硬件平台上的运行效率。与国产算力芯片厂商合作，推动国产硬件的发展和应用，实现大模型与硬件的深度融合，提高整体性能和兼容性。比如针对特定的硬件架构，对模型进行定制化优化，充分发挥硬件的优势，实现更高效的推理和计算，为大规模商业化落地提供更坚实的技术基础。
推动开源社区发展
DeepSeek R1采用MIT许可协议，完全开源。未来，它将继续依托开源社区，吸引更多开发者参与模型的改进和应用开发。通过社区的力量，不断丰富模型的功能和应用场景，推动人工智能技术的普及和创新。可能会举办更多的开源项目活动、技术竞赛等，激发开发者的创造力，促进优秀人才的培养和交流，形成一个繁荣的人工智能开源生态系统。

（二）OpenAI O1的发展方向

拓展功能与应用场景
OpenAI O1目前仍然缺少部分高级功能，如网页浏览、上传文件、结构化输出、函数调用等功能仍在开发阶段。未来，OpenAI将继续完善这些功能，进一步拓展应用场景。网页浏览功能的实现将使O1能够实时获取最新的信息，为用户提供更准确、全面的回答；上传文件和结构化输出功能可以方便用户进行数据处理和分析，提高工作效率；函数调用功能则能与其他软件和工具更好地集成，为开发者提供更多的创新空间，使O1在办公自动化、数据分析、软件开发等领域发挥更大的作用。
提升效率与降低成本
目前O1存在推理时间较长、使用成本较高的问题。未来，OpenAI可能会通过优化模型架构、算法和训练方法，提高O1的推理效率，缩短响应时间，使其在各种应用场景中能够更快速地为用户提供服务。同时，也会致力于降低使用成本，让更多用户和企业能够负担得起，扩大其市场份额。例如，通过技术创新和资源优化配置，减少对计算资源的需求，降低运营成本，从而降低用户的使用费用。
强化安全与伦理机制
随着人工智能技术的广泛应用，安全和伦理问题日益受到关注。OpenAI O1在安全方面已经取得了一定的进展，但仍需不断强化。未来，它可能会进一步完善安全训练机制，提高模型在抵抗攻击、保护用户隐私等方面的能力。同时，加强伦理审查和监管，确保模型的输出符合道德和法律规范，避免产生不良影响。例如，在内容生成方面，严格审核输出结果，防止生成虚假信息、有害内容等；在数据使用方面，加强对用户数据的保护，确保数据的安全和合规性。
探索与其他模型的融合
OpenAI O1与GPT-4O等其他大模型并非替代关系，未来不排除实现融合。OpenAI可能会探索将O1与其他模型进行融合的方式，充分发挥各自的优势，实现性能的进一步提升。例如，将O1的强大推理能力与GPT-4O在某些特定领域的优势相结合，打造更全面、更强大的人工智能系统。此外，也可能会与其他机构和团队的模型进行合作和融合，推动人工智能技术的共同发展。
推动人工智能向AGI迈进
O1在一定程度上模拟了人类的慢思考过程，展示了向AGI迈进的潜力。未来，OpenAI将以O1为基础，继续深入研究和探索，不断提升模型的智能水平，使其在认知、学习、推理等方面更接近人类智能。通过持续的技术创新和突破，推动人工智能向通用人工智能（AGI）的目标迈进，为人类社会带来更多的变革和进步。

总体而言，DeepSeek R1和OpenAI O1作为当前机器学习领域的杰出代表，都有着广阔的发展前景。它们将在技术创新、应用拓展、社会影响等方面持续发挥重要作用，推动机器学习技术不断向前发展，为人类的生产生活带来更多的便利和创新。

DeepSeek R1 与 OpenAI O1：机器学习模型的巅峰对决

我的个人主页我的专栏：人工智能领域、java-数据结构、Javase、C语言，希望能帮助到大家！！！点赞👍收藏❤ 一、引言在机器学习的广袤天地中，大型语言模型（LLM）无疑是最…...

编程日记 2025/2/18 20:38:24

【机器学习】深入浅出KNN算法：原理解析与实践案例分享

在机器学习中，K-最近邻算法（K-Nearest Neighbors, KNN）是一种既直观又实用的算法。它既可以用于分类，也可以用于回归任务。本文将简单介绍KNN算法的基本原理、优缺点以及常见应用场景，并通过一个简单案例帮助大家快速入…...

编程日记 2025/2/18 20:37:19

C#使用文件读写操作实现仙剑五前传称号存档修改

手把手教学仙剑五前传称号存档修改器首先找到 Pal5Q所在目录的save\global.sav 文件,这是一个只有488字节的文件,这里存放称号对应的编号ID,以及是否已获得该称号,1为已获取称号,0为未获取称号 [称号:是否获取]这是一个键值对称号的编号ID是一个Int32数字,使用C#的方法Bi…...

编程日记 2025/2/18 20:36:17

计算机专业知识【探秘 C/S 工作模式：原理、应用与网络协议案例】

在计算机网络的世界里，C/S 工作模式是一种非常重要且广泛应用的架构模式。它如同一位幕后功臣，默默支撑着我们日常使用的众多网络服务。下面将详细介绍 C/S 工作模式是什么，以及哪些常见的应用和网络协议采用了这种模式。一、C/S 工作模式的…...

编程日记 2025/2/18 20:35:15

Django创建一个非前后端分离平台

1.pub_blog前端创立 1.blog/pub路由注意两个路由的区别 2.完善页面用表单实现 3.加载wangeditor的几个文件 4.配置样式 5.配置js代码，单独放在js文件夹中，js文件夹pub_blog onload事件，加载完成后会再加载 5.提交按钮...

编程日记 2025/2/18 20:34:13

适用于iOS的应用商店优化（ASO）清单

面对App Store的激烈竞争，您想优化您的应用使其在竞争中脱颖而出，但又不知道应该从哪里开始。我们已经为您准备好了！我们整理了一份适用于iOS的应用商店优化（ASO）检查清单，用以帮助您入门并提高您在App Sto…...

编程日记 2025/2/18 20:31:02

SSH远程服务器免密码连接｜含注意事项细节

需求描述：我想配置本地机器到ssh远程服务器的免密码连接，注意我日常会使用的集群有多个节点，每个节点的用户名以及密码都是一样的，但是不同节点的用户目录下的数据并不互通。方案： 配置本地机器到 SSH 远程服务器的…...

编程日记 2025/2/18 20:29:58

本地通过隧道连接服务器的mysql

前言服务器上部署了 mysql，本地希望能访问该 mysql，但是又不希望 mysql 直接暴露在公网上那么可以通过隧道连接 ssh 端口的方式进行连接从外网看，服务器只开放了一个 ssh 端口，并没有开放 3306 监听端口设置本地免密登录 …...

编程日记 2025/2/18 20:27:55

Hadoop 基础原理

Hadoop 基础原理基本介绍Hadoop 的必要性Hadoop 核心组件Hadoop 生态系统中的附加组件 HDFSHDFS 集群架构HDFS 读写流程HDFS 写流程HDFS 读流程 NameNode 持久化机制 MapReduce底层原理示例 Hadoop 是一个由 Apache 基金会开发的分布式系统基础架构，主要解决海量数…...

编程日记 2025/2/18 20:21:47

JavaScript 任务队列详解：Event Loop、宏任务与微任务

JavaScript 任务队列详解：Event Loop、宏任务与微任务在 JavaScript 的世界里，异步编程是一个至关重要的概念。JavaScript 采用单线程运行方式，但能够处理异步任务，这一切都要归功于事件循环（Event Loop&#xff…...

编程日记 2025/2/18 20:15:29

VScode运行后出现黑窗口

原文链接：VScode运行出黑窗口 1.安装插件：C/C Compile Run 2.快捷键【CtrlShiftp】,点击【首选项：打开用户设置】...

编程日记 2025/2/18 20:11:17

华为昇腾 910B 部署 DeepSeek-R1 蒸馏系列模型详细指南

本文记录在华为昇腾 910B(65GB) * 8 上部署 DeepSeekR1 蒸馏系列模型（14B、32B）全过程与测试结果。 NPU：910B3 (65GB) * 8 （910B 有三个版本 910B1、2、3） 模型：DeepSeek-R1-Distill-Qwen-14B、DeepSeek…...

编程日记 2025/2/18 20:10:14

vue3项目实践心得-多次渲染同一svg + 理解v-if、transition、dom加载之间的顺序

🧡🧡需求🧡🧡 未点击查看答案按钮时，步骤3面板未展示内容（v-if控制） 点击查看答案按钮后，通过graphviz绘制并展示状态转换图，渲染在步骤2中，同时步骤3的v-…...

编程日记 2025/2/18 20:04:08

【实战项目】BP神经网络识别人脸朝向----MATLAB实现

(꒪ꇴ꒪ )，Hello我是祐言QAQ我的博客主页：C/C语言，数据结构，Linux基础，ARM开发板，网络编程等领域UP🌍快上🚘，一起学习，让我们成为一个强大的攻城狮&#xff0…...

编程日记 2025/2/18 20:01:04

java数据结构_二叉树_5.5

2.7 二叉树的相关操作 1. size方法获取二叉树元素个数思路：遍历思路，在前面文章中，前序中序后序遍历的时候，会把树中的所有结点遍历一次。可以添加一个计数器，遍历一个结点就加一次。于是有如下代码&#xff1…...

编程日记 2025/2/18 19:58:57

Deepseek-R1推理模型API接入调用指南 ChatGPT Web Midjourney Proxy 开源项目接入Deepseek教程

DeepSeek-R1和OpenAI o1模型都属于推理任务模型，两个模型各有优点：DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能…...

编程日记 2025/2/18 19:53:50

计算机网络（4）TCP断开

1、TCP 断开连接四次挥手流程 TCP 断开连接是通过四次挥手方式。双方都可以主动断开连接，断开连接后主机中的「资源」将被释放。 2、为什么 TIME_WAIT 等待的时间是 2MSL？ 3、为什么需要 TIME_WAIT 状态？ 4、拔掉网线后， 原本的 …...

编程日记 2025/2/18 19:46:25

科技云报到：科技普惠潮流渐起，“开源”将带我们走向何方？

科技云报到原创。开源决定软件未来，已成为全球技术和产业创新的主导模式之一。“开源”思想的诞生，可以说是计算机发展史中极具理想主义和浪漫主义色彩的一页，是科技自由与技术极客思想的延伸。数字化浪潮奔涌，从软件开发的底…...

编程日记 2025/2/18 19:39:15

【论文笔记】On Generative Agents in Recommendation

论文信息标题： On Generative Agents in Recommendation 会议： SIGIR 24 —— CCF-A 作者： An Zhang, Yuxin Chen, Leheng Sheng 文章链接： On Generative Agents in Recommendation 代码链接： On Generative Agents…...

编程日记 2025/2/18 19:32:07

使用 Spring Boot 和 Canal 实现 MySQL 数据库同步

文章目录前言一、背景二、Canal 简介三、主库数据库配置1.主库配置2.创建 Canal 用户并授予权限四.配置 Canal Server1.Canal Server 配置文件2.启动 Canal Server 五.开发 Spring Boot 客户端1. 引入依赖2. 配置 Canal 客户端3. 实现数据同步逻辑六.启动并测试七.注意事项八…...

编程日记 2025/2/18 19:26:53

synchronized 学习

学习源： https://www.bilibili.com/video/BV1aJ411V763?spm_id_from333.788.videopod.episodes&vd_source32e1c41a9370911ab06d12fbc36c4ebc 1.应用场景不超卖，也要考虑性能问题（场景） 2.常见面试问题： sync出…...

编程新知 2025/10/23 14:31:06

【Linux】shell脚本忽略错误继续执行

在 shell 脚本中，可以使用 set -e 命令来设置脚本在遇到错误时退出执行。如果你希望脚本忽略错误并继续执行，可以在脚本开头添加 set e 命令来取消该设置。举例1 #!/bin/bash# 取消 set -e 的设置 set e# 执行命令，并忽略错误 rm somefile…...

编程新知 2025/9/11 15:27:32

DeepSeek 赋能智慧能源：微电网优化调度的智能革新路径

目录一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...

编程新知 2025/11/20 2:48:44

Xshell远程连接Kali（默认 | 私钥）Note版

前言:xshell远程连接，私钥连接和常规默认连接任务一开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务任务二修改配置文件 vi /etc/ssh/ssh_config //第一…...

编程新知 2025/11/22 0:34:44

2025年能源电力系统与流体力学国际会议 (EPSFD 2025)

2025年能源电力系统与流体力学国际会议（EPSFD 2025）将于本年度在美丽的杭州盛大召开。作为全球能源、电力系统以及流体力学领域的顶级盛会，EPSFD 2025旨在为来自世界各地的科学家、工程师和研究人员提供一个展示最新研究成果、分享实践经验及…...

编程新知 2025/11/26 15:59:52

Qt Widget类解析与代码注释

#include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this); }Widget::~Widget() {delete ui; }//解释这串代码，写上注释当然可以！这段代码是 Qt …...

编程新知 2025/11/29 21:00:30

oracle与MySQL数据库之间数据同步的技术要点

Oracle与MySQL数据库之间的数据同步是一个涉及多个技术要点的复杂任务。由于Oracle和MySQL的架构差异，它们的数据同步要求既要保持数据的准确性和一致性，又要处理好性能问题。以下是一些主要的技术要点： 数据结构差异数据类型差异&#xff…...

编程新知 2025/8/12 3:03:43

如何为服务器生成TLS证书

TLS（Transport Layer Security）证书是确保网络通信安全的重要手段，它通过加密技术保护传输的数据不被窃听和篡改。在服务器上配置TLS证书，可以使用户通过HTTPS协议安全地访问您的网站。本文将详细介绍如何在服务器上生成一个TLS证…...

编程新知 2025/9/11 5:41:27

论文浅尝 | 基于判别指令微调生成式大语言模型的知识图谱补全方法（ISWC2024）

笔记整理：刘治强，浙江大学硕士生，研究方向为知识图谱表示学习，大语言模型论文链接：http://arxiv.org/abs/2407.16127 发表会议：ISWC 2024 1. 动机传统的知识图谱补全（KGC）模型通过…...

编程新知 2025/11/29 12:43:57

什么？连接服务器也能可视化显示界面？：基于X11 Forwarding + CentOS + MobaXterm实战指南

文章目录什么是X11？环境准备实战步骤1️⃣ 服务器端配置（CentOS）2️⃣ 客户端配置（MobaXterm）3️⃣ 验证X11 Forwarding4️⃣ 运行自定义GUI程序(Python示例)5️⃣ 成功效果![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/55aefaea8a9f477e86d065227851fe3d.pn…...

编程新知 2025/10/2 17:12:14