当前位置: 首页 > news >正文

ChatGPT与DeepSeek:AI语言模型的巅峰对决

目录

引言

一、ChatGPT 与 DeepSeek 简介

(一)ChatGPT

(二)DeepSeek

二、技术原理剖析

(一)ChatGPT 技术原理

(二)DeepSeek 技术原理

(三)技术原理对比总结

三、性能大比拼

(一)文本生成能力

(二)上下文理解能力

(三)推理能力

(四)性能对比总结

四、应用场景对比

(一)ChatGPT 应用场景

(二)DeepSeek 应用场景

(三)应用场景对比总结

五、成本与效率考量

(一)训练成本

(二)运行效率

(三)成本与效率总结

六、结论

(一)综合对比总结

(二)未来 AI 语言模型发展的思考


引言

在当今人工智能飞速发展的时代,ChatGPT 和 DeepSeek 作为两款备受瞩目的 AI 语言模型,各自展现出了独特的魅力与实力。ChatGPT 凭借 OpenAI 的强大技术支撑和广泛的应用场景,自问世以来便成为了 AI 领域的焦点,引领着语言模型发展的潮流。而 DeepSeek 作为新兴的国产 AI 语言模型,以其创新的技术路线和对本土市场的深刻理解,迅速在全球范围内崭露头角,吸引了大量用户和开发者的关注。

这两款模型在自然语言处理能力、应用场景、性能表现等方面各有千秋。那么,究竟谁才是更强大的 AI 语言模型呢?接下来,我们将从多个维度对 ChatGPT 和 DeepSeek 进行深入剖析与对比,探寻它们的优势与不足,为大家呈现一场精彩的 AI 语言模型对决。

一、ChatGPT 与 DeepSeek 简介

(一)ChatGPT

ChatGPT 是 OpenAI 研发的聊天机器人程序,于 2022 年 11 月 30 日发布 。它基于 GPT-3.5 架构,通过大量文本数据进行训练,能够理解和生成自然语言,实现与用户的多轮对话交互。

ChatGPT 的发展历程是 AI 技术不断突破与演进的生动写照。2017 年,OpenAI 团队发表了名为《Attention Is All You Need》的论文,提出了 Transformer 架构,这一创新性的架构为后续语言模型的发展奠定了坚实基础。随后,在 2018 年,OpenAI 推出了 GPT-1,它作为首个基于 Transformer 架构的预训练语言模型,开启了自然语言处理领域的新篇章。GPT-1 在语言理解和生成任务上展现出了一定的能力,虽然在当时还存在一些局限性,但它的出现标志着 AI 语言模型进入了一个新的发展阶段。

随着技术的不断进步,OpenAI 在 2019 年发布了 GPT-2,该模型在规模和性能上都有了显著提升。GPT-2 拥有更多的参数和更大的训练数据集,使其能够生成更加连贯和自然的文本。它的出现进一步推动了自然语言处理技术的发展,引发了学术界和工业界的广泛关注。

2020 年,GPT-3 横空出世,再次震撼了整个 AI 领域。GPT-3 拥有高达 1750 亿个参数,通过在海量的互联网文本上进行训练,具备了强大的语言理解和生成能力。它能够完成各种复杂的自然语言处理任务,如文本生成、问答系统、机器翻译等,并且在很多任务上的表现都达到了人类水平。GPT-3 的发布被认为是 AI 发展史上的一个重要里程碑,为后续的研究和应用奠定了坚实的基础。

2022 年,基于 GPT-3.5 架构的 ChatGPT 正式发布,它在 GPT-3 的基础上进行了进一步的优化和改进,通过引入强化学习从人类反馈(RLHF)技术,使得模型能够更好地理解用户的意图,生成更加符合人类期望的回答。ChatGPT 的出现引起了全球范围内的广泛关注和讨论,它不仅在技术上取得了重大突破,还在商业应用领域展现出了巨大的潜力。许多企业和开发者开始将 ChatGPT 应用于各种场景,如客户服务、智能写作、教育辅助等,为人们的生活和工作带来了极大的便利。

(二)DeepSeek

DeepSeek(杭州深度求索人工智能基础技术研究有限公司)成立于 2023 年 7 月 17 日,虽然成立时间相对较短,但凭借其独特的技术优势和创新的发展理念,在 AI 领域迅速崛起,成为了备受瞩目的新兴力量。

DeepSeek 致力于开发先进的大语言模型(LLM)和相关技术,其核心团队由来自清华大学、中科院等顶尖科研机构的资深 AI 科学家组成。这些科学家在自然语言处理、深度学习等领域拥有丰富的研究经验和卓越的技术实力,为 DeepSeek 的技术创新提供了强大的智力支持。

在技术研发方面,DeepSeek 取得了一系列令人瞩目的成果。其推出的多个大语言模型在性能和功能上都展现出了独特的优势。例如,DeepSeek LLM 包含 670 亿参数,具备出色的中文和英文理解能力,在多项评测中超越了 Llama2 70B Base 和 GPT-3.5 。DeepSeek-Coder 是专为代码编程设计的模型,支持多种编程语言和项目级代码补全,能够为开发者提供高效的编程辅助。DeepSeekMath 专注于数学相关任务,凭借 5000 亿 token 的训练数据,达到了与 GPT-4 相当的性能,在数学推理和问题解决方面表现出色。

2024 年 12 月 26 日,DeepSeek 发布了 DeepSeek-V3 模型,该模型在知识类任务和生成速度上有显著提升。2025 年 1 月 20 日,DeepSeek 又发布了 DeepSeek-R1,采用强化学习技术提升模型推理能力,在数学、编程和推理等领域表现媲美 OpenAI 的最强模型 o1,且大幅降低了训练成本 。这些模型的成功发布,不仅展示了 DeepSeek 在技术研发方面的实力,也为其在市场竞争中赢得了一席之地。

除了技术研发,DeepSeek 还积极推动技术的开源和应用。其开源策略吸引了全球众多开发者的参与,形成了活跃的开源社区。开发者们可以在社区中分享经验、贡献代码,共同推动 DeepSeek 技术的发展和应用。同时,DeepSeek 也与众多企业和机构展开合作,将其技术应用于医疗、金融、教育等多个领域,为行业的数字化转型和创新发展提供了有力支持。

二、技术原理剖析

(一)ChatGPT 技术原理

ChatGPT 基于 Transformer 架构,这是一种在自然语言处理领域具有革命性意义的架构。Transformer 架构摒弃了传统的循环神经网络(RNN)和卷积神经网络(CNN)结构,通过自注意力机制(Self-Attention),能够高效地处理长序列数据,捕捉文本中的长距离依赖关系,使得模型在理解上下文语义方面表现出色。

在大规模预训练阶段,ChatGPT 使用了海量的文本数据,这些数据来源广泛,包括互联网上的文章、书籍、论文、社交媒体帖子等。通过在这些数据上进行无监督学习,模型学习到了语言的通用模式、语法规则、语义表示等知识,具备了强大的语言理解和生成能力。

为了使模型更好地适应对话场景,ChatGPT 在预训练的基础上进行了微调。微调过程采用了强化学习从人类反馈(RLHF)技术,通过人类标注者对模型生成的回复进行打分和排序,模型将这些反馈作为奖励信号,利用强化学习算法不断优化自身的策略,以生成更符合人类期望和偏好的回答。

(二)DeepSeek 技术原理

DeepSeek 采用了一系列创新技术,展现出独特的技术优势。在模型架构方面,它可能结合了 Transformer、RNN 或 CNN 等多种技术,以实现高效的文本处理。例如,通过对 Transformer 架构的优化,DeepSeek 提升了模型对长文本的处理能力和多轮对话的理解能力。

DeepSeek 的早期推理模型是其一大技术亮点。该模型能够将复杂问题分解成多个子问题,逐个进行分析和解决,就像将一件复杂的工艺品拆解成多个零部件,分别制作后再进行组装 。这种方式不仅提高了问题解决的效率,还降低了计算资源的消耗。通过优化算法和训练流程,DeepSeek 在使用较少算力的前提下,取得了与其他领先模型相近的性能,大大提高了模型的性价比。

此外,DeepSeek 还注重模型的实时学习和领域适应性。通过在线学习技术,模型能够根据用户的反馈和新的数据不断优化自身的表现,快速适应不同领域的需求。例如,在医疗、金融、法律等特定领域,DeepSeek 可以通过微调和迁移学习,将领域知识融入模型中,使其能够更好地处理专业问题,提供更准确和专业的回答。

(三)技术原理对比总结

从技术原理上看,ChatGPT 和 DeepSeek 各有千秋。ChatGPT 基于 Transformer 架构和大规模预训练,在语言理解和生成的通用性方面表现出色,通过 RLHF 技术使其回答更符合人类语言习惯和期望 。而 DeepSeek 则通过创新的模型架构和早期推理模型,在资源利用效率、实时学习和领域适应性方面展现出独特的优势,能够在特定场景下提供高效的解决方案。

两者的技术差异也决定了它们在不同应用场景中的适用性。ChatGPT 更适合需要广泛知识覆盖和自然语言生成的通用场景,如聊天对话、创意写作、通用问答等;而 DeepSeek 则在对计算资源有限制、需要快速部署和特定领域优化的场景中具有更大的优势,如企业级应用、实时交互系统、专业领域的辅助工具等。

三、性能大比拼

(一)文本生成能力

为了对比 ChatGPT 和 DeepSeek 的文本生成能力,我们进行了一系列实际测试。在故事创作任务中,给定开头 “在一个遥远的神秘岛屿上,生活着一群奇特的生物”,要求模型续写一段完整的故事。

ChatGPT 生成的故事情节丰富,语言流畅自然,对生物的描写细腻生动,如 “这些生物拥有五彩斑斓的羽毛,它们的翅膀轻轻一扇,便能带动周围的空气形成绚丽的光影。岛上的树木高大而茂密,每一片叶子都闪烁着神秘的光芒,仿佛在诉说着古老的传说。” 整个故事逻辑连贯,按照常见的冒险故事模式展开,充满了想象力和趣味性。

DeepSeek 生成的故事则更具创新性,在情节设计上大胆新颖,“这些奇特的生物具有心灵感应的能力,它们能够通过思想交流,共同守护着岛屿的秘密。然而,有一天,一位来自外界的探险家意外闯入了这个岛屿,打破了原有的宁静。生物们起初对探险家充满了警惕,但在与他的接触中,逐渐发现了彼此的善良和智慧,于是,一场跨越种族的友谊悄然展开。” 故事在语言表达上也较为出色,能够准确地传达出独特的创意。

从测试结果来看,ChatGPT 生成的文本在连贯性和语言流畅度方面表现出色,能够自然地延续给定的开头,构建出一个完整且引人入胜的故事 。而 DeepSeek 则在创意性方面更胜一筹,能够提出独特的想法和情节,为故事增添了更多的惊喜和新鲜感。

模型

连贯性

创意性

逻辑性

ChatGPT

9

7

8

DeepSeek

8

9

8

(评分标准:1 - 10 分,10 分为最佳)

(二)上下文理解能力

我们设置了多轮对话和长文本测试,以评估两者的上下文理解能力。在多轮对话测试中,与模型进行如下对话:

用户:“我最近想去旅游,推荐一些国内的旅游景点。”

模型回答后,用户接着问:“这些地方有什么特色美食吗?”

ChatGPT 能够较好地理解上下文,在回答第二个问题时,能够紧密结合之前推荐的旅游景点,介绍相应的特色美食,如 “如果你去成都,一定要尝尝麻辣鲜香的火锅,还有龙抄手、钟水饺等特色小吃;去杭州的话,西湖醋鱼、龙井虾仁是不容错过的美食。”

DeepSeek 在上下文理解方面也表现出色,不仅能准确回答第二个问题,还能进一步拓展,“除了美食,成都的茶馆文化也很值得体验,你可以坐在茶馆里,品尝着盖碗茶,欣赏着川剧变脸;杭州的丝绸也非常有名,你可以在游玩之余购买一些作为纪念品。”

在长文本测试中,我们提供一篇关于历史事件的长文章,然后提出相关问题。ChatGPT 和 DeepSeek 都能较好地理解长文本的主旨和关键信息,准确回答问题。但在一些细节理解上,DeepSeek 展现出了更强的能力,能够从文本中提取更细微的信息,并进行准确的分析和回答。

模型

多轮对话理解准确率

长文本理解准确率

ChatGPT

85%

80%

DeepSeek

88%

85%

(三)推理能力

为了测试两者的推理能力,我们给出了一些复杂问题,如 “如果今天是星期二,再过 50 天是星期几?”

ChatGPT 能够快速分析问题,运用数学逻辑进行推理,“一周有 7 天,50 除以 7 等于 7 余 1,所以再过 50 天是星期三。” 推理过程清晰明了,回答准确。

DeepSeek 同样表现出色,不仅给出了正确答案,还详细解释了推理过程,“因为一周的周期是 7 天,50 = 7×7 + 1,这意味着经过了 7 个完整的星期后,又多了 1 天。今天是星期二,那么再过 50 天就是在星期二的基础上往后推 1 天,即星期三。”

在代码示例展示推理过程方面,我们以 Python 代码实现一个简单的数学推理问题为例。问题是:计算 1 到 100 之间所有能被 3 整除的数的和。

ChatGPT 生成的 Python 代码如下:

 

sum_num = 0

for i in range(1, 101):

if i % 3 == 0:

sum_num += i

print(sum_num)

DeepSeek 生成的代码如下:

 

total = 0

for num in range(1, 101):

if not num % 3:

total += num

print(total)

可以看出,两者生成的代码都能正确解决问题,ChatGPT 的代码注释更详细,便于理解;DeepSeek 的代码则更简洁,在逻辑表达上更为精炼。

(四)性能对比总结

综合各项性能测试,ChatGPT 在文本生成的连贯性和语言流畅度方面表现出色,上下文理解能力和推理能力也较为优秀,能够满足大多数用户的需求。而 DeepSeek 在创意性、上下文细节理解和推理过程的详细解释方面具有优势,尤其在处理需要创新思维和深入分析的任务时,表现更为突出。

四、应用场景对比

(一)ChatGPT 应用场景

ChatGPT 凭借其强大的语言理解和生成能力,在多个领域展现出了广泛的应用潜力。在创意写作领域,许多作家和内容创作者利用 ChatGPT 获取灵感、生成故事大纲和情节。例如,一位科幻小说作家在创作新作品时,通过与 ChatGPT 交流,获取了关于未来科技和外星文明的创意,为小说的创作提供了丰富的素材 。

在智能客服领域,ChatGPT 的应用也十分广泛。许多企业将 ChatGPT 集成到客服系统中,实现 24/7 全天候服务,快速响应客户的常见问题,提高客户服务效率和满意度。以一家电商公司为例,使用 ChatGPT 构建的智能客服系统,能够自动回答客户关于商品信息、订单查询、物流跟踪等常见问题,显著减少了客户等待时间,同时节省了人力成本 。

在教育辅助方面,ChatGPT 可以作为智能学习助手,为学生提供个性化的学习支持。在日语教学中,教师可以让学生借助 ChatGPT 生成更多的短句,来学习新词的应用场景;还可以要求学生对 ChatGPT 生成的内容进行句子替换,以扩大自己的词汇量 。在编程学习中,学生可以利用 ChatGPT 解决编程难题,同时培养批判性思维,学会审视 ChatGPT 给出的答案,提高自己的编程能力。

(二)DeepSeek 应用场景

DeepSeek 在企业级应用中表现出色,尤其在数据处理和分析方面具有独特的优势。数商云 deepseek 场景解决方案,凭借其强大的数据处理能力、智能分析算法和丰富的应用场景,为企业提供了从数据收集、整合、分析到应用的全链条解决方案。在市场营销场景中,deepseek 可以帮助企业实现精准营销和个性化推荐。通过对消费者行为数据、社交媒体数据、市场趋势数据等多维度数据的分析,deepseek 能够深入了解消费者的需求和偏好,为企业制定精准的营销策略提供有力支持 。

在领域特定任务中,DeepSeek 的专业性得到了充分体现。例如,在医疗领域,多家企业宣布接入 DeepSeek,借助其技术优化业务流程,提升决策效率。通过智能数据分析,企业可以更精准地预测市场趋势,优化药品供应链;利用智能诊断技术,可以提高疾病诊断的准确性和效率 。在金融领域,DeepSeek 可以用于风险评估、投资决策等任务,为金融机构提供专业的数据分析和决策支持。

在实时交互场景中,DeepSeek 注重低延迟推理,能够快速响应用户的请求。例如,在智能客服场景中,DeepSeek 可以与用户进行实时对话,提供准确、快速的回答,提升用户体验。在智能驾驶场景中,DeepSeek 可以实时处理传感器数据,做出快速的决策,保障驾驶安全。

(三)应用场景对比总结

ChatGPT 和 DeepSeek 的应用场景存在一定的差异。ChatGPT 更侧重于通用场景,如创意写作、智能客服、教育辅助等,能够满足大众用户在日常生活和工作中的多样化需求,其优势在于语言生成的自然流畅和广泛的知识覆盖 。而 DeepSeek 则在企业级应用、领域特定任务和实时交互场景中具有明显优势,能够为企业和专业领域提供高效、精准的解决方案,其优势在于强大的数据处理能力、对特定领域知识的深入理解和快速的响应速度。

在选择使用 ChatGPT 还是 DeepSeek 时,用户应根据自身的具体需求和应用场景来决定。如果是个人用户,需要进行创意写作、日常聊天、通用知识查询等,ChatGPT 可能是更好的选择;如果是企业用户,需要进行大规模的数据处理、分析,或者在特定领域(如医疗、金融、教育等)进行专业应用开发,DeepSeek 则更能满足需求。

五、成本与效率考量

(一)训练成本

训练成本是衡量 AI 语言模型发展的重要因素之一,它不仅反映了模型研发的资源投入,还对模型的应用和推广产生深远影响。ChatGPT 的训练成本高昂,以 GPT-3 为例,其训练成本估计达 460 万美元,而 GPT-4 的训练成本更是高达 5 亿美元 。这主要是因为 ChatGPT 采用了大规模的模型架构和海量的数据进行训练,需要消耗大量的计算资源和时间。

相比之下,DeepSeek 在训练成本方面展现出了显著的优势。以 DeepSeek-V3 为例,其训练成本仅为 557 万美元 ,约为 ChatGPT 训练成本的 1%。DeepSeek 能够实现低训练成本的关键在于其创新的技术架构和高效的训练算法。DeepSeek-V3 采用了混合专家(MoE)架构,这种架构允许模型在处理不同任务时,仅激活部分专家模块,从而大大减少了计算量和内存消耗。DeepSeek 还采用了高效的训练算法,如动态稀疏激活、混合专家系统(MoE)等,进一步提高了训练效率,降低了训练成本。

模型

训练成本

ChatGPT

5 亿美元

DeepSeek

557 万美元

(二)运行效率

运行效率是衡量 AI 语言模型性能的重要指标,它直接影响到用户的使用体验和应用场景的拓展。在响应速度方面,DeepSeek 表现出色。以 DeepSeek-V3 为例,它支持多单词预测,能够在生成内容时同时预测多个单词,这使得其生成效率提升了 3 倍,从原本每秒 20 个 token 的生成速率提升至 60 个 token 。而 ChatGPT 的推理速度相对较慢,约为每秒 20 个 token。

在资源消耗方面,DeepSeek 同样具有优势。由于采用了 MoE 架构,DeepSeek 能够根据输入数据的特性选择性激活部分专家,避免了不必要的计算,从而减少了计算量和内存消耗。而 ChatGPT 由于其庞大的模型规模和复杂的计算需求,在运行过程中需要消耗大量的计算资源,对硬件设备的要求较高。

模型

响应速度(token / 秒)

资源消耗

ChatGPT

20

DeepSeek

60

(三)成本与效率总结

成本与效率对 ChatGPT 和 DeepSeek 的应用产生了重要影响。对于需要大规模应用和长期使用的场景,如企业级应用、智能客服等,DeepSeek 的低训练成本和高运行效率使其具有更高的性价比,能够为企业节省大量的成本。而对于一些对模型性能要求极高、对成本不太敏感的场景,如科研机构的前沿研究、高端创意写作等,ChatGPT 的强大性能和广泛的知识覆盖可能更具吸引力。

综上所述,ChatGPT 和 DeepSeek 在成本与效率方面各有优劣,用户在选择使用时应根据自身的实际需求和预算进行综合考虑。

六、结论

(一)综合对比总结

通过对 ChatGPT 和 DeepSeek 在技术原理、性能表现、应用场景以及成本与效率等多个维度的深入对比分析,我们可以清晰地看到这两款 AI 语言模型各有千秋。

ChatGPT 凭借其基于 Transformer 架构的大规模预训练和强化学习从人类反馈技术,在语言理解和生成的通用性、文本生成的连贯性和语言流畅度方面表现卓越,能够为用户提供自然、流畅且富有逻辑性的回答,在通用场景如创意写作、智能客服、教育辅助等领域具有广泛的应用和出色的表现。然而,其高昂的训练成本和相对较慢的推理速度在一定程度上限制了其在一些对成本敏感和实时性要求较高的场景中的应用。

DeepSeek 则通过创新的模型架构和早期推理模型,展现出了在资源利用效率、实时学习和领域适应性方面的独特优势。它能够在处理复杂问题时,将问题分解为多个子问题进行分析和解决,提高了问题解决的效率和准确性。在上下文细节理解和推理过程的详细解释方面,DeepSeek 也表现出色,尤其适用于企业级应用、领域特定任务和实时交互场景。此外,DeepSeek 的低训练成本和高运行效率使其在成本效益方面具有明显的竞争力。

(二)未来 AI 语言模型发展的思考

随着人工智能技术的不断发展,AI 语言模型作为其中的重要组成部分,未来的发展趋势和方向备受关注。从技术层面来看,模型的性能将继续提升,包括语言理解能力、推理能力、生成能力等方面都将取得更大的突破。同时,多模态融合将成为一个重要的发展方向,AI 语言模型将不仅能够处理文本数据,还能够与图像、音频、视频等多种模态的数据进行交互和融合,实现更加丰富和全面的信息处理。

在应用方面,AI 语言模型将更加深入地融入到各个行业和领域,为人们的生活和工作带来更多的便利和创新。例如,在医疗领域,AI 语言模型可以辅助医生进行疾病诊断、治疗方案制定和医学文献分析;在金融领域,它可以用于风险评估、投资决策和客户服务等;在教育领域,它可以提供个性化的学习支持和智能辅导。

未来的 AI 语言模型还需要更加注重伦理和安全问题。随着 AI 技术的广泛应用,数据隐私、算法偏见、虚假信息传播等问题日益凸显,需要建立健全的伦理和安全框架,确保 AI 语言模型的发展和应用符合人类的价值观和利益。

ChatGPT 和 DeepSeek 作为当前 AI 语言模型领域的杰出代表,它们的发展和竞争推动了整个行业的进步。无论是选择 ChatGPT 还是 DeepSeek,都应根据具体的需求和场景来决定。而对于 AI 语言模型的未来发展,我们充满期待,相信在技术创新和应用拓展的双重驱动下,AI 语言模型将为人类社会的发展带来更多的惊喜和变革。

相关文章:

ChatGPT与DeepSeek:AI语言模型的巅峰对决

目录 引言 一、ChatGPT 与 DeepSeek 简介 (一)ChatGPT (二)DeepSeek 二、技术原理剖析 (一)ChatGPT 技术原理 (二)DeepSeek 技术原理 (三)技术原理对比…...

DaoCloud 亮相 2025 GDC丨开源赋能 AI 更多可能

2025 年 2 月 21 日至 23 日,上海徐汇西岸,2025 全球开发者先锋大会以 “模塑全球,无限可能” 的主题,围绕云计算、机器人、元宇宙等多元领域,探讨前沿技术创新、应用场景拓展和产业生态赋能,各类专业论坛、…...

人工智能之数学基础:线性代数中矩阵的运算

本文重点 矩阵的运算在解决线性方程组、描述线性变换等方面发挥着至关重要的作用。通过对矩阵进行各种运算,可以简化问题、揭示问题的本质特征。在实际应用中,我们可以利用矩阵运算来处理图像变换、数据分析、电路网络等问题。深入理解和掌握矩阵的运算,对于学习线性代数以…...

(上)基于机器学习的图像识别——遥感图像分类(LeNet-5;AlexNet;VGGNet;GoogLeNet;ResNet)

遥感图像识别: 专业词汇: kernel:卷积 目录 遥感图像分类 1.1 LeNet-5 视频来源: 任务:使用什么网络实现遥感图像的分类 LeNet-5结构: 遥感图像分类 1.2 AlexNet(冠军) 视频…...

数据集笔记:NUSMods API

1 介绍 NUSMods API 包含用于渲染 NUSMods 的数据。这些数据包括新加坡国立大学(NUS)提供的课程以及课程表的信息,还包括上课地点的详细信息。 可以使用并实验这些数据,它们是从教务处提供的官方 API 中提取的。 该 API 由静态的…...

HTML元素,标签到底指的哪块部分?单双标签何时使用?

1. 标签&#xff08;Tag&#xff09; vs 元素&#xff08;Element&#xff09; 标签&#xff08;Tag&#xff09; 标签是 HTML 中用于定义元素的符号&#xff0c;用尖括号 < > 包裹。例如 <img> 是标签。元素&#xff08;Element&#xff09; 元素是由 标签 内容…...

基于ai技术的视频生成工具

一、通用型AI视频生成工具 腾讯智影 特点&#xff1a;支持数字人播报、文字转视频&#xff0c;提供免费模板和素材库&#xff0c;登录即送5分钟免费时长&#xff0c;每日签到可兑换额外额度。 限制&#xff1a;免费版分辨率较低&#xff0c;部分高级功能需付费。 LunaAI.vid…...

【Java 后端】Restful API 接口

Restful API 接口 REST&#xff1a;Representational State Transfer&#xff0c;表现层&#xff08;前端的视图页面和后端的控制层&#xff09;资源状态转移。 一种软件架构的风格&#xff08;格式&#xff09; RESTful 是目前最流行的互联网软件架构&#xff0c;如果一个架…...

Matlab地图绘制教程第2期—水陆填充图

上一期分享了海岸线图的绘制方法&#xff1a; 本着由浅入深的理念&#xff0c;本期再来分享一下水陆填充图的绘制方法。 先来看一下成品效果&#xff1a; 特别提示&#xff1a;Matlab地图绘制教程系列&#xff0c;旨在降低大家使用Matlab进行地图类科研绘图的门槛&#xff0c;…...

企业知识库搭建:14款开源与免费系统选择

本文介绍了以下14 款知识库管理系统&#xff1a;1.Worktile&#xff1b;2.PingCode&#xff1b;3.石墨文档&#xff1b; 4. 语雀&#xff1b; 5. 有道云笔记&#xff1b; 6. Bitrix24&#xff1b; 7. Logseq等。 在如今的数字化时代&#xff0c;企业和团队面临着越来越多的信息…...

【Linux系统】—— 冯诺依曼体系结构与操作系统初理解

【Linux系统】—— 冯诺依曼体系结构与操作系统初理解 1 冯诺依曼体系结构1.1 基本概念理解1.2 CPU只和内存打交道1.3 为什么冯诺依曼是这种结构1.4 理解数据流动 2 操作系统2.1 什么是操作系统2.2 设计OS的目的2.3 操作系统小知识点2.4 如何理解"管理"2.5 系统调用和…...

Android内存优化指南:从数据结构到5R法则的全面策略

目录 一、APP 内存限制 二、内存的三大问题 2.1、内存抖动(Memory Churn) 2.1.1 频繁创建短生命周期对象 2.1.2 系统API或第三方库的不合理使用 2.1.3 Handler使用不当 2.2、内存泄漏(Memory Leak) 2.2.1 静态变量持有Activity或Context引用 2.2.2 未取消的回调或…...

机器学习:线性回归,梯度下降,多元线性回归

线性回归模型 (Linear Regression Model) 梯度下降算法 (Gradient Descent Algorithm) 的数学公式 多元线性回归&#xff08;Multiple Linear Regression&#xff09;...

Linux上用C++和GCC开发程序实现两个不同MySQL实例下单个Schema稳定高效的数据迁移到其它MySQL实例

设计一个在Linux上运行的GCC C程序&#xff0c;同时连接三个不同的MySQL实例&#xff0c;其中两个实例中分别有两个Schema的表结构分别与第三实例中两个Schema个结构完全相同&#xff0c;同时复制两个实例中两个Schema里的所有表的数据到第三个实例中两个Schema里&#xff0c;使…...

RabbitMQ系列(一)架构解析

RabbitMQ 架构解析 RabbitMQ 是一个基于 AMQP 协议的开源消息中间件&#xff0c;其核心架构通过多组件协作实现高效、可靠的消息传递。以下是其核心组件与协作流程的详细说明&#xff1a; 一、核心组件与功能 Broker&#xff08;消息代理服务器&#xff09; RabbitMQ 服务端核…...

XSL 语言:XML 样式表的语言基础与应用

XSL 语言:XML 样式表的语言基础与应用 引言 XSL(Extensible Stylesheet Language)是一种专门用于XML文档样式的语言,它允许用户定义XML文档的格式、布局和外观。XSL是XML技术家族中的重要组成部分,与XML和XPATH等语言共同构成了处理和格式化XML文档的强大工具集。本文将…...

【计算机网络】常见tcp/udp对应的应用层协议,端口

TCP 和 UDP 对应的常见应用层协议 &#x1f4cc; 基于 TCP 的应用层协议 协议全称用途默认端口HTTPHyperText Transfer Protocol超文本传输协议80HTTPSHTTP Secure加密的超文本传输协议443FTPFile Transfer Protocol文件传输协议&#xff08;20 传输数据&#xff0c;21 控制连…...

ExpMoveFreeHandles函数分析和备用空闲表的关系

第一部分&#xff1a;ExpMoveFreeHandles和备用空闲表的关系 ULONG ExpMoveFreeHandles ( IN PHANDLE_TABLE HandleTable ) { ULONG OldValue, NewValue; ULONG Index, OldIndex, NewIndex, FreeSize; PHANDLE_TABLE_ENTRY Entry, FirstEntry; EXHAND…...

微服务学习(1):RabbitMQ的安装与简单应用

目录 RabbitMQ是什么 为什么要使用RabbitMQ RabbitMQ的安装 RabbitMQ架构及其对应概念 队列的主要作用 交换机的主要作用 RabbitMQ的应用 通过控制面板操作&#xff08;实现收发消息&#xff09; RabbitMQ是什么 RabbitMQ是一个开源的消息队列软件&#xff08;消息代理…...

基于javaweb的SSM+Maven幼儿园管理系统设计和实现(源码+文档+部署讲解)

技术范围&#xff1a;SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容&#xff1a;免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论…...

51c自动驾驶~合集58

我自己的原文哦~ https://blog.51cto.com/whaosoft/13967107 #CCA-Attention 全局池化局部保留&#xff0c;CCA-Attention为LLM长文本建模带来突破性进展 琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制&#xff08;CCA-Attention&#xff09;&#xff0c;…...

Spark 之 入门讲解详细版(1)

1、简介 1.1 Spark简介 Spark是加州大学伯克利分校AMP实验室&#xff08;Algorithms, Machines, and People Lab&#xff09;开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目&#xff0c;8个月后成为Apache顶级项目&#xff0c;速度之快足见过人之处&…...

23-Oracle 23 ai 区块链表(Blockchain Table)

小伙伴有没有在金融强合规的领域中遇见&#xff0c;必须要保持数据不可变&#xff0c;管理员都无法修改和留痕的要求。比如医疗的电子病历中&#xff0c;影像检查检验结果不可篡改行的&#xff0c;药品追溯过程中数据只可插入无法删除的特性需求&#xff1b;登录日志、修改日志…...

【JVM】- 内存结构

引言 JVM&#xff1a;Java Virtual Machine 定义&#xff1a;Java虚拟机&#xff0c;Java二进制字节码的运行环境好处&#xff1a; 一次编写&#xff0c;到处运行自动内存管理&#xff0c;垃圾回收的功能数组下标越界检查&#xff08;会抛异常&#xff0c;不会覆盖到其他代码…...

深入理解JavaScript设计模式之单例模式

目录 什么是单例模式为什么需要单例模式常见应用场景包括 单例模式实现透明单例模式实现不透明单例模式用代理实现单例模式javaScript中的单例模式使用命名空间使用闭包封装私有变量 惰性单例通用的惰性单例 结语 什么是单例模式 单例模式&#xff08;Singleton Pattern&#…...

Linux云原生安全:零信任架构与机密计算

Linux云原生安全&#xff1a;零信任架构与机密计算 构建坚不可摧的云原生防御体系 引言&#xff1a;云原生安全的范式革命 随着云原生技术的普及&#xff0c;安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测&#xff0c;到2025年&#xff0c;零信任架构将成为超…...

[Java恶补day16] 238.除自身以外数组的乘积

给你一个整数数组 nums&#xff0c;返回 数组 answer &#xff0c;其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。 请 不要使用除法&#xff0c;且在 O(n) 时间复杂度…...

rnn判断string中第一次出现a的下标

# coding:utf8 import torch import torch.nn as nn import numpy as np import random import json""" 基于pytorch的网络编写 实现一个RNN网络完成多分类任务 判断字符 a 第一次出现在字符串中的位置 """class TorchModel(nn.Module):def __in…...

Git 3天2K星标:Datawhale 的 Happy-LLM 项目介绍(附教程)

引言 在人工智能飞速发展的今天&#xff0c;大语言模型&#xff08;Large Language Models, LLMs&#xff09;已成为技术领域的焦点。从智能写作到代码生成&#xff0c;LLM 的应用场景不断扩展&#xff0c;深刻改变了我们的工作和生活方式。然而&#xff0c;理解这些模型的内部…...

mac:大模型系列测试

0 MAC 前几天经过学生优惠以及国补17K入手了mac studio,然后这两天亲自测试其模型行运用能力如何&#xff0c;是否支持微调、推理速度等能力。下面进入正文。 1 mac 与 unsloth 按照下面的进行安装以及测试&#xff0c;是可以跑通文章里面的代码。训练速度也是很快的。 注意…...