当前位置: 首页 > news >正文

DeepSeek R1模型解读与使用

字节在春节前发布了doubao-1.5,它的官方介绍竟然是这样的:

这次发布了四个型号,doubao-1.5-pro-32k, doubao-1.5-pro-256k, doubao-1.5-lite-32k, doubao-1.5-vision-pro-32k,价格全部与上一个版本doubao模型一致,加量不加价。这次他们官方除了展示示例,也直接提供了模型指标的对比。

1、Doubao-1.5-pro

  • Knowledge(通用知识):这里对标的都是目前最好的国内外模型。先看通用知识这一块,在MMLU_PRO和GPQA这两个高难度测试集上,表现优于其他所有模型。在MMLU上仅次于GPT4o-0806。
  • Math(数学):仅次于Gemini-exp-1205(不是Gemini2.0,是Gemini的周年庆版),超过了Deepseek V3。
  • Code(代码):McEval和FullStackBench评分第一,MBPP+Deepseek V3最高。
  • Reasoning(推理):DROP指标登顶,BBH不如其他顶级模型。
  • Instruction Following(指令遵循):优于DeepSeek V3, 不如Claude3.5 sonnet以及Gemini-exp-1205
  • 中文能力:CMMLU和C-Eval评分最高。在中文写作能力方面,豆包系列原本就很强,贯彻系列一贯的优势。

从豆包的这个评测报告上来看,多项指标领先世界,综合能力很强。并且在对比中,Qwen2.5和Deepseek V3占不到什么优势。

2、Doubao-1.5-lite

Doubao-1.5-lite 在轻量版语言模型中处于全球一流水平,在综合(MMLU_pro)、推理(BBH)、数学(MATH)、专业知识(GPQA)权威测评指标持平或超越 GPT-4omini、Cluade 3.5 Haiku。

Doubao-1.5-lite-32k-250115 模型版本效果比肩9月份发布的pro系列模型 Doubao-pro-32k-240828。意味着在众多场景中,可以用 lite 模型的成本,获得此前 pro 模型的效果,价格反而还更低了。

3、Doubao-1.5-vision-pro-32K

豆包1.5的视觉模型评测,这里指标分为大学级问题(College-level Problems),数学推理(Mathematical Reasoning),文档与图表解读(Document and Diagrams Reading),通用视觉问答(General Visual Question Answering),空间与计数理解(Spatial and Counting Understanding),视频理解(Video Understanding)。

我们可以看到,在一半以上的指标,豆包视觉模型都排在第一,即使没有排第一,一般也是第二。确实非常强了。

4、模型基本规格与计费

可以说是目前的极致性价比了,对原来的模型做了极大的加强并且价格不变。而豆包的视觉模型,目前的性价比更是无人能敌。

5、总评

近一个月顶级国产模型纷纷刷屏,先是deepseek v3和deepseek r1,平替国外旗舰模型和o1。后有MiniMax-Text-01,不但综合能力顶流,支持多模态,并且是业界长上下文能力最强的模型。现在又有豆包1.5,性能直接全面超越其他旗舰模型,并做到了最便宜的价格。

如果豆包保持现在的竞争力,一两年后甚至我们能看到字节出海反攻OpenAI,复刻TikTok国际市场上的业绩。

好了,今天就到这里,虽然大家也可以在豆包的应用上直接使用豆包模型,不过高通智匠也会同步更新这些模型。有问题欢迎加群交流,我们下期再见。

相关文章:

DeepSeek R1模型解读与使用

字节在春节前发布了doubao-1.5,它的官方介绍竟然是这样的: 这次发布了四个型号,doubao-1.5-pro-32k, doubao-1.5-pro-256k, doubao-1.5-lite-32k, doubao-1.5-vision-pro-32k,价格全部与上一个版本doubao模型一致,加量…...

Windows电脑不小心点击了关机,关机过程中如何阻止

如果电脑正在关机的过程中,想要阻止关机,可以尝试以下方法: 如果关机过程较慢,可以按下键盘组合键 Win R 打开运行窗口。输入 shutdown -a 后按回车键,这将中断关机操作(适用于 Windows 系统)…...

CNN-GRU卷积门控循环单元时间序列预测(Matlab完整源码和数据)

CNN-GRU卷积门控循环单元时间序列预测(Matlab完整源码和数据) 目录 CNN-GRU卷积门控循环单元时间序列预测(Matlab完整源码和数据)预测效果基本介绍CNN-GRU卷积门控循环单元时间序列预测一、引言1.1、研究背景与意义1.2、研究现状1…...

【吉林乡镇界】面图层shp格式arcgis数据乡镇名称和编码wgs84无偏移内容测评

标题中的“吉林省乡镇界面图层shp格式arcgis数据乡镇名称和编码wgs84无偏移”揭示了这是一个地理信息系统(GIS)相关的数据集,主要用于描绘吉林省的乡镇边界。这个数据集包含了一系列的文件,它们是ArcGIS软件能够识别和处理的Shape…...

fpga学习入门 串口rs232回环

奇偶检验位这里是省略了 做好回环后可以使用上位机做回环测试,top文件写的方式就是将rx(fpga端)接受到的模块(pc端)tx发送出去,这两个端口用杜邦线连接,同理模块的rx连接fpga的tx,…...

智启未来,AI筑梦科技新星”------华清远见成都中心2025冬令营圆满结束

2025年1月11日-16日,华清远见成都中心为期6天的“智启未来,AI筑梦科技新星”2025冬令营活动圆满结束。此次活动吸引了众多对人工智能和无人驾驶技术充满热情的学生参与,共同开启了一段点燃科技梦想的精彩旅程。 报道接待 以AI无人驾驶小车为核…...

接上篇基于Alertmanager 配置钉钉告警

Alertmanager 是一个用于处理和管理 Prometheus 警报的开源工具。它负责接收来自 Prometheus 服务器的警报,进行去重、分组、静默、抑制等操作,并通过电子邮件、PagerDuty、Slack 等多种渠道发送通知。 主要功能 去重:合并相同或相似的警报&a…...

DDD - 如何设计支持快速交付的DDD技术中台

文章目录 Pre概述打造快速交付团队烟囱式的开发团队(BAD)大前端技术中台(GOOD) 技术中台的特征简单易用的技术中台建设总结 Pre DDD - 软件退化原因及案例分析 DDD - 如何运用 DDD 进行软件设计 DDD - 如何运用 DDD 进行数据库设计 DDD - 服务、实体与值对象的两种设计思路…...

JAVA与数据结构-线性表

目录 一.线性表的概念 二.线性表的关系及分类 三.数组与顺序表 四.链表 1.静态链表(链表的的数组底层实现) 2.循环链表 3.双向链表 五.栈 1.栈的概念 2.栈的底层实现 3.共享空间栈 4.逆波兰表达式(后缀表达式) 5.栈与递归 六.…...

C++|开源日志库log4cpp和glog

文章目录 log4cpp 和 glog对比1. **功能对比**2. **易用性和配置**3. **性能**4. **线程安全**5. **日志输出**6. **功能扩展**7. **适用场景**8. **总结** 其它开源C日志库1. **spdlog**2. **easylogging**3. **Boost.Log**4. **loguru**5. **Poco Logging**6. **Qt Logging (…...

React Context 实现全局组件注册

来源于GPT4o:https://ai.openaicloud.cn/?inVitecodeEJSTWFZMQE 第一步:创建全局组件上下文 (GlobalComponentProvider) 我们将创建一个 React Context 和 Provider,用于存储和提供全局组件。 // src/context/GlobalComponentProvider.tsx…...

基于AutoDL云计算平台+LLaMA-Factory训练平台微调本地大模型

1. 注册与认证 访问AutoDL官网:前往 AutoDL官网。 注册账号:完成注册流程。 实名认证:按照要求完成实名认证,以确保账号的合规性。 2. 选择GPU资源 进入算力市场:在官网首页点击“算力市场”菜单。 挑选GPU&#x…...

strdup 函数

strdup 函数是 C 标准库中的一个函数&#xff0c;用于复制一个字符串。它的全称是 "string duplicate"。这个函数在 <string.h> 头文件中声明。strdup 函数会分配足够的内存来存储源字符串的副本&#xff0c;并将源字符串的内容复制到新分配的内存中。然后返回…...

2.9/Q2,Charls最新文章解读!

文章题目&#xff1a;The causal effect of Internet use on rural middle-aged and older adults depression: A propensity score matching analysis DOI&#xff1a;10.1177/20552076241310041 中文标题&#xff1a;互联网使用对农村中老年人抑郁症的因果影响&#xff1a…...

【未完成】springboot项目实现扫码登录相关逻辑

准备工作 配置redis 引入redis依赖 <dependencies><!-- Spring Data Redis 依赖 --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis</artifactId></dependency><…...

html、js、css实现爱心效果

好的&#xff01;我们可以进一步美化这个爱心效果&#xff0c;增加更多动态和视觉吸引力。以下是改进后的代码&#xff0c;包括以下功能&#xff1a; 1. 背景渐变&#xff1a;添加动态背景渐变效果。 2. 爱心阴影&#xff1a;为爱心添加阴影&#xff0c;使其更具立体感。 3. 随…...

【前端】Hexo 建站指南

文章目录 前言生成站点本地测试部署云端参考 前言 更好的阅读体验&#xff1a;https://blog.dwj601.cn/FrontEnd/Hexo/build-your-own-website-with-hexo/ 笔记记多了&#xff0c;想要分享给同学们一起交流进步&#xff0c;该怎么办&#xff1f;想要搭建一个属于自己的知识库…...

OpenStack基础架构

openstack是一套IaaS云的解决方案&#xff0c;是一个开源的云计算管理平台 每一台物理机上都会有一个nova服务器 虚拟化其实是在nova主机里启用的 COW技术&#xff1a; 这么来看&#xff0c;3个物理机上产生10个虚拟机&#xff0c;所以把服务分散到10个虚拟机上和分散到4个虚拟…...

1905电影网中国地区电影数据分析(一) - 数据采集、清洗与存储

文章目录 前言一、数据采集步骤及python库使用版本1. python库使用版本2. 数据采集步骤 二、数据采集网页分析1. 分析采集的字段和URL1.1 分析要爬取的数据字段1.2 分析每部电影的URL1.2 分析每页的URL 2. 字段元素标签定位 三、数据采集代码实现1. 爬取1905电影网分类信息2. 爬…...

IPhone16 Plus 设备详情

目录 产品宣传图内部图——前内部图——后设备详细信息 产品宣传图 内部图——前 内部图——后 设备详细信息 信息收集于HubWeb.cn...

2025届最火的六大AI学术助手解析与推荐

Ai论文网站排名&#xff08;开题报告、文献综述、降aigc率、降重综合对比&#xff09; TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 维普AIGC检测系统专门用来识别学术文本里由人工智能生成的内容&#xff0c;随着AI写作工具变…...

SEO_快速见效的站内SEO优化检查清单与方法

SEO:快速见效的站内SEO优化检查清单与方法 在当今竞争激烈的互联网市场中&#xff0c;快速见效的站内SEO优化尤为重要。无论你是新站点的创建者&#xff0c;还是老站点的运营者&#xff0c;站内SEO优化都能帮助提升网站的搜索引擎排名&#xff0c;吸引更多访客。本文将带你了解…...

如何用kepano-obsidian构建你的终极知识管理系统:从零到精通的完整指南

如何用kepano-obsidian构建你的终极知识管理系统&#xff1a;从零到精通的完整指南 【免费下载链接】kepano-obsidian My personal Obsidian vault template. A bottom-up approach to note-taking and organizing things I am interested in. 项目地址: https://gitcode.com…...

28GHz毫米波滤波器设计实战:用SynMatrix快速搞定SIW带通滤波器(附完整参数)

28GHz毫米波滤波器设计实战&#xff1a;SynMatrix工具链的高效应用指南 在毫米波频段&#xff0c;滤波器设计一直是射频工程师面临的重大挑战之一。尤其是当工作频率上升到28GHz甚至更高时&#xff0c;传统设计方法往往陷入反复迭代的泥潭&#xff0c;耗费大量时间在仿真优化与…...

GB28181国标协议实战:用WVP+ZLMediaKit搭建一个支持级联的轻量级视频中台

GB28181国标协议实战&#xff1a;构建轻量级视频中台的架构设计与实现 在安防监控与视频管理领域&#xff0c;GB28181协议已经成为设备互联互通的事实标准。对于需要整合多品牌设备、实现统一管理的技术团队而言&#xff0c;如何快速搭建一个稳定可靠的视频中台是项目落地的关键…...

终极解决ComfyUI-Florence2模型加载问题的完整指南

终极解决ComfyUI-Florence2模型加载问题的完整指南 【免费下载链接】ComfyUI-Florence2 Inference Microsoft Florence2 VLM 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-Florence2 如果您正在使用ComfyUI-Florence2视觉语言模型却遇到了加载失败的问题&#…...

如何通过系统性抗体研发服务加速创新药物开发?

一、为何现代抗体药物研发需要系统性技术支撑&#xff1f;抗体药物作为生物制药领域的核心组成部分&#xff0c;在肿瘤、自身免疫疾病、神经系统疾病等重大疾病治疗中展现出革命性潜力。然而&#xff0c;从靶点验证到临床候选分子确立的研发过程充满复杂挑战&#xff1a;抗体分…...

告别变砖!手把手教你为HC32F460打造带断电保护的BootLoader(附完整代码)

工业级HC32F460 BootLoader设计实战&#xff1a;从防变砖到量产级解决方案 当你的嵌入式设备因为固件升级中断而变成"砖头"&#xff0c;那种绝望感每个开发者都懂。今天我们要解决的&#xff0c;正是这个让无数工程师夜不能寐的痛点——如何为HC32F460设计一个真正工…...

颠覆式项目管理工具GanttProject:让团队协作效率提升300%的开源解决方案

颠覆式项目管理工具GanttProject&#xff1a;让团队协作效率提升300%的开源解决方案 【免费下载链接】ganttproject Official GanttProject repository 项目地址: https://gitcode.com/gh_mirrors/ga/ganttproject GanttProject是一款完全免费的开源甘特图工具&#xff…...

颠覆式AI视觉自动化:3大突破重新定义UI测试与跨平台交互

颠覆式AI视觉自动化&#xff1a;3大突破重新定义UI测试与跨平台交互 【免费下载链接】midscene AI-powered, vision-driven UI automation for every platform. 项目地址: https://gitcode.com/GitHub_Trending/mid/midscene 在数字化转型加速的今天&#xff0c;UI自动化…...