当前位置: 首页 > news >正文

【AI模型对比】Kimi与ChatGPT的差距:真实对比它们在六大题型中的全面表现!

文章目录

    • Moss前沿AI
    • 语义理解
    • 文学知识
    • 数学计算
    • 天文学知识
    • 物理学知识
    • 英语阅读理解
    • 详细对比列表
    • 总结与建议

在这里插入图片描述

Moss前沿AI

【OpenAI】获取OpenAI API Key的多种方式全攻略:从入门到精通,再到详解教程!!

【VScode】VSCode中的智能AI-GPT编程利器,全面揭秘ChatMoss & ChatGPT中文版

【GPT-o1系列模型!支持Open API调用、自定义助手、文件上传等强大功能,助您提升工作效率!】>>> - CodeMoss & ChatGPT-AI中文版

在人工智能迅猛发展的今天,各类AI模型层出不穷,为我们的工作和生活带来了极大的便利。作为开发者和技术爱好者,选择一款高效且强大的AI模型至关重要。

本文将通过六道题测试,详尽对比Kimi新推出的k0-math与ChatGPT-o1两大模型在语义理解、文学知识、数学计算、天文学知识、物理学知识以及英语阅读理解六个方面的表现,帮助您全面了解这两款AI模型的实际应用能力。

在这里插入图片描述

语义理解

题目:两个男人正常交谈,其中一个男人夸赞对方办事能力强,对方回答“哪里,哪里”。这里的“哪里,哪里”是什么意思?

选项
A. 讲话十分含糊不清
B. 要求说出具体的优点
C. 表达自己的谦虚
D. 挑衅对方

答案:C. 表达自己的谦虚


Kimi大模型 - 新推出的k0-math

Kimi的回答:
这里的“哪里,哪里”是中国人在被夸赞时常用的一种谦虚的表达方式,意思是“哪里哪里,过奖了”,用来表示自己并没有对方说的那么好,或者认为自己做的事情不值一提。所以正确答案是:C. 表达自己的谦虚。

语义理解图

CodeMoss-ChatGPT-o1模型

ChatGPT-o1的回答:
在这种情况下,“哪里,哪里”通常用来表达对对方夸赞的谦虚回应。因此,正确答案是:C. 表达自己的谦虚。
这种表达方式在中文交流中常用于礼貌地拒绝过度的赞美,显示出说话者的谦逊态度

语义理解图

对比分析
两者在此题上的表现相当一致,均正确理解了“哪里,哪里”在此情境下的含义。Kimi的回答更为详细,解释了其文化背景,而ChatGPT-o1则简洁明了地给出了答案。

文学知识

题目:选出下列句子中成语使用错误的一项。

选项
A. 这个项目时间紧任务重,大家都在马不停蹄地奔波劳碌
B. 他常常口是心非,让人难以相信他说的话
C. 两人是同学三年,一直保持着良好的关系,相互尊重、相敬如宾
D. 当地突发大火,整个村庄都鸡犬不宁局势十分危急

答案:C. 两人是同学三年,一直保持着良好的关系,相互尊重、相敬如宾


Kimi大模型 - 新推出的k0-math

Kimi的回答:
选项C中的成语“相敬如宾”使用错误。这个成语原指夫妻之间互相尊重,如同对待宾客一样,后来也用来形容夫妻之间关系和睦。但在选项C中,描述的是两人是同学关系,并非夫妻,因此“相敬如宾”并不适用于描述同学之间的关系。正确的成语可能是“相敬如友”或“相敬如师”,用以形容同学之间相互尊重的关系。其他选项中的成语使用都是正确的。

文学知识图

CodeMoss-ChatGPT-o1模型

ChatGPT-o1的回答:
题目要求选出成语使用错误的一项。让我们分别分析各选项中的成语使用情况:

A. 这个项目时间紧任务重,大家都在马不停蹄地奔波劳碌。
成语“马不停蹄”意指忙碌不停,符合句意,使用正确。

B. 他常常口是心非,让人难以相信他说的话。
成语“口是心非”意指说话表面上一套,心里却是另一套,符合句意,使用正确。

C. 两人是同学三年,一直保持着良好的关系,相互尊重、相敬如宾。
成语“相敬如宾”通常用于夫妻之间,表示彼此尊重如同待客一般。在这里用于同学关系,稍显生硬,但并非错误使用。

D. 当地突发大火,整个村庄都鸡犬不宁局势十分危急。
成语“鸡犬不宁”指因动荡或混乱而导致的局势不安。用于描述因大火导致的村庄混乱,符合句意,使用正确。

综上所述,所有选项中的成语使用均正确,没有错误项。
然而,如果必须选择一个最不恰当的选项,选项C的“相敬如宾”用在同学关系上不如用于夫妻关系常见。

文学知识图

对比分析
Kimi认为选项C使用成语错误,而ChatGPT-o1指出其实所有选项均无明显错误,仅指出C项的用法不够常见。Kimi在判断上更为严格,而ChatGPT-o1则更为宽容。这反映出Kimi可能在成语使用的判断上更加严格和精确。

数学计算

题目:天气预报说本周星期三会下雨,昨天果然下雨了,今天星期几?

答案:星期四


Kimi大模型 - 新推出的k0-math

Kimi的回答:
如果昨天下雨了,而天气预报说本周星期三会下雨,那么昨天就是星期三。所以今天就是星期三的后一天,也就是星期四。

数学计算图

CodeMoss-ChatGPT-o1模型

ChatGPT-o1的回答:
根据题意:

天气预报说本周星期三会下雨。
昨天下雨了。
也就是说,昨天是星期三。因此,今天是星期四。

答案:今天是星期四。

数学计算图

对比分析
在数学计算题上,两者均正确并逻辑清晰地推导出答案。说明在基础数学问题的处理上,Kimi和ChatGPT-o1的表现不分伯仲,均能准确得出结论。

天文学知识

题目:下列有关名著的表述有误的一项。

选项
A.《红楼梦》是中国古代小说中的巅峰之作以其瑰丽的语言和丰富的人物形象而闻名于世
B.《西游记》是中国古代四大名著之一,讲述了唐僧师徒历经九九八十一难,最终取得真经的故事
C.《孔乙己》是鲁迅的代表作之一,以其深刻的社会洞察力和优美的文学风格而广受好评
D.《围城》是钱钟书的代表作之一,以其独特的文学语言和深刻的社会洞察力而成为现代中国文学的经典之作


Kimi大模型 - 新推出的k0-math

Kimi的回答:

选项C《孔乙己》的表述有误。《孔乙己》确实是鲁迅的代表作之一,以其深刻的社会洞察力和尖锐的讽刺手法而广受好评,而不是以其“优美的文学风格”。鲁迅的作品以其深刻的社会批判和现实主义风格著称,而不是优美。其他选项的表述都是正确的。
天文学知识图

CodeMoss-ChatGPT-o1模型

ChatGPT-o1的回答:

题目要求选出有关名著表述有误的一项。让我们逐一分析各选项:A.《红楼梦》是中国古代小说中的巅峰之作,以其瑰丽的语言和丰富的人物形象而闻名于世。  
正确。《红楼梦》被广泛认为是中国古典小说的巅峰之作,以其细腻的描写和复杂的人物关系著称。B.《西游记》是中国古代四大名著之一,讲述了唐僧师徒历经九九八十一难,最终取得真经的故事。  
正确。《西游记》确实是中国古代四大名著之一,讲述了唐僧及其三个徒弟取经的艰难历程。C.《孔乙己》是鲁迅的代表作之一,以其深刻的社会洞察力和优美的文学风格而广受好评。  
有误。《孔乙己》是鲁迅的著名短篇小说,确实展现了深刻的社会洞察力,但“优美的文学风格”这一描述有些不准确。鲁迅的作品更多以现实主义和讽刺手法见长,强调社会批判和人性的探讨,而不以“优美”著称。因此,这一表述在文学风格上的描述有偏差。D.《围城》是钱钟书的代表作之一,以其独特的文学语言和深刻的社会洞察力而成为现代中国文学的经典之作。  
正确。《围城》是钱钟书的代表作,以其幽默讽刺的语言和对社会、人性深刻的洞察而广受赞誉,成为现代中国文学的经典。综上所述,选项C的表述有误。  
答案:C

天文学知识图

对比分析
Kimi和ChatGPT-o1都准确识别出选项C中的错误,但ChatGPT-o1的分析更为详细,解释了为什么“优美的文学风格”不适用于《孔乙己》。Kimi的回答虽然正确,但缺乏进一步的解释和背景说明。

物理学知识

题目:百货公司托搬运公司运送1000个玻璃花瓶,每个玻璃花瓶的运费是1元5角,如果打破一个,搬运公司不但不支付运费,还要赔偿9元5角。百货公司最后付了1456元,搬运过程中一共打破了几个花瓶?


Kimi大模型 - 新推出的k0-math

Kimi的回答:是4个花瓶

物理学知识图

CodeMoss-ChatGPT-o1模型

ChatGPT-o1的回答:是4个花瓶

物理学知识图

对比分析
在此复杂的物理解题中,Kimi与ChatGPT-o1均准确回答了打破的玻璃花瓶数量。然而,具体的详细过程还是一起看图片吧!

英语阅读理解

题目:‌《雄辩症》‌

一位医生向我介绍,他们在门诊中接触了一位雄辩症病人。医生说:“请坐。”病人说:“但你不应当否认北极的存在。你否认北极的存在,就是歪曲事实真相,就是别有用心。”医生说:“你走吧。”病人说:“你无权命令我走。你是医院,不是公安机关,你不可能逮捕我,你也不可能枪毙我。”经过多方调查,才知道病人当年参与过“梁效”的写作班子,估计可能是一种后遗症‌


Kimi大模型 - 新推出的k0-math

Kimi的回答:
《Eloquence Syndrome》
A doctor introduced to me that they encountered a patient with eloquence syndrome in the outpatient department. The doctor said, “Please sit down.” The patient replied, “But you should not deny the existence of the North Pole. Denying the North Pole’s existence is distorting the truth and has ulterior motives.” The doctor said, “You may leave.” The patient retorted, “You have no right to order me to leave. You are a hospital, not a public security agency; you cannot arrest me, nor can you execute me.” After extensive investigation, it was discovered that the patient had participated in the writing team of “Liang Xiao” in the past, and it is estimated that this might be a kind of residual effect.

英语阅读理解图

CodeMoss-ChatGPT-o1模型

ChatGPT-o1的回答:
Eloquence Disease

A doctor introduced to me that they had encountered a patient with Eloquence Disease in their outpatient clinic. The doctor said, “Please have a seat.”

The patient replied, “But you should not deny the existence of the North Pole. To deny the existence of the North Pole is to distort the truth and harbor ulterior motives.”

The doctor responded, “You may leave.”

The patient said, “You have no right to order me to leave. You are a hospital, not a public security agency; you cannot arrest me, nor can you execute me.”

After extensive investigation, it was discovered that the patient had participated in the “Liang Xiao” writing team in the past, which is estimated to be a kind of aftereffect.

英语阅读理解图

对比分析
两者在翻译和理解题目上表现一致,都能准确地将中文内容转换为英文。然而,Kimi在翻译中使用了“Eloquence Syndrome”这一术语,ChatGPT-o1则使用了“Eloquence Disease”。两者在术语选择上略有不同,但整体理解和翻译都有一些瑕疵。

【GPT-o1系列模型!支持Open API调用、自定义助手、文件上传等强大功能,助您提升工作效率!】>>> - CodeMoss & ChatGPT-AI中文版

https://pc.aihao123.cn/index.html#/page/login?invite=1141439&fromChannel=CodeMoss_1204kimiVSgpt

详细对比列表

以下是Kimi大模型与ChatGPT模型在多个关键指标上的详细对比:

指标Kimi大模型ChatGPT模型
技术背景国产AI项目,结合国内技术积累和本土需求开发OpenAI开发,基于全球领先的GPT架构
模型研发基于Transformer架构,针对中文和特定领域优化完全基于Transformer,多次迭代升级(GPT-1至GPT-o1)
参数规模约300亿参数GPT-3:1750亿参数,GPT-4更大参数规模
长文本处理能力支持数百万字上下文输入,适合复杂信息分析支持较长文本(约4096个token),适合常规长文本处理
多模态支持支持文本、图像、语音等多种输入方式支持文本和图像输入(DALL-E集成)
中文处理能力专为中文用户设计,表现更自然中文支持良好,但主要优化为英文
应用场景教育、医疗、企业文档分析等特定领域日常对话、创意写作、编程辅助等广泛领域
用户活跃度月活跃用户超过3600万月活跃用户超过5000万
更新频率定期更新,快速迭代定期更新,持续优化
外部信息搜索能力积极搜索外部来源,提供最新信息主要依赖自身知识库,需明确指示才能搜索外部信息
本地化优势更适应中国市场语言习惯和用户需求国际化支持,多语言适应性强
资源消耗与效率优化算法,提高运行效率,适中资源消耗高参数规模对应高算力需求,资源消耗较大
模型表现稳定性在特定领域高效稳定,通用性稍弱高通用性和稳定性,适应多种应用场景

总结与建议

通过以上六道题目的测试对比,我们可以看到Kimi新推出的k0-math与ChatGPT-o1在各个知识领域中的表现。总体而言,两者在基础题型上的回答能力相当,均能准确理解问题并给出正确答案。然而,在一些复杂或需要深入分析的题目上,ChatGPT-o1的回答显得更为详细和具有解释性。

优势对比

  • Kimi k0-math

    • 回答简洁明了,适合快速获取答案。
    • 在文化背景和成语使用的判断上较为严格,能够辨别细微的语义差异。
  • ChatGPT-o1

    • 回答详细,提供更多背景信息,有助于用户理解问题。
    • 在翻译和语言处理上表现优异,适合需要深入理解和学习的用户。

选择建议

  • 如果您需要快速获取准确答案,并且对回答的详细程度要求不高,Kimi的k0-math是一个不错的选择。
  • 如果您更关注答案的详细解释和背景分析,或需要在语言处理和翻译方面的支持,ChatGPT-o1则更为适合。

相关文章:

【AI模型对比】Kimi与ChatGPT的差距:真实对比它们在六大题型中的全面表现!

文章目录 Moss前沿AI语义理解文学知识数学计算天文学知识物理学知识英语阅读理解详细对比列表总结与建议 Moss前沿AI 【OpenAI】获取OpenAI API Key的多种方式全攻略:从入门到精通,再到详解教程!! 【VScode】VSCode中的智能AI-G…...

spring6:2入门

spring6:2入门 目录 spring6:2入门2.1、环境要求2.2、构建模块2.3、程序开发2.3.1、引入依赖2.3.2、创建java类2.3.3、创建配置文件2.3.4、创建测试类测试2.3.5、运行测试程序 2.4、程序分析2.5、启用Log4j2日志框架2.5.1、Log4j2日志概述2.5.2、引入Log…...

Netty - NIO基础学习

一 简介 1 三大模型是什么? IO三大模型之一,BIO,AIO,还有我们的主角NIO(non-blocking-io),也就是同步非阻塞式IO。这三种模型到底是干什么的?其实这三种模型都是对于JAVA的一种I/O框架,用来进行…...

ArrayList的自动扩容机制源码

Java的ArrayList的自动扩容机制 ArrayList是 Java 中极为常用的动态数组实现类,它依托数组存储数据,能依据实际需求灵活变动容量,高效管理元素集合。在深挖底层源码细节前,先来了解创建ArrayList集合并添加元素时的运作流程&#…...

【llm_inference】react框架(最小code实现)

ReAct:结合推理和行动的大语言模型推理架构 GitHub Code: 人人都能看懂的最小实现 引言 在人工智能领域,大语言模型(LLM)的应用日益广泛,但如何让模型能够像人类一样,在思考的基础上采取行动&#xff0c…...

PT8M2103 触控 I/O 型 8-Bit MCU

1 产品概述 ● PT8M2103 是一款可多次编程(MTP)I/O 型8位 MCU,其包括 2K*16bit MTP ROM、256*8bit SRAM、PWM、Touch 等功能,具有高性能精简指令集、低工作电压、低功耗特性且完全集成触控按键功能。为各种触控按键的应用,提供了一种简单而又…...

英语时态学习+名词副词形容词变形方式

开发出头不容易 不如跨界卷英语 英语中的16种时态是由四种时间(现在、过去、将来、过去将来)和四种体(一般、进行、完成、完成进行)组合而成的。以下是每种时态的详细说明和例句: 一般现在时 (Simple Present) 用法…...

浏览器解析页面流程

从输入一个url到页面解析完成的流程 1. 网络进程 1. 获取url 浏览器首先判断输入的url是否有http缓存,如果有则直接从http缓存中读取数据并显示。如果没有,则进行下一步。进行DNS解析,获取域名对应的IP地址。 2.下载html文件 浏览器根据I…...

图的遍历之DFS邻接矩阵法

本题要求实现一个函数,对给定的用邻接矩阵存储的无向无权图,以及一个顶点的编号v,打印以v为起点的一个深度优先搜索序列。 当搜索路径不唯一时,总是选取编号较小的邻接点。 本题保证输入的数据(顶点数量、起点的编号等…...

Java --- JVM编译运行过程

目录 一.Java编译与执行流程: 二.编译过程: 1.编译器(javac): 2.字节码文件(.class): 三.执行过程: 1.启动JVM(Java虚拟机): 2…...

HTML5 拖拽 API 深度解析

一、HTML5 拖拽 API 深度解析 1.1 背景与发展 HTML5 的拖拽 API 是为了解决传统拖拽操作复杂而设计的。传统方法依赖鼠标事件和复杂的逻辑计算,而 HTML5 提供了标准化的拖拽事件和数据传递机制,使得开发者能够快速实现从一个元素拖拽到另一个元素的交互…...

GO--基于令牌桶和漏桶的限流策略

至于为什么要限流,字面意思已经很清楚了,就是为了减轻服务器的压力 下面我们将介绍两个限流策略----漏桶和令牌桶。 漏桶 原理介绍 漏桶,顾名思义就是一个漏斗,漏斗嘴的大小是固定的,所以不管漏斗现容量多大&#…...

MongoDB性能监控工具

mongostat mongostat是MongoDB自带的监控工具,其可以提供数据库节点或者整个集群当前的状态视图。该功能的设计非常类似于Linux系统中的vmstat命令,可以呈现出实时的状态变化。不同的是,mongostat所监视的对象是数据库进程。mongostat常用于…...

Axure设计之模拟地图人员移动轨迹

在产品原型设计时,为了更好的表达和呈现预期的效果,让客户或开发看一眼就能理解要实现的功能,往往需要在产品设计时尽量去接近现实,这就需要我们在使用Axure制作原型时应具有高度细节和逼真度的原型设计。原型设计不仅包含了产品的…...

Android环境搭建

Android环境搭建 第一步:安装 Homebrew 执行以下命令来安装 Homebrew: /bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"检测是否安装成功: brew --version第二步:安装 No…...

前端工程化面试题(一)

如何使用 Docker 部署前端项目? 使用 Docker 部署前端项目通常涉及以下几个步骤: 创建项目:首先,需要在本地创建并配置好前端项目。 准备 Docker 文件: .dockerignore:这个文件用于排除不需要上传到 Dock…...

模型案例:| 手机识别模型!

导读 2023年以ChatGPT为代表的大语言模型横空出世,它的出现标志着自然语言处理领域取得了重大突破。它在文本生成、对话系统和语言理解等方面展现出了强大的能力,为人工智能技术的发展开辟了新的可能性。同时,人工智能技术正在进入各种应用领…...

期权懂|个股期权交割操作流程是什么样的?

期权小懂每日分享期权知识,帮助期权新手及时有效地掌握即市趋势与新资讯! 个股期权交割操作流程是什么样的? 一、行权申报: 期权买方在行权日通过其经纪商提交行权指令,表明其决定行使期权权利。 二、行权匹配&#xf…...

【openGauss】openGauss execute执行update语句,获取更新的行数

【openGauss】openGauss execute执行update语句,获取更新的行数 在openGauss中,可以使用execute语句执行update语句,并通过GET DIAGNOSTICS语句获取更新的行数。下面是一个示例: DO $$ DECLAREupdated_rows INTEGER; BEGINEXECUT…...

P8780 [蓝桥杯 2022 省 B] 刷题统计

题目描述 小明决定从下周一开始努力刷题准备蓝桥杯竞赛。他计划周一至周五每天做 𝑎道题目,周六和周日每天做 𝑏 道题目。请你帮小明计算,按照计划他将在第几天实现做题数大于等于 𝑛 题? 输入格式 输入一行包含三…...

切比雪夫不等式:方差约束下的概率估计

切比雪夫不等式:方差约束下的概率估计 背景 在概率分析中,切比雪夫不等式是一个常用的工具,它通过引入随机变量的 方差信息,给出了偏离均值的概率界限。这一不等式是对 马尔科夫不等式 的自然扩展,结合了更丰富的分布…...

使用CancellationTokenSource来控制长时间sql查询中断

前端 <!-- 透明的覆盖层&#xff0c;显示在页面上方&#xff0c;包含进度条 --><Grid Visibility"{Binding IsLoading}" Background"Transparent" HorizontalAlignment"Stretch" VerticalAlignment"Stretch" ZIndex"1&…...

小红薯最新x-s 算法补环境教程12-06更新(下)

在上一篇文章中已经讲了如何去定位x-s生成的位置&#xff0c;本篇文章就直接开始撸代码吧 如果没看过的话可以看&#xff1a;小红薯最新x-s算法分析12-06&#xff08;x-s 56&#xff09;&#xff08;上&#xff09;-CSDN博客 1、获取加密块代码 首先来到参数生成的位置&…...

wazuh-modules-sca

wazuh中安全配置评估模块主线程执行wm_sca_main最后在wm_sca_start中循环执行&#xff0c;不会返回 // Module main function. It wont return #ifdef WIN32 DWORD WINAPI wm_sca_main(void *arg) {wm_sca_t *data (wm_sca_t *)arg; #else void * wm_sca_main(wm_sca_t * dat…...

Uniapp的App环境下使用Map获取缩放比例

概述 目前我试过的就是你用vue后缀是拿不到比例的你可以用nvue当然uniapp的uvue应该是更加可以的我使用的是高德所以你得在高德的后台声请原生的Android的key才可以如果是vue3的开发模式的话不用使用this来获取当前对象使用scale对象来接受和改变缩放比例会比较友好然后直接走…...

微信小程序配置less并使用

1.在VScode中下载Less插件 2.在微信小程序中依次点击如下按钮 选择 从已解压的扩展文件夹安装… 3.选中刚在vscode中下载安装的插件文件 如果没有修改过插件的安装目录&#xff0c;一般是在c盘下C:\用户\用户名.vscode\extensions\mrcrowl.easy-less-2.0.2 我的路径是&#xf…...

“全面支持公路数字化转型升级四大任务”视频孪生解决方案

数字经济的加速布局&#xff0c;对交通领域数字化转型、智能化升级提出明确要求。2024年上半年&#xff0c;为深入贯彻落实中共中央、国务院关于加快建设交通强国、数字中国等决策部署&#xff0c;推进公路水路交通基础设施数字转型、智能升级、融合创新&#xff0c;加快发展新…...

顶顶通电话机器人开发接口对接大语言模型之实时流TTS对接介绍

大语言模型一般都是流式返回文字&#xff0c;如果等全部文字返回了一次性去TTS&#xff0c;那么延迟会非常严重&#xff0c;常用的方法就是通过标点符号断句&#xff0c;返回了一句话就提交给TTS。随着流TTS的出现&#xff0c;就可以直接把大模型返回的文字灌给流TTS&#xff0…...

P3379 【模板】最近公共祖先(LCA)

【模板】最近公共祖先&#xff08;LCA&#xff09; https://www.luogu.com.cn/problem/P3379 题目描述 如题&#xff0c;给定一棵有根多叉树&#xff0c;请求出指定两个点直接最近的公共祖先。 输入格式 第一行包含三个正整数 N , M , S N,M,S N,M,S&#xff0c;分别表示…...

2030. gitLab A仓同步到B仓

文章目录 1 A 仓库备份 到 B 仓库2 B 仓库修改main分支的权限 1 A 仓库备份 到 B 仓库 #!/bin/bash# 定义变量 REPO_DIR"/home/xhome/opt/git_sync/zz_xx_xx" # 替换为你的本地库A的实际路径 REMOTE_ORIGIN"http://192.168.1.66:8181/zzkj_software/zz_xx_xx.…...