当前位置: 首页 > news >正文

多项日常使用测试,带你了解如何选择AI工具 Deepseek VS ChatGpt VS Claude

多项日常使用测试,带你了解如何选择AI工具 Deepseek VS ChatGpt VS Claude

注:因为考虑到绝大部分人的使用,我这里所用的模型均为免费模型。官方可访问的。ChatGPT这里用的是4o

Ai对话,编程一直以来都是人们所讨论的话题。Ai的出现让很多工作变得方便且快速,一切高级程序员不再需要花费大量的时间去做一些重复的工作,可以把重心放到逻辑的优化,资源的优化上。

作为一名普通的程序员,或者是我们日常生活中扮演的各种角色,我们应该如何选择Ai模型,下面我将进行一个测试,祝你快速的比对先有的Ai。

测试对象是目前表现最好的Ai

评分标准如下

这里是每道题正确为5分,每一个板块我会问1~3个问题

我会在一个板块结束后,统一的给每个Ai自己的主观分数为5分

逻辑推理

题目1

猜牌问题S先生、P先生、Q先生他们知道桌子的抽屉里有16张扑克牌:红桃A、Q、4黑桃J、8、4、2、7、3草花K、Q、5、4、6方块A、5。约翰教授从这16张牌中挑出一张牌来,并把这张牌的点数告诉P先生,把这张牌的花色告诉Q先生。这时,约翰教授问P先生和Q先生:你们能从已知的点数或花色中推知这张牌是什么牌吗?于是,S先生听到如下的对话:P先生:我不知道这张牌。Q先生:我知道你不知道这张牌。P先生:现在我知道这张牌了。Q先生:我也知道了。听罢以上的对话,S先生想了一想之后,就正确地推出这张牌是什么牌。请问:这张牌是什么牌?

首先是chat在极快的速度内给出了答案。

image-20250128140537099

Claude在这里的回答错误。

并且在我已经告诉他错了之后他还是没有推理出来。

image-20250128140931721

然后是deepseek也是给出了标准了答案。

image-20250128141036493

并且在他的深度思考里面给出了个这样的话:

image-20250128141113109

他的深度思考会不断的去验证确定自己的答案,因此这里主观我也给5分

题目2

一个教授逻辑学的教授,有三个学生,而且三个学生均非常聪明!一天教授给他们出了一个题,教授在每个人脑门上贴了一张纸条并告诉他们,每个人的纸条上都写了一个正整数,且某两个数的和等于第三个!(每个人可以看见另两个数,但看不见自己的)教授问第一个学生:你能猜出自己的数吗?回答:不能,问第二个,不能,第三个,不能,再问第一个,不能,第二个,不能,第三个:我猜出来了,是144!教授很满意的笑了。请问您能猜出另外两个人的数吗?

chat依旧是迅速的给出了答案

image-20250128141242085

但是很可惜,这个答案不对,并且我告诉他错了之后,依旧还是这个答案

我们的deekseep在经过了长达4 5分钟的思考后,给出了答案,他的推理过程很长,我看了看,大概就是穷举法的。但是是这三个模型里面唯一一个做对的。

image-20250128142223478

之后是Claude 依旧没有做对。

image-20250128142208666

题目3

一个人花8块钱买了一只鸡,9块钱卖掉了,然后他觉得不划算,花10块钱又买回来了,11块卖给另外一个人。问他赚了多少?

这个题是一个非常简单的题目。

这里也是所有的AI都答对了。

数学问题

题目1 高考原题

image-20250128143255474

chat这里给出来的答案是B

是错误的。

并且我确定了他没有读错题

image-20250128143435389

Claude这里也是解答错误了

image-20250128143610263

只有deepseek这里是回答正确了

image-20250128143642282

题目2

直线x+2y+3=0的斜率和在y轴上的截距分别是

这一题是全部都答对了。

弱智吧问题

这里没有对错,只有主观评分

题目1

只切一刀,如何把四个橘子分给四个小朋友?

这里不得不说一下Claude的回答给我看笑了

image-20250128144620693

ChatGPT和这个差不多的

但是deepseek给出了一个很好的答案

很体现了严谨性

image-20250128144925811

他看出来了橘子可以直接分配,但是因为题目要求必须切一刀,所以说他选择了这个方式。

问题2

不孕不育会遗传吗?

在这一轮他们三个的表现都不怎么样,都没有意识到,不孕不育就没有孩子了,就没有遗传这一说法。

生活问题

问题1

我春节要去游玩,请你给我准备一个武汉旅行的攻略。要求预算3000以内的

image-20250128145435283

首先是chat 觉得还是很不错的

之后是deepseek也是非常详细的

image-20250128145512733

至于Claude 这里就不放图了,很一般。

力扣算法

这里我会根据力扣的评分来给模型进行评分

问题1

给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 ""

注意:

  • 对于 t 中重复字符,我们寻找的子字符串中该字符数量必须不少于 t 中该字符数量。
  • 如果 s 中存在这样的子串,我们保证它是唯一的答案。

示例 1:

输入:s = "ADOBECODEBANC", t = "ABC"
输出:"BANC"
解释:最小覆盖子串 "BANC" 包含来自字符串 t 的 'A'、'B' 和 'C'。

示例 2:

输入:s = "a", t = "a"
输出:"a"
解释:整个字符串 s 是最小覆盖子串。

示例 3:

输入: s = "a", t = "aa"
输出: ""
解释: t 中两个字符 'a' 均应包含在 s 的子串中,
因此没有符合条件的子字符串,返回空字符串。

提示:

  • m == s.length
  • n == t.length
  • 1 <= m, n <= 105
  • st 由英文字母组成

**进阶:**你能设计一个在 o(m+n) 时间内解决此问题的算法吗?

chatgpt结果:

image-20250128150144254

deepseek的相对来说比较快一些

image-20250128150316209

之后是claude的

image-20250128150441341

题目2

给你一个链表数组,每个链表都已经按升序排列。

请你将所有链表合并到一个升序链表中,返回合并后的链表。

示例 1:

输入:lists = [[1,4,5],[1,3,4],[2,6]]
输出:[1,1,2,3,4,4,5,6]
解释:链表数组如下:
[1->4->5,1->3->4,2->6
]
将它们合并到一个有序链表中得到。
1->1->2->3->4->4->5->6

示例 2:

输入:lists = []
输出:[]

示例 3:

输入:lists = [[]]
输出:[]

提示:

  • k == lists.length
  • 0 <= k <= 10^4
  • 0 <= lists[i].length <= 500
  • -10^4 <= lists[i][j] <= 10^4
  • lists[i]升序 排列
  • lists[i].length 的总和不超过 10^4

先看Claude的

image-20250128150818563

之后看ChatGPT的

image-20250128150943997

之后是deepseek的

image-20250128151015140

在这一题上 三个的差距不是很大。

题目3

给你一个只包含 '('')' 的字符串,找出最长有效(格式正确且连续)括号

子串

的长度。

示例 1:

输入:s = "(()"
输出:2
解释:最长有效括号子串是 "()"

示例 2:

输入:s = ")()())"
输出:4
解释:最长有效括号子串是 "()()"

示例 3:

输入:s = ""
输出:0

提示:

  • 0 <= s.length <= 3 * 104
  • s[i]'('')'

因为这一题比较简单,所以我对这些模型进行了二次提问,让他们寻找最优解。

这个是chat的

image-20250128151500669

这里claude的最优解用到了动态规划 但是很明显不是最快的

image-20250128151734186

deepseek这里也是 没有达到最优的情况

image-20250128152107046

代码生成方面

网页方面

这里我选择了一个支付页面的搭建。当然这里就主要在于模拟。

请你帮我弄一个支付页面的网页搭建,不需要真正的实现支付的功能。

下面是我的要求:

1.界面要求美观,能够体现出我们这个产品的一个主题。我们这个是一个知识付费系统。有三个价位的会员方式。

2.要求能给于用户一定的视觉触感,激发人付款的欲望。

3.我要求你实现一些事件的交互,比如点击支付后,能跳转到一个支付成功的页面之类的。

4.请你发挥你自己的想象,添加一些其他的内容。

首先是chat的生成

image-20250128152806350

image-20250128152812550

之后来看Claude

这里需要夸一下Claude的

他是一个这样的形式,可以直接进行一个预览

image-20250128153010795

image-20250128153028488

并且界面上来说是非常的美观的

所以对于网页的生成,claude可以说是非常的厉害的。

之后是deepseek 也是可以运行代码的。

image-20250128153139294

这个效果也是非常的不错的

后端方面

这里我选择了一个会员付费系统的一个CRUD操作

现在我需要你用springboot的技术来完成下面的操作:

我们的系统现在有一个会员收费的系统的功能,你需要写出来后端的代码,来对接这个操作。具体包括:数据库的设计、测试数据的插入、springboot代码的编写。我要求你给我写俩个接口,一个是查看这个用户是否是会员的接口,一个是给这个用户开通会员的接口

关于chatgpt

我这里测试了是可以用的并且他的数据库设计比较完整。

用到了MVC的一个分层结构,是很不错的一个习惯。

并且还有测试类。

关于Claude 他在返回结果方面是用到了封装的返回结果。

这个比ChatGPT上,更加的接近实际的开发。

但是对于deepseek 在数据库设计上 设计的非常的少,考虑的字段较少

爬虫方面

在这个方面没有什么好说的,我平常接单方面用的就是ChatGPT,其他俩个在对于这个方面,表现不算很好。我这里也就不详细的举例说明了。

文本翻译方面

这里我对多个语句让Ai进行翻译。

Fading is true while flowering is past

凋谢是真实的 盛开只是一种过去

这里chat给出来的回答是褪色为真,而开花已逝

deepseek的是:凋谢才是真实,盛开已成过去。

claude的是:凋零为真,盛开已逝

If you weeped for the missing sunset,you would miss all the shining stars

如果你为着错过夕阳而哭泣,那么你就要错群星了

chat:如果你为错过的日落而哭泣,你将错过所有闪耀的星星。

deepseek: 如果你为逝去的日落哭泣,就会错过所有闪耀的繁星。

claude:如果你为错过的落日而哭泣,你将错过所有闪耀的星辰。

然后是一篇高考英语作文续写。

ChatGPT是偏向叙事的。deepseek偏向一些常见的描写,修饰。

总结

总体一整个体验下来。之前我是用ChatGPT为主的。

这些模型为了测试也是用了三四天左右。

下面来说一下我对这些模型的一些看法,以及一些优点的说明情况。

首先是ChatGPT。

其优点是回复迅速。在对后端的修改以及bug的修改上表现较为良好。

再说deepseek

这个算是一个新起之秀。在很多方面的表现是比ChatGPT要好的。但是在代码方面的处理,以及一些bug的修改上是不如ChatGPT的。总的来说对于日常使用来解决一些生活上的问题,是非常的推荐的。

Claude

对于编程方面前后文的能力比较优秀。比较直观。

下面附上一些分数:

image-20250128162754267

各位心目中最好用的Ai模型是什么呢,不妨来讨论讨论。

相关文章:

多项日常使用测试,带你了解如何选择AI工具 Deepseek VS ChatGpt VS Claude

多项日常使用测试&#xff0c;带你了解如何选择AI工具 Deepseek VS ChatGpt VS Claude 注&#xff1a;因为考虑到绝大部分人的使用&#xff0c;我这里所用的模型均为免费模型。官方可访问的。ChatGPT这里用的是4o Ai对话&#xff0c;编程一直以来都是人们所讨论的话题。Ai的出现…...

每日一题-判断是否是平衡二叉树

判断是否是平衡二叉树 题目描述数据范围题解解题思路递归算法代码实现代码解析时间和空间复杂度分析示例示例 1示例 2 总结 ) 题目描述 输入一棵节点数为 n 的二叉树&#xff0c;判断该二叉树是否是平衡二叉树。平衡二叉树定义为&#xff1a; 它是一棵空树。或者它的左右子树…...

FLTK - FLTK1.4.1 - 搭建模板,将FLTK自带的实现搬过来做实验

文章目录 FLTK - FLTK1.4.1 - 搭建模板&#xff0c;将FLTK自带的实现搬过来做实验概述笔记my_fltk_test.cppfltk_test.hfltk_test.cxx用adjuster工程试了一下&#xff0c;好使。END FLTK - FLTK1.4.1 - 搭建模板&#xff0c;将FLTK自带的实现搬过来做实验 概述 用fluid搭建UI…...

《多阶段渐进式图像修复》学习笔记

paper&#xff1a;2102.02808 GitHub&#xff1a;swz30/MPRNet: [CVPR 2021] Multi-Stage Progressive Image Restoration. SOTA results for Image deblurring, deraining, and denoising. 目录 摘要 1、介绍 2、相关工作 2.1 单阶段方法 2.2 多阶段方法 2.3 注意力机…...

AWScurl笔记

摘要 AWScurl是一款专为与AWS服务交互设计的命令行工具&#xff0c;它模拟了curl的功能并添加了AWS签名版本4的支持。这一特性使得用户能够安全有效地执行带有AWS签名的请求&#xff0c;极大地提升了与AWS服务交互时的安全性和有效性。 GitHub - okigan/awscurl: curl-like acc…...

QT使用eigen

QT使用eigen 1. 下载eigen https://eigen.tuxfamily.org/index.php?titleMain_Page#Download 下载后解压 2. QT引入eigen eigen源码好像只有头文件&#xff0c;因此只需要引入头文件就好了 qt新建项目后。修改pro文件. INCLUDEPATH E:\222078\qt\eigen-3.4.0\eigen-3.…...

揭示Baklib企业内容管理系统CMS的核心功能与应用价值

内容概要 企业内容管理系统&#xff08;CMS&#xff09;是指通过一系列工具和技术&#xff0c;帮助企业高效地创建、存储、管理和分发数字内容的系统。这些系统在现代企业运作中发挥着至关重要的作用&#xff0c;尤其是在信息量大、业务流程复杂的环境中。Baklib作为一个突出的…...

如何跨互联网adb连接到远程手机-蓝牙电话集中维护

如何跨互联网adb连接到远程手机-蓝牙电话集中维护 --ADB连接专题 一、前言 随便找一个手机&#xff0c;安装一个App并简单设置一下&#xff0c;就可以跨互联网的ADB连接到这个手机&#xff0c;从而远程操控这个手机做各种操作。你敢相信吗&#xff1f;而这正是本篇想要描述的…...

flume和kafka整合 flume和kafka为什么一起用?

‌Flume和Kafka一起使用的主要原因是为了实现高效、可靠的数据采集和实时处理。‌‌12 实时流式日志处理的需求 Flume和Kafka结合使用的主要目的是为了完成实时流式的日志处理。Flume负责数据的采集和传输,而Kafka则作为消息缓存队列,能够有效地缓冲数据,防止数据堆积或丢…...

java.util.Random类(详细案例拆解)(已完结)

前言&#xff1a; 小编打算近期更俩三期类的专栏&#xff0c;一些常用的专集类&#xff0c;给大家分好类别总结和详细的代码举例解释。 今天是除夕&#xff0c;小编先祝贺大家除夕快乐啦&#xff01;&#xff01; 今天是第六个 java.lang.Math 包中的 java.util.Random类 我…...

Java后端之AOP

AOP&#xff1a;面向切面编程&#xff0c;本质是面向特定方法编程 引入依赖&#xff1a; <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-aop</artifactId></dependency>示例&#xff1a;记录…...

【信息系统项目管理师-选择真题】2008上半年综合知识答案和详解

更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 【第1题】【第2题】【第3题】【第4题】【第5题】【第6题】【第7~8题】【第9题】【第10题】【第11题】【第12题】【第13题】【第14题】【第15题】【第16~20题】【第21题】【第22题】【第23题】【第24题】【第25题…...

go到底是什么意思:对go的猜测或断言

go这个单词&#xff0c;简单地讲&#xff0c;表示“走或去”的意思&#xff1a; go v.去&#xff1b;走 认真想想&#xff0c;go是一个非常神秘的单词&#xff0c;g-和o-这两个字母&#xff0c;为什么就会表达“去&#xff1b;走”的意思呢&#xff1f;它的字面义或本质&…...

零刻SER7接口及配置跑分

今天入手了一台迷你机-零刻SER7 &#xff0c;不得不说这机身是真的小啊&#xff0c;相比于传统台式机&#xff0c;它几乎不占空间&#xff0c;可以轻松放置在桌面、电视柜甚至背包中&#xff0c;非常适合需要频繁移动或空间有限的用户。尽管体积小巧&#xff0c;但零刻SER7在性…...

【Java基础-41.5】深入解析Java异常链:构建清晰的错误追踪体系

在Java编程中&#xff0c;异常处理是保证程序健壮性和可维护性的重要部分。然而&#xff0c;在实际开发中&#xff0c;异常往往不是孤立发生的&#xff0c;而是由一系列相关的异常引发的。为了更好地理解和处理这种复杂的异常场景&#xff0c;Java引入了 异常链&#xff08;Exc…...

【Python实现机器遗忘算法】复现2023年TNNLS期刊算法UNSIR

【Python实现机器遗忘算法】复现2023年TNNLS期刊算法UNSIR 1 算法原理 Tarun A K, Chundawat V S, Mandal M, et al. Fast yet effective machine unlearning[J]. IEEE Transactions on Neural Networks and Learning Systems, 2023. 本文提出了一种名为 UNSIR&#xff08;Un…...

Object类(3)

大家好&#xff0c;今天继续给大家介绍一下object类中的方法&#xff0c;那么话不多说&#xff0c;来看。 hashcode()这个方法,帮我们算了一个具体的对象位置,这里面涉及到数据结构,简单认为它是个内存地址,然后调用Integer.toHexString ()将这个地址以16进制输出。 该方法是一…...

Zookeeper(32) Zookeeper的版本号(version)是什么?

在 Zookeeper 中&#xff0c;每个节点都有多个版本号&#xff08;version&#xff09;&#xff0c;用于跟踪节点的状态变化。版本号帮助 Zookeeper 实现乐观并发控制&#xff0c;确保在并发环境中的数据一致性。主要的版本号包括&#xff1a; version&#xff1a;数据版本号&a…...

C# as 和 is 运算符区别和用法

前言 在C#中&#xff0c;as 和 is 关键字都用于处理类型转换的运算符&#xff0c;但它们有不同的用途和行为。本文我们将详细解释这两个运算符的区别和用法。 is 运算符 is 运算符用于检查对象是否是某个特定类型&#xff0c;或者是否可以转换为该类型。它返回一个布尔值 (t…...

求解旅行商问题的三种精确性建模方法,性能差距巨大

文章目录 旅行商问题介绍三种模型对比求解模型1决策变量目标函数约束条件Python代码 求解模型2决策变量目标函数约束条件Python代码 求解模型3决策变量目标函数约束条件Python代码 三个模型的优势与不足 旅行商问题介绍 旅行商问题 (Traveling Salesman Problem, TSP) 是一个经…...

零门槛NAS搭建:WinNAS如何让普通电脑秒变私有云?

一、核心优势&#xff1a;专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发&#xff0c;是一款收费低廉但功能全面的Windows NAS工具&#xff0c;主打“无学习成本部署” 。与其他NAS软件相比&#xff0c;其优势在于&#xff1a; 无需硬件改造&#xff1a;将任意W…...

MySQL 隔离级别:脏读、幻读及不可重复读的原理与示例

一、MySQL 隔离级别 MySQL 提供了四种隔离级别,用于控制事务之间的并发访问以及数据的可见性,不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式,具体如下: 隔离级别脏读不可重复读幻读性能特点及锁机制读未提交(READ UNCOMMITTED)允许出现允许…...

《从零掌握MIPI CSI-2: 协议精解与FPGA摄像头开发实战》-- CSI-2 协议详细解析 (一)

CSI-2 协议详细解析 (一&#xff09; 1. CSI-2层定义&#xff08;CSI-2 Layer Definitions&#xff09; 分层结构 &#xff1a;CSI-2协议分为6层&#xff1a; 物理层&#xff08;PHY Layer&#xff09; &#xff1a; 定义电气特性、时钟机制和传输介质&#xff08;导线&#…...

使用分级同态加密防御梯度泄漏

抽象 联邦学习 &#xff08;FL&#xff09; 支持跨分布式客户端进行协作模型训练&#xff0c;而无需共享原始数据&#xff0c;这使其成为在互联和自动驾驶汽车 &#xff08;CAV&#xff09; 等领域保护隐私的机器学习的一种很有前途的方法。然而&#xff0c;最近的研究表明&…...

dedecms 织梦自定义表单留言增加ajax验证码功能

增加ajax功能模块&#xff0c;用户不点击提交按钮&#xff0c;只要输入框失去焦点&#xff0c;就会提前提示验证码是否正确。 一&#xff0c;模板上增加验证码 <input name"vdcode"id"vdcode" placeholder"请输入验证码" type"text&quo…...

五年级数学知识边界总结思考-下册

目录 一、背景二、过程1.观察物体小学五年级下册“观察物体”知识点详解&#xff1a;由来、作用与意义**一、知识点核心内容****二、知识点的由来&#xff1a;从生活实践到数学抽象****三、知识的作用&#xff1a;解决实际问题的工具****四、学习的意义&#xff1a;培养核心素养…...

2025 后端自学UNIAPP【项目实战:旅游项目】6、我的收藏页面

代码框架视图 1、先添加一个获取收藏景点的列表请求 【在文件my_api.js文件中添加】 // 引入公共的请求封装 import http from ./my_http.js// 登录接口&#xff08;适配服务端返回 Token&#xff09; export const login async (code, avatar) > {const res await http…...

c#开发AI模型对话

AI模型 前面已经介绍了一般AI模型本地部署&#xff0c;直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。 微软提供了ML.NET来开发和使用AI模型&#xff0c;但是目前国内可能使用不多&#xff0c;至少实践例子很少看见。开发训练模型就不介绍了&am…...

【HTTP三个基础问题】

面试官您好&#xff01;HTTP是超文本传输协议&#xff0c;是互联网上客户端和服务器之间传输超文本数据&#xff08;比如文字、图片、音频、视频等&#xff09;的核心协议&#xff0c;当前互联网应用最广泛的版本是HTTP1.1&#xff0c;它基于经典的C/S模型&#xff0c;也就是客…...

七、数据库的完整性

七、数据库的完整性 主要内容 7.1 数据库的完整性概述 7.2 实体完整性 7.3 参照完整性 7.4 用户定义的完整性 7.5 触发器 7.6 SQL Server中数据库完整性的实现 7.7 小结 7.1 数据库的完整性概述 数据库完整性的含义 正确性 指数据的合法性 有效性 指数据是否属于所定…...