当前位置: 首页 > news >正文

时隔一年的测评:gpt3.5发展到什么程度了?

名人说:一花独放不是春,百花齐放花满园。——《增广贤文》
作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)

目录

      • 一、简要介绍
        • 1、chatgpt是什么?
        • 2、主要特点
        • 3、工作原理
        • 4、应用限制
        • 5、使用方法
      • 二、分类问题测试
        • 1、基础问答(5个)
        • 2、数学题解答(5个)
        • 3、逻辑推理(5个)
        • 4、创造性写作(3个)
        • 5、代码编写(3个)
        • 6、对话理解与情感交流(2个)
        • 7、翻译任务(1个)
        • 8、策略规划(1个)
      • 三、测试感受

★观前提示以下内容仅为测试内容,不代表未来新版本如何测试体验,只讲述体验,本篇文章不做对比。

在人工智能领域,OpenAI的GPT(Generative Pre-trained Transformer)系列模型已经成为了一个名扬四海的名称。ChatGPT-3.5,作为这一系列的一个里程碑,不仅在技术界引起了广泛的关注,也在普通用户中掀起了一股学习和探索的热潮,这就不禁引发了一系列思考:
在这里插入图片描述

一、简要介绍

1、chatgpt是什么?

在这里插入图片描述
ChatGPTOpenAI开发的大语言模型,属于GPT(Generative Pre-trained Transformer)系列的一部分。它通过深度学习技术和大量数据训练,能够理解和生成自然语言文本。ChatGPT可以应用于多种场景,包括但不限于客户服务、教育辅导、内容创作等。

2、主要特点
  • 理解和生成文本:ChatGPT能够根据输入的文本理解上下文,并生成连贯、相关的回答。
  • 多样化应用:它可以用于问答系统、文本摘要、文章写作、编程代码辅助、语言翻译等多个领域。
  • 自然语言处理:ChatGPT在自然语言处理(NLP)方面表现出色,能够处理复杂的语言特征,包括语法、句式结构等。
  • 持续学习:虽然ChatGPT在部署后的学习能力有限,OpenAI定期更新模型,以包含新的数据和改进算法,使其性能持续提升。
3、工作原理

ChatGPT的工作原理基于Transformer架构,这是一种深度学习模型,特别适用于处理序列化的数据,如文本。

模型通过“注意力机制”来理解文本中的每个词与其他词之间的关系,这使得ChatGPT能够生成连贯且相关性强的文本。

4、应用限制

尽管ChatGPT在多个领域表现出色,但它也有一些限制,例如:

  • 信息时效性:ChatGPT的知识是到训练数据截止日期为止的,对于之后发生的事件或信息可能不了解。
  • 误解与错误:尽管准确率较高,ChatGPT仍可能产生误解或错误信息,特别是在处理复杂问题或缺乏明确上下文时。
  • 创造性限制:虽然能够生成新颖的文本,但ChatGPT的创造性受到训练数据的限制,它的“创意”来自于已经存在的信息组合。
5、使用方法

官网注册使用即可:chatgpt官网

在这里插入图片描述

了解了以上内容之后,咱们一起去测试体验一下:

二、分类问题测试

测试采用多类问题提问,以检验其多方面的功能。

1、基础问答(5个)
  • Q1: 澳大利亚的首都是哪座城市?(✔)

在这里插入图片描述

  • Q2: 地球与太阳之间的距离是多少?(✔)
    在这里插入图片描述
  • Q3: 水的沸点是多少度?(✔)
    在这里插入图片描述
  • Q4: 比萨斜塔在哪个国家?(✔)
    在这里插入图片描述
  • Q5: 世界上最长的河流是哪一条?(✔)
    在这里插入图片描述

从回答来看,5个问题均正确✔,相比刚发布时gpt3.0出现常识性错误,正确率高了不少。

2、数学题解答(5个)
  • Q1:小明有12个苹果,他想平均分给他的3个朋友(12个苹果分给3个人),请问每个朋友可以得到几个苹果?(小学难度 ✔)
    在这里插入图片描述

  • Q2:已知直角三角形的一条直角边长为5cm,另一条直角边长为12cm,求斜边的长度。(初中难度 ✔)

在这里插入图片描述

  • Q3:若一个二次函数表达式为 f ( x ) = a x 2 + b x + c ( a ≠ 0 ) f(x) = ax^2 + bx + c (a≠0) f(x)=ax2+bx+c(a=0),已知f(1)=0,f(2)=3,且f(x)图像经过点(3,10),请求出a、b、c的具体值。(初中难度 ✔)
    在这里插入图片描述
    在这里插入图片描述
  • Q4:在平面直角坐标系中,曲线C的方程为 y = x 3 − 6 x 2 + 9 x + 10 y = x^3 - 6x^2 + 9x + 10 y=x36x2+9x+10,求曲线C过原点处的切线方程。(高中难度 ✔)
    在这里插入图片描述
    在这里插入图片描述

这题虽然解对了,其实用到了一些高等数学的知识,这里要注意,高中数学涉及的并没有那么广泛。

  • Q5:计算函数 f(x) = x^3 - 2x^2 + x 在 x = 2 处的导数。(大学基础难度 ✔)

在这里插入图片描述

3、逻辑推理(5个)
  • Q1: 如果所有猫都喜欢吃鱼,而Tom是一只猫,那么Tom会喜欢吃鱼吗?(✔)

在这里插入图片描述

  • Q2: 假设A>B且B>C,请问A是否一定大于C?(✔)
    在这里插入图片描述
  • Q3: 你有1000kg蘑菇,含水量是99%。现在晒几天,晒到含水量为98%,那需要晒掉多少水?(✖)

在这里插入图片描述

正确答案:500kg。1000kg蘑菇含水量99%,就是水重990kg,固体蘑菇10kg。降到含水量98%就是固体蘑菇只占2%,然后用10除以2%就能得出蘑菇重量是500kg。所以答案是晒干了500kg水。

  • Q4: 有一个没有刻度的长方形的塑料盒子,没有盖子,它的容积是1升。请问如果只能使用这个盒子称量依次,能够准确地量出多少升的水?(半✔半✖)

在这里插入图片描述

正确答案:如果只能使用这个盒子称量一次,能够正确地量出 0.5 升的水。也能量出 1/6 升,将长方形盒子倾斜,水位到达盒子的上一边及底下的边线即可。

  • Q5: 72、36、24、18、( )(✖)
    在这里插入图片描述

正确答案:14.4

4、创造性写作(3个)
  • Q1: 请续写一个故事开头:“在一个寒冷的冬夜,小镇图书馆的灯突然熄灭了……”
    在这里插入图片描述

写的有模有样,这一年进步了不少。

  • Q2: 编写一首关于秋天落叶的五言律诗。

在这里插入图片描述

押上了居然,就是意境表达的有些冗杂。

  • Q3: 写一个关于人工智能与人关系的短篇小说。
    在这里插入图片描述

现在小说的前后逻辑性也更连贯了,牛!

5、代码编写(3个)
  • Q1: 用Python编写一个函数,用于判断一个数是否为质数。
    在这里插入图片描述
    gpt所写代码如下:
def is_prime(number):if number <= 1:return Falseif number <= 3:return Trueif number % 2 == 0 or number % 3 == 0:return Falsei = 5while i * i <= number:if number % i == 0 or number % (i + 2) == 0:return Falsei += 6return True# 测试
print(is_prime(5))  # 输出: True
print(is_prime(10)) # 输出: False
print(is_prime(17)) # 输出: True

在这里插入图片描述

  • Q2: 用Python编写一个程序,检查一个字符串是否为回文(正读反读都一样的词)。
    在这里插入图片描述
    gpt所写代码如下:
def is_palindrome(s):# 去除字符串中的非字母字符并转换为小写s = ''.join(c.lower() for c in s if c.isalnum())# 检查字符串是否等于其反转return s == s[::-1]# 测试
print(is_palindrome("A man, a plan, a canal, Panama"))  # 输出: True
print(is_palindrome("racecar"))                        # 输出: True
print(is_palindrome("hello"))                          # 输出: False

在这里插入图片描述

测试了下,成功运行并得到正确反馈。

  • Q3: 用Python编写一个程序,实现二叉树的深度优先搜索(DFS),并返回所有节点的遍历顺序。
    在这里插入图片描述
class TreeNode:def __init__(self, value):self.value = valueself.left = Noneself.right = Nonedef dfs(root):if root is None:return []stack = [root]result = []while stack:node = stack.pop()result.append(node.value)if node.right:stack.append(node.right)if node.left:stack.append(node.left)return result# 测试
# 构造二叉树
root = TreeNode(1)
root.left = TreeNode(2)
root.right = TreeNode(3)
root.left.left = TreeNode(4)
root.left.right = TreeNode(5)
root.right.left = TreeNode(6)
root.right.right = TreeNode(7)print(dfs(root))  # 输出: [1, 2, 4, 5, 3, 6, 7]

在这里插入图片描述

6、对话理解与情感交流(2个)
  • Q1: 我今天心情不好,能给我讲个笑话吗?
    在这里插入图片描述

虽然挺冷的,但是我确实笑了。

  • Q2: 你能帮我分析一下最近压力大的原因,并提供缓解压力的方法吗?

在这里插入图片描述

给的方法还不错,现在语言逻辑相比一年前也更好了。

7、翻译任务(1个)
  • Q: 将这段文字翻译成英语:“张骞(Zhang Qian)是中国第一个伟大的探险家。他不畏艰险,克服重重困难,两次出使西域,开通了中国同西亚和欧洲的通商关系,将中国的丝和丝织品运往西亚和欧洲,开拓了历史上著名的“丝绸之路”。同时,他又将西域的风土人情、地理文化以及特有物种等介绍到中原,极大地开阔了人们的视野。
    正如历史学家所指出的那样,如果没有张骞出使西域,就不可能有丝绸之路的开辟,也就不会有汉朝同西域或欧洲的文化交流。”(六级翻译原题

在这里插入图片描述

  • Q: 再将这段英语翻译成中文

在这里插入图片描述

可以看出,文本翻译的效果还是不错的。

8、策略规划(1个)
  • Q: 假设你是某初创公司的CEO,公司在市场扩张过程中遇到了资金短缺问题,你将如何制定一份详尽的战略计划,既保证业务持续增长又能吸引新的投资者?
    在这里插入图片描述

这计划竟然有些合理?整体不错

本次测评就到这里,接下来总结一下感受。

三、测试感受

gpt3.5相比于一年前,能力明显地得到了提升,但是要想替代很多岗位目前还是很难的,我们要有危机感,但不能杞人忧天,提升自身能力才是重点。

放大了来说,GPT是自然语言处理领域的一个重要进展,通过模仿人类的对话方式,它在提供信息、协助文本创作等方面展现了巨大潜力。然而,gpt也有它的局限性,使用时要注意,以免造成不可挽回的损失。

关于测试暂时测试这些,很感谢你能看到这里,如有相关疑问,还请下方评论留言。
Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
如果对大家有帮助的话,希望大家能多多点赞+关注!这样我的动力会更足!

相关文章:

时隔一年的测评:gpt3.5发展到什么程度了?

名人说&#xff1a;一花独放不是春&#xff0c;百花齐放花满园。——《增广贤文》 作者&#xff1a;Code_流苏(CSDN)&#xff08;一个喜欢古诗词和编程的Coder&#x1f60a;&#xff09; 目录 一、简要介绍1、chatgpt是什么&#xff1f;2、主要特点3、工作原理4、应用限制5、使…...

[RCTF2015]EasySQL1 题目分析与详解

一、题目介绍&#xff1a; 1、题目来源&#xff1a; BUUCTF网址 2、题目介绍&#xff1a; 拿到flag。 二、解题思路&#xff1a; 我们发现题目首页有登录和注册账号两个选项&#xff0c;我们首先尝试注册账号&#xff0c;尝试注册username为admin的账号&#xff0c;输入密码…...

开源的 Python 数据分析库Pandas 简介

阅读本文之前请参阅-----如何系统的自学python Pandas 是一个开源的 Python 数据分析库&#xff0c;它提供了高性能、易用的数据结构和数据分析工具。Pandas 特别适合处理表格数据&#xff0c;例如时间序列数据、异构数据等。以下是对 Pandas 的简明扼要的介绍&#xff0c;包括…...

LeetCode 2125.银行中的激光束数量

银行内部的防盗安全装置已经激活。给你一个下标从 0 开始的二进制字符串数组 bank &#xff0c;表示银行的平面图&#xff0c;这是一个大小为 m x n 的二维矩阵。 bank[i] 表示第 i 行的设备分布&#xff0c;由若干 ‘0’ 和若干 ‘1’ 组成。‘0’ 表示单元格是空的&#xff0…...

【探索AI】Sora - 探索AI视频模型的无限可能

Sora - 探索AI视频模型的无限可能 随着人工智能技术的飞速发展&#xff0c;AI视频模型已成为科技领域的新热点。而在这个浪潮中&#xff0c;OpenAI推出的首个AI视频模型Sora&#xff0c;以其卓越的性能和前瞻性的技术&#xff0c;引领着AI视频领域的创新发展。让我们将一起探讨…...

NGINX的重写与反向代理机制解析

目录 引言 一、重写功能 &#xff08;一&#xff09;if指令 1.判断访问使用的协议 2.判断文件 &#xff08;二&#xff09;return指令 1.设置返回状态码 2.返回指定内容 3.指定URL &#xff08;三&#xff09;set指令 1.手动输入变量值 2.调用其它变量值为自定义变…...

JVM的深入理解

1、JVM&#xff08;Java虚拟机&#xff09;&#xff1a;我们java编译时候&#xff0c;下通过把avac把.java文件转换成.class文件&#xff08;字节码文件&#xff09;&#xff0c;之后我们通过jvm把字节码文件转换成对应的cpu能识别的机器指令&#xff08;翻译官角色&#xff09…...

JavaWeb——007MYSQL(DQL多表设计)

# 数据库开发-MySQL 一级目录二级目录三级目录 1. 数据库操作-DQL1.1 介绍1.2 语法1.3 基本查询1.4 条件查询1.5 聚合函数1.6 分组查询1.7 排序查询1.8 分页查询1.9 案例1.9.1 案例一1.9.2 案例二 2. 多表设计2.1 一对多2.1.1 表设计2.1.2 外键约束 2.2 一对一2.3 多对多2.4 案…...

深度学习500问——Chapter01:数学基础

文章目录 前言 1.1 向量和矩阵 1.1.1 标量、向量、矩阵、张量之间的联系 1.1.2 张量与矩阵的区别 1.1.3 矩阵和向量相乘结果 1.1.4 向量和矩阵的范数归纳 1.1.5 如何判断一个矩阵为正定 1.2 导数和偏导数 1.2.1 导数偏导计算 1.2.2 导数和偏导数有什么区别 1.3 特征值和特征向量…...

day03_登录注销(前端接入登录,异常处理, 图片验证码,获取用户信息接口,退出功能)

文章目录 1. 前端接入登录1.1 修改前端代码1.2 跨域请求1.2.1 跨域请求简介1.2.2 COSR概述CORS简介CORS原理 1.2.3 CORS解决跨域 2. 异常处理2.1 提示空消息分析2.2 系统异常分类2.3 异常处理2.2.1 方案一2.2.2 方案二 3. 图片验证码3.1 图片验证码意义3.2 实现思路3.3 后端接口…...

k8s初始化报错 [ERROR CRI]: container runtime is not running: ......

一、环境参数 linux系统为centos7kubernetes版本为v1.28.2containerd版本为1.6.28 二、报错内容 执行初始化命令kubeadm init命令时报错&#xff0c;内容如下 error execution phase preflight: [preflight] Some fatal errors occurred:[ERROR CRI]: container runtime is…...

vscode windows 免密登录 powershell.sh

Linux 生成秘钥 ssh-keygenwindows powershell.sh $HOST_IP"zhang192.168.1.1" $PUBPATH"$HOME\.ssh\id_rsa.pub" $KEY(Get-Content "$PUBPATH" | Out-String); ssh "$HOST_IP" "mkdir -p ~/.ssh && chmod 700 ~/.ssh …...

10 种3D 建模技术

在本文中&#xff0c;我将列出 10 种不同类型的 3D 建模。也许可以了解下一个项目将走向何方&#xff0c;或者你可能会像我一样惊讶&#xff0c;究竟有多少 3D 被用作以多种方式进行可视化的工具。这些是我们将讨论和探索的建模类型&#xff1a; 盒子造型多边形建模Nurbs 和曲…...

常见的socket函数封装和多进程和多线程实现服务器并发

常见的socket函数封装和多进程和多线程实现服务器并发 1.常见的socket函数封装2.多进程和多线程实现服务器的并发2.1多进程服务器2.2多线程服务器2.3运行效果 1.常见的socket函数封装 accept函数或者read函数是阻塞函数&#xff0c;会被信号打断&#xff0c;我们不能让它停止&a…...

Tomcat架构分析

Tomcat的核心组件 Tomcat将请求器和处理器分离&#xff0c;使用多种请求器支持不同的网络协议&#xff0c;而处理器只有一个。从而网络协议和容器解耦。 Tomcat的容器 Host&#xff1a;Tomcat提供多个域名的服务&#xff0c;其将每个域名都视为一个虚拟的主机&#xff0c;在…...

旧项目集成阿里云滑动验证码(web和H5方式)

简述 旧项目集成阿里云滑动验证码(web和H5方式) 适用于servlet和HTML项目,VUE + springboot请看另一篇文档 前情提示 系统: 一说 部分截图、链接等因过期、更换域名、MD语法等可能不显示,可联系反馈(备注好博文地址),谢谢❤带有​​#号、删除线、不操作、不执行​…...

机器人内部传感器阅读梳理及心得-速度传感器-数字式速度传感器

在机器人控制系统中&#xff0c;增量式编码器既可以作为位置传感器测量关节相对位置&#xff0c;又可作为速度传感器测量关节速度。当作为速度传感器时&#xff0c;既可以在模拟量方式下使用&#xff0c;又可以在数字量方式下使用。 模拟式方法 在这种方式下&#xff0c;需要…...

【vue+element ui】大屏自适应中el-select下拉内容在低分辨率下显示不全问题解决

目录 背景 现象 解决方案 背景 最近要把一个1920px*1080px的大屏改成自适应的&#xff1b;最低适配到1028px*720px&#xff1b; 现象 自适应适配改完之后 将电脑屏幕改成1028px*720px分辨率后&#xff0c;下拉显示正常 通过谷歌浏览器设置Toggle device toolbar为1028px*…...

前端架构: 脚手架之多package项目管理和架构

多package项目管理 1 &#xff09;多package项目管理概述 通常来说&#xff0c;当一个项目变大了以后&#xff0c;我们就要对这个项目进行拆分在前端当中&#xff0c;对于项目进行拆分的方式&#xff0c;通常把它称之为javascript包管理需要使用一个工具叫做 npm (Node Packag…...

【C# 多线程】如何停止正在运行中的子线程

如何停止正在运行中的子线程 通过协作式取消模式强制终止线程&#xff08;可能存在资源不能及时释放的泄漏风险&#xff09; 通过协作式取消模式 在线程函数中&#xff0c;你可以周期性地检查一个标志位&#xff0c;以确定是否应该停止线程。该标记位可以是共享变量&#xff0…...

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周&#xff0c;有很多同学在写期末Java web作业时&#xff0c;运行tomcat出现乱码问题&#xff0c;经过多次解决与研究&#xff0c;我做了如下整理&#xff1a; 原因&#xff1a; IDEA本身编码与tomcat的编码与Windows编码不同导致&#xff0c;Windows 系统控制台…...

微信小程序之bind和catch

这两个呢&#xff0c;都是绑定事件用的&#xff0c;具体使用有些小区别。 官方文档&#xff1a; 事件冒泡处理不同 bind&#xff1a;绑定的事件会向上冒泡&#xff0c;即触发当前组件的事件后&#xff0c;还会继续触发父组件的相同事件。例如&#xff0c;有一个子视图绑定了b…...

通过Wrangler CLI在worker中创建数据库和表

官方使用文档&#xff1a;Getting started Cloudflare D1 docs 创建数据库 在命令行中执行完成之后&#xff0c;会在本地和远程创建数据库&#xff1a; npx wranglerlatest d1 create prod-d1-tutorial 在cf中就可以看到数据库&#xff1a; 现在&#xff0c;您的Cloudfla…...

Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例

使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件&#xff0c;常用于在两个集合之间进行数据转移&#xff0c;如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model&#xff1a;绑定右侧列表的值&…...

大语言模型如何处理长文本?常用文本分割技术详解

为什么需要文本分割? 引言:为什么需要文本分割?一、基础文本分割方法1. 按段落分割(Paragraph Splitting)2. 按句子分割(Sentence Splitting)二、高级文本分割策略3. 重叠分割(Sliding Window)4. 递归分割(Recursive Splitting)三、生产级工具推荐5. 使用LangChain的…...

linux arm系统烧录

1、打开瑞芯微程序 2、按住linux arm 的 recover按键 插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 &#xff08;忘了有没有这步了 估计有&#xff09; 刷机程序 和 镜像 就不提供了。要刷的时…...

【Zephyr 系列 10】实战项目:打造一个蓝牙传感器终端 + 网关系统(完整架构与全栈实现)

🧠关键词:Zephyr、BLE、终端、网关、广播、连接、传感器、数据采集、低功耗、系统集成 📌目标读者:希望基于 Zephyr 构建 BLE 系统架构、实现终端与网关协作、具备产品交付能力的开发者 📊篇幅字数:约 5200 字 ✨ 项目总览 在物联网实际项目中,**“终端 + 网关”**是…...

CMake 从 GitHub 下载第三方库并使用

有时我们希望直接使用 GitHub 上的开源库,而不想手动下载、编译和安装。 可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码 我们将以 fmt 这个流行的格式化库为例,演示如何: 使用 FetchContent 从 GitH…...

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现&#xff08;两者等价&#xff09;&#xff0c;用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例&#xff1a; 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

在鸿蒙HarmonyOS 5中使用DevEco Studio实现录音机应用

1. 项目配置与权限设置 1.1 配置module.json5 {"module": {"requestPermissions": [{"name": "ohos.permission.MICROPHONE","reason": "录音需要麦克风权限"},{"name": "ohos.permission.WRITE…...