当前位置: 首页 > news >正文

OpenAI承认ChatGPT变懒惰,正在修复该问题

OpenAI旗下的官方ChatGPT账号在社交平台表示,已经收到了大量用户关于GPT-4变懒惰的反馈。

这是因为自11月11日以来,OpenAI就没有更新过该模型。当然这不是故意的,大模型的行为是不可预测的,正在研究修复该问题。

图片

外界猜测,OpenAI可能是为了节省算力资源以及减少非法内容的输出,限制了GPT-4的部分功能。

GPT-4变懒惰的报道

该账号进一步指出,GPT-4并不是从11 月 11 日开始懒惰的,很可能已经持续了很长一段时间。模型的部分功被降级,日常使用很难觉察到。

图片

事实上,在OpenAI的官方开发者论坛中,已经有不少用户抱怨GPT-4变懒惰的问题。

一位名叫Jonathan的用户表示,自OpenAI的开发者大会之后,ChatGPT的输出上限是850个tokens,表现的非常懒惰

图片

在回答内容的时候,经常会空出一些占位符文本让用户自己来回答,并且在一条消息中很长时间拒绝回答内容。

关于ChatGPT的懒惰行为,Jonathan从技术层面进行了猜测:1)这种带空位符的回复模式,OpenAI可能正在测试新的推理方法。

2)OpenAI 正在托管许多不同上下文大小的模型,不想在一些没用且无聊的问题上浪费AI算力。

3)OpenAI内部的主网络在不同语境的 GPT4 中是相同的,这导致他们有了 gpt-4-4k、gpt-4-8k、gpt-4-16k......gpt-4-120k 等模型,所有这些模型都共享相同的 RLHF核心(人类反馈强化学习)和其他的私密数据。

图片

4)在完成调用之前,每个模型会对每个输入进行850-1024个推理步骤。这使得 OpenAI 可以一次性更新模型的批次,而不是在调用发生时按需更新。

这种模式可以节省从 CPU 到 GPU再到CPU的运行时间。

5)为了在 850-1024 个推理步骤内正确地向用户返回简明扼要的内容,OpenAI额外训练了一个RLHF核心网络,以便在简单问题时进行调用,以减少模型遍历节省算力资源。

总体来说,Jonathan的核心猜测就是,OpenAI主要是为了节省庞大的算力支出,才使得ChatGPT变得越来越懒惰。

一位名叫Matt用户在社交平台分享了ChatGPT变懒的证据,同时也验证了Jonathan在技术层面的猜测。

ChatGPT在回答问题时,只会回答部分内容,剩下的留给用户自己来想。

图片

例如,向ChatGPT提问,列出从现在到 2024 年 5 月 5 日的所有周末。

ChatGPT回答:我可以为你提供从现在到 2024 年 5 月 5 日之间的周数,但我无法为每一周列出详尽的清单。不过,我可以给你一个粗略的估计。

假设当前日期是 2023 年 11 月 27 日。从现在到 2024 年 5 月 5 日,大约有 24 周。

如果您需要更精确的计算,可以使用日期计算器或编程工具来计算两个特定日期之间的周数。

用户:你当然可以列出所有的星期?用这种格式:周一 4/12 - 周日 10/12 周一 11/12 - 周日 17/12。

ChatGPT:当然我可以按照你指定的格式展示日期,提供2023年11月27日至2024年5月5日的周数列表。然后加上详细的日期。

图片

也就是说,需要“哄着”ChatGPT才能让它回答更具体的内容。只用模糊的问题,让其回答海量内容已经不太可能了,这个问题在编程领域也比较明显。

图片

此外,在谷歌的APP商店中,最近ChatGPT也收到了不少1星的评分。就连OpenAI在谷歌地图的公司地址,也有人打一颗星,原因就是因为ChatGPT变懒惰了,可见此次情况的严重性。

图片

本文素材来源ChatGPT社交平台、OpenAI开发论坛、网络,如有侵权请联系删除

相关文章:

OpenAI承认ChatGPT变懒惰,正在修复该问题

OpenAI旗下的官方ChatGPT账号在社交平台表示,已经收到了大量用户关于GPT-4变懒惰的反馈。 这是因为自11月11日以来,OpenAI就没有更新过该模型。当然这不是故意的,大模型的行为是不可预测的,正在研究修复该问题。 外界猜测&#x…...

归并排序与自然归并排序

归并排序 归并排序(merge - sort)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的一个非常典型的应用.将已有的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序.若将两个有序表合并成一个有序表,成为二路归并. 核心步骤讲解 归并排序的…...

22款奔驰GLS450升级HUD抬头显示 告别低头

随着科技飞速地发展,从汽车领域就可以看出,尤其是汽车的抬头显示器,一经推出就吸引了很多的车主。星骏汇小许Xjh15863 升级HUD抬头显示,HUD与汽车系统进行完整的数据信息连接,整合成大数据,然后将一些重要信…...

关于kotlin的属性委托,报错的,实际原因剖析

报错:Property delegate must have a ‘getValue(SecurityCheckView, KProperty*>)’ method. None of the following functions are suitable 解决方案:就是在根目录的build.gradle中改变 kotlin的插件版本 classpath “org.jetbrains.kotlin:kotli…...

HarmonyOS4.0从零开始的开发教程11给您的应用添加弹窗

HarmonyOS(十)给您的应用添加弹窗 概述 在我们日常使用应用的时候,可能会进行一些敏感的操作,比如删除联系人,这时候我们给应用添加弹窗来提示用户是否需要执行该操作,如下图所示: 弹窗是一种…...

js 同步任务和异步任务

同步任务和异步任务 同步任务 同步任务就是没有被引擎挂起、在主线程上排队执行的任务。只有前一个任务执行完,才会执行下一个任务。同步任务具有堵塞效果。 异步任务 异步任务是被引擎放在一边,不进入主线程进入任务队列的任务。只有引擎认为某个异步任…...

【小白专用】Sql Server 连接Mysql 更新23.12.09

目标 已知mysql连接参数(地址和用户),期望通过Microsoft Sql Server Management Studio (以下简称MSSSMS)连接Mysql,在MSSSMS中直接查询或修改Mysql中的数据。 一般是选最新的版本下载。 选64位还是32位&a…...

DIP——边缘提取与分割

1.使用canny算法进行边缘提取 本实验比较简单,基本思路是对原图像进行一个高斯模糊处理,用于去噪,之后转换为灰度图,直接调用cv库中的canny记性边缘提取。若想直接得到彩色边缘,则通过按位与操作,将原始彩色…...

低代码开发:现实挑战与发展前景

低代码开发是近年来迅速崛起的软件开发方法,让编写应用程序变得更快、更简单。有人说它是美味的膳食,让开发过程高效而满足,但也有人质疑它是垃圾食品,缺乏定制性与深度。 一、什么是低代码 低代码开发是一种基于图形用户界面&…...

大数据技术7:基于StarRocks统一OALP实时数仓

前言: 大家对StarRocks 的了解可能不及 ClickHouse或者是远不及 ClickHouse 。但是大家可能听说过 Doris ,而 StarRocks 实际上原名叫做 Doris DB ,他相当于是一个加强版的也就是一个 Doris ,也就是说 Doris 所有的功能 StarRocks 都是有的&a…...

C# WPF上位机开发(网络程序界面开发)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 之前我们讨论过,设备之间通讯的方式很多。但是,不知道大家有没有注意,前面谈到的这些通讯方式都需要上位机电脑…...

卡码网语言基础课 | 20. 排队取奶茶

目录 一、 队列的基本认识 二、 队列的操作 2.1 引入头文件 2.2 创建队列 2.3 队列的常见操作 三、 解题 通过本次练习,将会学习到以下C知识点: 队列的基本概念(队头、队尾)和特点(先入先出)入队、出队…...

Angular 进阶之四:SSR 应用场景与局限

应用场景 内容丰富,复杂交互的动态网页,对首屏加载有要求的项目,对 seo 有要求的项目(因为服务端第一次渲染的时候,已经把关键字和标题渲染到响应的 html 中了,爬虫能够抓取到此静态内容,因此更…...

vue2 cron表达式组件

vue2 cron表达式组件 1. 先上图 2. 代码目录 3. 直接上代码 &#xff08;组件代码太多&#xff0c;直接上压缩包&#xff0c;解压后直接用&#xff0c;压缩包再博客顶部&#xff09; 4. 使用注&#xff1a;示例代码中使用了element-ui // HomeView.vue<template><…...

git-vscode

git-vscode ctrlshiftp 创建分支 create branch 直接切到新的分支了 切换分支 直接点左下角自己选择 vscode中配置仓库 https://blog.csdn.net/zora_55/article/details/129709251 推送tag tag作用就是在 Git 中&#xff0c;标记存储库历史记录中特定提交的一种方式。t…...

【C++11(三)】智能指针详解--RAII思想循环引用问题

&#x1f493;博主CSDN主页:杭电码农-NEO&#x1f493;   ⏩专栏分类:C从入门到精通⏪   &#x1f69a;代码仓库:NEO的学习日记&#x1f69a;   &#x1f339;关注我&#x1faf5;带你学习C   &#x1f51d;&#x1f51d; C11 1. 前言2. 为什么要有智能指针?3. RAII思想…...

佳明(Garmin) fēnix 7X 增加小睡检测功能

文章目录 &#xff08;一&#xff09;零星小睡&#xff08;二&#xff09;小睡检测&#xff08;三&#xff09;吐槽佳明&#xff08;3.1&#xff09;心率检测&#xff08;3.2&#xff09;光线感应器&#xff08;3.3&#xff09;手表重量&#xff08;3.4&#xff09;手表续航 &a…...

二、如何保证架构的质量、架构前期准备、技术填补与崩溃预防、系统重构

1、如何保证架构的质量 -- 稳定性和健壮性 2、正确的选择是良好的开端 -- 架构前期准备 ① 架构师分类&#xff1a;系统架构师、应用架构师、业务架构师 3、技术填补与崩溃预防 4、系统重构...

14、SQL注入——HTTP文件头注入

文章目录 一、HTTP Header概述1.1 HTTP工作原理1.2 HTTP报文类型1.3 较重要的HTTP Header内容 二、HTTP Header注入2.1 HTTP Header注入的前提条件2.2 常见的HTTP Header注入类型 一、HTTP Header概述 1.1 HTTP工作原理 1.2 HTTP报文类型 &#xff08;1&#xff09;请求报文 …...

李宏毅bert记录

一、自监督学习&#xff08;Self-supervised Learning&#xff09; 在监督学习中&#xff0c;模型的输入为x&#xff0c;若期望输出是y&#xff0c;则在训练的时候需要给模型的期望输出y以判断其误差——有输入和输出标签才能训练监督学习的模型。 自监督学习在没有标注的训练…...

Qwen3-VL-30B效果实测:识别复杂图表毫无压力,回答精准又详细

Qwen3-VL-30B效果实测&#xff1a;识别复杂图表毫无压力&#xff0c;回答精准又详细 1. 开篇&#xff1a;当AI真正"看懂"了世界 想象一下这样的场景&#xff1a;你随手拍下一张满是数据和曲线的科研论文图表&#xff0c;AI不仅能准确识别出每个坐标轴的含义&#x…...

OpenClaw故障模拟:Qwen3-14b_int4_awq异常输入处理与恢复机制

OpenClaw故障模拟&#xff1a;Qwen3-14b_int4_awq异常输入处理与恢复机制 1. 为什么需要主动制造故障 去年冬天的一个深夜&#xff0c;我的OpenClaw自动化流程突然中断了。当时它正在帮我整理一批技术文档&#xff0c;却在处理某个特殊字符时直接"卡死"。这次经历让…...

Phi-3 Forest Lab应用场景:科研人员实验设计思路启发助手

Phi-3 Forest Lab应用场景&#xff1a;科研人员实验设计思路启发助手 1. 引言&#xff1a;当科研思路遇到“森林智者” 你有没有过这样的时刻&#xff1f;面对一个全新的研究课题&#xff0c;实验方案想了三天三夜&#xff0c;却总觉得思路打不开&#xff0c;或者陷入了某个细…...

FireRedASR-AED-L本地化教程:国产统信UOS/麒麟系统全兼容部署方案

FireRedASR-AED-L本地化教程&#xff1a;国产统信UOS/麒麟系统全兼容部署方案 提示&#xff1a;本教程已在统信UOS 20、麒麟V10系统完成实测验证&#xff0c;同样适用于Ubuntu、CentOS等Linux发行版 1. 项目简介&#xff1a;为什么选择这个工具&#xff1f; 如果你正在寻找一个…...

避坑指南:在YOLOv5-7.0中融合BiFPN时,如何平衡P2检测头带来的精度与速度损耗?

YOLOv5-7.0中BiFPN与P2检测头的精度与速度平衡实战 当你在无人机航拍画面中寻找几毫米大小的电子元件时&#xff0c;或者在显微镜图像中定位细胞核位置时&#xff0c;传统目标检测模型的性能往往会大打折扣。这正是微小目标检测技术大显身手的场景——而YOLOv5作为工业界最受欢…...

Qwen3-14B多场景落地指南:内容创作、编程辅助、教育问答一体化方案

Qwen3-14B多场景落地指南&#xff1a;内容创作、编程辅助、教育问答一体化方案 1. 开箱即用的私有部署方案 Qwen3-14B私有部署镜像为企业和开发者提供了一站式解决方案&#xff0c;无需复杂的环境配置即可快速启用大模型能力。这个经过深度优化的镜像专为RTX 4090D 24GB显存环…...

Qwen-Image-Edit-2511-Unblur-Upscale惊艳效果:模糊图片一键高清化

Qwen-Image-Edit-2511-Unblur-Upscale惊艳效果&#xff1a;模糊图片一键高清化 1. 效果展示&#xff1a;从模糊到高清的魔法 你是否遇到过这样的情况&#xff1f;手机里珍藏的老照片因为年代久远变得模糊不清&#xff0c;或是匆忙拍摄的珍贵瞬间因为手抖而糊成一片。现在&…...

OpenClaw调试进阶:百川2-13B-4bits量化模型响应日志分析

OpenClaw调试进阶&#xff1a;百川2-13B-4bits量化模型响应日志分析 1. 为什么需要关注模型响应日志 上周我在用OpenClaw对接百川2-13B-4bits量化模型时&#xff0c;遇到了一个奇怪的现象&#xff1a;自动化任务执行到一半突然中断&#xff0c;控制台只显示"模型响应异常…...

R语言新手必看:ggplot2安装失败的5种常见原因及解决方法(附完整代码)

R语言ggplot2安装问题全解析&#xff1a;从报错排查到可视化实战 第一次接触R语言的ggplot2包时&#xff0c;那种兴奋和期待往往会被突如其来的报错信息浇灭。作为R社区最受欢迎的数据可视化工具&#xff0c;ggplot2以其优雅的语法和强大的定制能力吸引了无数用户&#xff0c;但…...

Windows 11 上安装 MinGW-w64 并运行 LVGL SDL 模拟器

目前最推荐的方式是使用 MSYS2。它安装简单、包管理方便&#xff08;pacman&#xff09;&#xff0c;而且能直接安装 SDL2&#xff0c;避免手动复制头文件和库的麻烦。 以下是完整、推荐的步骤&#xff08;2026 年最新实践&#xff09;&#xff1a; 1. 安装 MSYS2&#xff08…...