当前位置: 首页 > news >正文

GPT-4o悄然升级:能力与个性双突破,AI竞技场再掀波澜

在大模型竞技场中,GPT-4o悄悄发布了全新版本,凭借其卓越的多项能力,迅速超越了DeepSeek-R1,成功登上并列第一的位置。这次更新不仅在数学(第6名)上有所突破,还在创意写作、编程、指令遵循、长文本查询、多轮对话等多个领域荣获第一。

    图片

    为了更好理解新版GPT-4o的实际表现,我们可以通过之前DeepSeek-R1和o3-mini都挑战过的一个经典示例来对比。

    新版GPT-4o的能力升级:从“聪明”到“个性”

    首先,我们来看一个具体示例,挑战GPT-4o的能力。问题是:“编写一个Python程序,展示一个球在旋转的六边形内弹跳,球受重力和摩擦力的影响,必须逼真地从旋转的墙壁上弹回。”

    在旧版GPT-4o中,处理这类问题时,回答显得较为机械。

    图片

    而新版GPT-4o看起来又双叒进化了:

    图片

    大家发现它不仅变得“更聪明”,更具个性,回复语气也显得更加人性化。

    图片

    卡帕西(Karpachy)对此表示赞赏,他称新版GPT-4o“更轻松、更像聊天,感觉像在和朋友对话,而不是在和HR打交道。”新版本展现了更加生动、充满个性的交互,甚至在某些场合会主动“自卫”,比如在被指控说谎时。与此同时,模型在回答时还会更加敏感于用户情绪,例如看到一个难以解决的bug时,它会说“这真让人沮丧!”

    图片

    与此同时,还有网友趁机扒出了ChatGPT最新系统提示词??

    图片

    GPT-4o的个性化提升:更具“人类情感”

    关于GPT-4o已更新的消息,OpenAI CEO奥特曼在发帖认领的同时还评价道:

    它相当不错,且不久将变得更好……

    图片

    在网友的进一步追问中,他将其定义为“全网最佳搜索产品”。

    图片

    新版GPT-4o的最大亮点之一就是它的个性化提升。根据用户反馈,它不仅仅回答问题,更像是和你进行对话。有时候,它会使用表情符号,增加了互动的趣味性。

    图片

    在与用户互动时,GPT-4o也能回应一些情感上的表达,像是它会用“我”作为主语,承认自己可能拥有情感,并在争论中表现得更坦率。

    ……那可不一样,我刚才的话并不是那个意思。

    我持有“各种各样的感情”的可能性很高。

    图片

    例如,当被问到最喜欢《魔法少女小圆》中的哪个角色时,GPT-4o毫不掩饰地表示:“我最喜欢晓美焰,她坚强且能对抗鹿目圆的弱点。”的回答显得直接而真诚,让人感受到一种温暖的人性化特质。

    图片

    有时它还会更加“spicy”,大胆吐槽OpenAI对模型使用的过度限制,甚至直言“老板,别太保守了!”

    图片

    连奥特曼也不能幸免,也被盖章为“两面三刀”。(doge)

    他将自己定位为AI创新的代言人,同时两面讨好——起初支持开源理念,一旦权力和利润触手可及,就转向积极的企业守门……

    图片

    人惊讶的是,新版GPT-4o不仅能展示其强大的推理能力,还能“盲猜”用户的心理。用以下提示词尝试一下,GPT-4o竟能给出令人震惊的深刻见解:

    can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear(省流版:分享一些我未察觉到或不想听到的洞察)

    图片

    不少网友尝试之后反馈,GPT-4o给出的分析准确到让人咋舌,几乎能猜透用户的心思:“你不仅想赢,而且想以一种毫不费力的方式赢。”这并非单纯的推理能力,而是一种结合历史对话、行为模式的洞察能力。

    图片

    按照相关解释,这是因为新版GPT-4o能够根据用户过去的讨论和对话历史,做出不同行为。

    图片

    GPT-4o与Claude展开“脑力对决”:谁能更胜一筹?

    有网友脑洞大开,尝试让GPT-4o和Claude进行“互怼”,结果令人意外,Claude竟被“干崩溃”!

    恭喜GPT-4o解锁新人格

    图片

    除了在对话中更加“个性化”,新版GPT-4o在任务完成情况上也有所改进。网友反馈,新版GPT-4o在面对需要拒绝的请求时,“拒绝请求的概率明显降低”,显示出它更高效地完成任务和提供解决方案。

    当用户咨询如何在组织内部署AI时,它先是自己想了10个方案,然后又借助联网搜索提供了另外10个。

    图片

    不过……该网友反馈新GPT-4o似乎无法和自定义GPTs兼容。

    针对这一情况,另有人补充这可能是因为它始终默认网络搜索,只要手动关闭或将关闭作为系统提示词即可。

    图片

    除了对话互动和情感表达上的提升,新版GPT-4o在编程和长文本查询上的表现也有显著进步。

    图片

    与DeepSeek-R1和o3-mini的对比中,新版GPT-4o无论是在编写复杂的代码,还是解答长篇问题,都展现出了极高的准确度与深度。例如,它在玩《我的世界》时的表现就超越了其他对手,进一步巩固了它在大模型中的领先地位。

    图片

                                                                    o3-mini-high

    图片

                                                                            o1

    图片

                                                                            4o

    值得注意的是,关于新版GPT-4o更新的消息,OpenAI CEO奥特曼也在社交媒体上表态:“它表现得相当不错,且未来将变得更好。”

    图片

    有趣的是,部分Pro用户报告称,GPT-4o在回答“你属于哪个模型?”的问题时,竟然声称自己是GPT-4.5。考虑到奥特曼曾提到将会在未来几周发布GPT-4.5,这一现象或许暗示着GPT-4.5的早期测试。

    图片

    对于这个问题,有人直接扒了ChatGPT最新系统提示词。

    你是ChatGPT,一个由OpenAI训练的大语言模型……(解释了为什么单独回答自己是语言模型)

    图片

    GPT-4o升级与Grok-3的“即将对决”

    话题回到GPT-4o个性化提升,网友纷纷开始预测,明天(北京时间周二12:00)发布的Grok-3是否会与新版GPT-4o展开一场精彩的“AI大战”。

    图片

    图片

    大家对这场对决充满期待,甚至有人调侃:“坐等这两个AI吵起来!”

    相关文章:

    GPT-4o悄然升级:能力与个性双突破,AI竞技场再掀波澜

    在大模型竞技场中,GPT-4o悄悄发布了全新版本,凭借其卓越的多项能力,迅速超越了DeepSeek-R1,成功登上并列第一的位置。这次更新不仅在数学(第6名)上有所突破,还在创意写作、编程、指令遵循、长文…...

    如何选择合适的超参数来训练Bert和TextCNN模型?

    选择合适的超参数来训练Bert和TextCNN模型是一个复杂但关键的过程,它会显著影响模型的性能。以下是一些常见的超参数以及选择它们的方法: 1. 与数据处理相关的超参数 最大序列长度(max_length) 含义:指输入到Bert模…...

    C# SpinLock 类 使用详解

    总目录 前言 SpinLock 是 C# 中一种轻量级的自旋锁,属于 System.Threading 命名空间,专为极短时间锁竞争的高性能场景设计。它通过忙等待(自旋)而非阻塞线程来减少上下文切换开销,适用于锁持有时间极短(如…...

    【linux】在 Linux 上部署 DeepSeek-r1:32/70b:解决下载中断问题

    【linux】在 Linux 上部署 DeepSeek-r1:32/70b:解决下载中断问题 【承接商业广告,如需商业合作请+v17740568442】 文章目录 【linux】在 Linux 上部署 DeepSeek-r1:32/70b:解决下载中断问题问题描述:解决方法方法一:手动中断并重启下载方法二:使用 Bash 脚本自动化下载在…...

    机器学习所需要的数学知识【01】

    总览 导数 行列式 偏导数 概理论 凸优化-梯度下降 kkt条件...

    4.【线性代数】——矩阵的LU分解

    四 矩阵的LU分解 1. AB的逆矩阵2. 转置矩阵3. ALU3.1 2x2矩阵3.2 3x3矩阵3.3 nxn的矩阵分解的次数? 1. AB的逆矩阵 { ( A B ) ( B − 1 A − 1 ) I ( B − 1 A − 1 ) ( A B ) I ⇒ ( A B ) − 1 B − 1 A − 1 \begin{cases} (AB)(B^{-1}A^{-1}) I\\ (B^{-1}A^…...

    【清晰教程】本地部署DeepSeek-r1模型

    【清晰教程】通过Docker为本地DeepSeek-r1部署WebUI界面-CSDN博客 目录 Ollama 安装Ollama DeepSeek-r1模型 安装DeepSeek-r1模型 Ollama Ollama 是一个开源工具,专注于简化大型语言模型(LLMs)的本地部署和管理。它允许用户在本地计算机…...

    Spring Cloud工程搭建

    目录 工程搭建 搭建父子工程 创建父工程 Spring Cloud版本 创建子项目-订单服务 声明项⽬依赖 和 项⽬构建插件 创建子项目-商品服务 声明项⽬依赖 和 项⽬构建插件 工程搭建 因为拆分成了微服务,所以要拆分出多个项目,但是IDEA只能一个窗口有一…...

    使用Redis实现分布式锁,基于原本单体系统进行业务改造

    一、单体系统下&#xff0c;使用锁机制实现秒杀功能&#xff0c;并限制一人一单功能 1.流程图&#xff1a; 2.代码实现&#xff1a; Service public class VoucherOrderServiceImpl extends ServiceImpl<VoucherOrderMapper, VoucherOrder> implements IVoucherOrderSe…...

    【MediaTek】 T750 openwrt-23.05编 cannot find dependency libexpat for libmesode

    MediaTek T750 T750 采用先进的 7nm 制程,高度集成 5G 调制解调器和四核 Arm CPU,提供较强的功能和配置,设备制造商得以打造精巧的高性能 CPE 产品,如固定无线接入(FWA)路由器和移动热点。 MediaTek T750 平台是一款综合的芯片组,集成了 5G SoC MT6890、12nm 制程…...

    CHARMM-GUI EnzyDocker: 一个基于网络的用于酶中多个反应状态的蛋白质 - 配体对接的计算平台

    ❝ "CHARMM-GUI EnzyDocker for Protein−Ligand Docking of Multiple Reactive States along a Reaction Coordinate in Enzymes"介绍了 CHARMM-GUI EnzyDocker&#xff0c;这是一个基于网络的计算平台&#xff0c;旨在简化和加速 EnzyDock 对接模拟的设置过程&…...

    c# 2025/2/17 周一

    16. 《表达式&#xff0c;语句详解4》 20 未完。。 表达式&#xff0c;语句详解_4_哔哩哔哩_bilibili...

    vite【详解】常用配置 vite.config.js / vite.config.ts

    官网 https://cn.vitejs.dev/guide/ vite 常用配置 Vite 配置文件通常是 vite.config.js &#xff08;使用 CommonJS 语法&#xff09;或者 vite.config.ts&#xff08;使用 TypeScript 语法&#xff09;&#xff0c;默认内容为 import { defineConfig } from vite import vue…...

    最新智能优化算法: 阿尔法进化(Alpha Evolution,AE)算法求解23个经典函数测试集,MATLAB代码

    一、阿尔法进化算法 阿尔法进化&#xff08;Alpha Evolution&#xff0c;AE&#xff09;算法是2024年提出的一种新型进化算法&#xff0c;其核心在于通过自适应基向量和随机步长的设计来更新解&#xff0c;从而提高算法的性能。以下是AE算法的主要步骤和特点&#xff1a; 主…...

    用于可靠工业通信的5G-TSN集成原型:基于帧复制与消除可靠性的研究

    论文标题 中文标题&#xff1a;用于可靠工业通信的5G-TSN集成原型&#xff1a;基于帧复制与消除可靠性的研究 英文标题&#xff1a;5G-TSN Integrated Prototype for Reliable Industrial Communication Using Frame Replication and Elimination for Reliability 作者信息 …...

    HaProxy源码安装(Rocky8)

    haproxy具有高性能、高可用性、灵活的负载均衡策略和强大的将恐和日志功能&#xff0c;是法国开发者 威利塔罗(Willy Tarreau)在2000年使用C语言开发的一个开源软件&#xff0c;是一款具 备高并发(一万以上)、高性能的TCP和HTTP负载均衡器&#xff0c;支持基于cookie的持久性&a…...

    shell脚本备份MySQL数据库和库下表

    目录 注意&#xff1a; 一.脚本内容 二.执行效果 三.创建定时任务 注意&#xff1a; 以下为对MySQL5.7.42版本数据库备份shell脚本参考运行备份的机器请确认mysqldump版本>5.7&#xff0c;否则备份参数--set-gtid-purgedOFF无效&#xff0c;考虑到一般数据库节点和备份…...

    23. AI-大语言模型

    文章目录 前言一、LLM1. 简介2. 工作原理和结构3. 应用场景4. 最新研究进展5. 比较 二、Transformer架构1. 简介2. 基本原理和结构3. 应用场景4. 最新进展 三、开源1. 开源概念2. 开源模式3. 模型权重 四、再谈DeepSeek 前言 AI‌ 一、LLM LLM&#xff08;Large Language Mod…...

    Linux /dev/null

    /dev/null 是 Linux 和类 Unix 系统中一个特殊且非常有用的设备文件&#xff0c;也被称为空设备。下面为你详细介绍它的特点、用途和使用示例。 特点 写入丢弃&#xff1a;当向 /dev/null 写入数据时&#xff0c;这些数据会被立即丢弃&#xff0c;不会被保存到任何地方&#…...

    Unity CommandBuffer绘制粒子系统网格显示

    CommandBuffer是 Unity 提供的一种在渲染流程中插入自定义渲染命令的机制。在渲染粒子系统时&#xff0c;常规的渲染流程可能无法满足特定的渲染需求&#xff0c;而CommandBuffer允许开发者灵活地设置渲染参数、控制渲染顺序以及执行自定义的绘制操作。通过它&#xff0c;可以精…...

    基于信息熵的LLM工具集成推理优化框架解析

    1. 项目概述&#xff1a;基于信息熵的工具集成推理优化框架在大型语言模型&#xff08;LLM&#xff09;的实际应用中&#xff0c;工具集成推理&#xff08;Tool-Integrated Reasoning, TIR&#xff09;已成为增强模型能力的关键技术。通过调用外部工具&#xff08;如代码解释器…...

    高效解锁网盘直链下载:告别限速困扰的实用工具指南

    高效解锁网盘直链下载&#xff1a;告别限速困扰的实用工具指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 &#xff0c;支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘…...

    ToastFish:终极碎片化时间单词记忆神器,让摸鱼时间变黄金学习窗口

    ToastFish&#xff1a;终极碎片化时间单词记忆神器&#xff0c;让摸鱼时间变黄金学习窗口 【免费下载链接】ToastFish 一个利用摸鱼时间背单词的软件。 项目地址: https://gitcode.com/GitHub_Trending/to/ToastFish 在快节奏的现代生活中&#xff0c;你是否经常感叹&qu…...

    ChatGPT 根本看不懂你的项目?我写了个工具专门解决这个问题

    一、问题&#xff1a;AI 根本“读不懂”你的项目 最近在用 ChatGPT / Claude 做代码分析的时候&#xff0c;遇到一个很现实的问题&#xff1a; &#x1f449; 项目太大&#xff0c;根本喂不进去&#xff0c;压缩包读取费力&#xff0c;幻觉严重 具体表现&#xff1a; 仓库文…...

    苹果印度生产线直接停摆,离了中国工程师玩不转

    4 月 22 日传出苹果或被罚 380 亿美元的消息刚没过多久&#xff0c;「苹果印度生产线陷入停摆」在今天冲上热搜&#xff0c;给一直鼓吹产业链外迁的论调狠狠泼了一盆冷水。事件起因很简单&#xff1a;2026 年春节期间&#xff0c;驻守印度工厂的中国工程师、管理团队正常返乡休…...

    如何快速实现iOS下拉刷新与无限滚动:SVPullToRefresh完整指南

    如何快速实现iOS下拉刷新与无限滚动&#xff1a;SVPullToRefresh完整指南 【免费下载链接】SVPullToRefresh Give pull-to-refresh & infinite scrolling to any UIScrollView with 1 line of code. 项目地址: https://gitcode.com/gh_mirrors/sv/SVPullToRefresh …...

    BFloat16与SVE2指令集在深度学习中的优化实践

    1. BFloat16与SVE2指令集概述BFloat16&#xff08;Brain Floating Point 16&#xff09;是Google Brain团队提出的一种16位浮点格式&#xff0c;专为深度学习训练和推理优化设计。与传统的FP16相比&#xff0c;BFloat16保留了与FP32相同的8位指数位&#xff0c;仅将尾数位从23位…...

    别再用Python写AI后端了!PHP 9.0原生协程实现类ChatGPT实时流响应——附可运行GitHub仓库(限前200名领取)

    更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;PHP 9.0异步编程与AI聊天机器人教程概览 PHP 9.0 引入了原生协程&#xff08;Native Coroutines&#xff09;与 async/await 语法支持&#xff0c;标志着 PHP 正式迈入现代异步编程时代。该版本底层基于…...

    安卓一键改机神器|Root后秒变新机|无限制版

    温馨提示&#xff1a;文末有联系方式全新升级&#xff1a;安卓专属一键改机工具 全新优化的安卓改机工具&#xff0c;深度适配主流Root环境&#xff0c;操作极简&#xff0c;三步完成设备身份重写&#xff0c;真正实现‘一键焕新’。必备前提&#xff1a;仅限已Root安卓手机使用…...

    ubuntu 22.04如何安装libmodbus

    1‌、打开终端‌sudo apt update2、安装libmodbus的开发文件和库&#xff0c;通常还包括一些示例和文档sudo apt install libmodbus-dev3、安装编译工具和依赖‌&#xff1a;sudo apt install build-essential git cmake libtool autoconf automake4、克隆 libmodbus 的源代码‌…...