UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪

39年来一个看似理所当然的数学理论,刚刚被数学家证伪!UCLA和MIT的研究者证实:概率论中众所周知的假设「上下铺猜想」是错的。有趣的是,他们用AI已经证明到了99.99%的程度,但最终,靠的还是理论论证。
又一个看似坚固无比的数学理论,被证伪了!
最近,UCLA和MIT的研究者证伪了概率论中众所周知的假设——「上下铺猜想」。


上下铺猜想(Bunkbed Conjecture)也称为双层床猜想,是渗透理论中的一个陈述,该领域处理的是在图的边随机删除后存在的路径和簇。
猜想指出,在生成的随机子图中,上(下)铺的顶点连接到上(下)铺的某个顶点的概率,大于或等于它连接到下(上)铺顶点——即对应同构顶点的概率。
用白话说就是,在同一层的两个顶点之间的连接概率不可能小于连接不同层顶点之间的概率。这看起来确实再明显不过了!

1985年,数学家Pieter Kasteleyn首次提出了上下铺猜想。
然而,这个问题的猜想却让几代概率论学家都束手无策,一直作为一个多年未解的难题存在至今。原因在于……它是错的!
39年后,来自UCLA和MIT的三位研究者,在使用AI工具却多次折戟后,采用了全新的方法,发现了它的反例。

论文地址:https://arxiv.org/abs/2410.02545
由此,在学界似乎坚固无比的「上下铺猜想」自然就被推翻了。
此前,大量的工作都被用在证明这个猜想的正确性上,然而这几位研究者却反其道而行之,经历多次失败后,终于找到了反例。

猜想十分符合直觉,但是错的
许多数学家做研究的过程,是由直觉驱动的,比如可以感知数学真理的印度数学天才拉马努金。
这种直觉,来自对某些事情应该为真的深刻认知。但有时,直觉也会误导数学家,因为早期证据无法代表全貌,一个看似显而易见的陈述,也会有某些隐藏的细微之处。
20世纪80年代中期,一位名叫Pieter Kasteleyn的荷兰物理学家,想要在数学上证明一个关于液体如何在多孔固体中流动的推断。
由此,他提出了上下铺猜想。
要理解这个猜想,要先从一个图开始:这个图是由线或边连接的点或顶点的集合。

现在,让我们做一个这个图的精确副本,然后将它直接放置在原始图的上方。
在它们之间画一些垂直的柱子——这些是连接底部图上一些顶点与顶部图上对应顶点的额外边。
最终,我们会得到一个类似于上下铺的结构。

接下来,考虑底部图中的一条边。
抛一次硬币,如果是正面,就擦掉这条边;如果是反面,就保留这条边。对两个图中的每条边重复这一过程。
最终,顶部和底部的图会看起来不同,但它们仍然会通过垂直的「柱子」相连。

最后,在底部图中选择两个顶点。
你能沿着图的边从一个顶点走到另一个顶点吗,还是这两个顶点现在已经不连通了?
对于任何一个图,你都可以计算出存在路径的概率。
现在,再来看这两个相同的顶点,不过把其中一个替换为它在顶部图中正上方的顶点。有没有一条路径,可以让你从底部图中的起点顶点到顶部图中的终点顶点?

此处再复习一下:上下铺猜想认为,在下铺找到路径,其概率总是大于或等于跳到上铺找到路径的概率。
无论从哪个图开始,在上下铺之间画多少垂直柱,选择哪些起始和终点顶点,都不影响这一事实。
从直觉上看,这是个理所当然的事。

「我们的大脑告诉我们的任何信息,都表明这个猜想应该是正确的」,普林斯顿大学的图论学家Maria Chudnovsky这样说
也因此,几十年来,数学家们一直认为这是真的。
他们的直觉告诉他们,在一个铺位上移动应该比在两个铺位之间移动更容易——从下铺到上铺所需的额外垂直跳跃,应该会显著减少可用路径的数量。
而且,数学家们也希望它是真的。因为这些图可以被视为流体如何在多孔材料中移动或渗透的简化模型,就像水在海绵中移动一样。

如果上下铺猜想成立,物理学中被广泛相信的流体通过固体的可能性也就成立,渗流物理学的相关问题也能被解决。
然而数学家们在39年间尝试了无数次,却无人能够证明。
原因就在于——上下铺猜想是错的!
尝试用神经网络证伪
并不是所有数学家都相信上下铺猜想的真实性,加州大学洛杉矶分校的数学家Igor Pak就是其中一个。
他的研究生Nikita Gladkov表示,对于学界一直集中精力试图证明这个猜想,自己的导师毫不掩饰自己的批评。「如果它是错的呢?」

Nikita Gladkov
Igor Pak的怀疑还有一个理由:这个说法过于宽泛了。它真的适用于每个可想象的图吗?
「有些猜想是由实际动机驱动的,而其他猜想则是数学家的一厢情愿。」上下铺猜想看起来更像是后者。

Igor Pak的博客
早在2022年,他就开始着手推翻它。
花了一年时间后,他以失败告终。
Igor Pak意识到,是时候上一些暴力了!他让学生Gladkov使用计算机,对能找到的每一个图进行「暴力搜索」。
这就涉及到一些复杂的编程,因此Gladkov找来了大学室友、现MIT研究生Aleksandr Zimin,也是自己睡在下铺的兄弟。

Aleksandr Zimin
三人开始手动检查少于九个顶点的每一个可能的图。在这些图中,上下铺猜想是成立的。
但对于更大的图,可能的情况数量就一下子激增,他们无法再通过穷举法,穷尽所有可能的边缘删除方式或路径形成方式了。
随后,陷入困顿的三人转向了AI。
使用机器学习方法,他们训练了一个神经网络,用于生成可能更偏好向上跳跃的迂回路径图。
在众多示例中他们发现,下铺路径会比上铺替代路径概率稍高一点。但模型始终没有发现任何反例——也就是不同层路径概率更高的情况。
还有一个问题,就是神经网络生成的每个图过于庞大,以至于数学家们根本不可能调查抛硬币步骤的每一个结果。
相反,团队必须计算这些结果子集上上下路径的概率。
他们意识到,自己可以对神经网络给出的任何反例有超过99.99%的信心,却始终无法达到100%。
三人陷入怀疑:这种方法是否还值得?毕竟,只能达到99%而非百分百的证明,根本不足以说服数学圈,也不会被哪个著名期刊认为是足够严谨的证明。
「博士生需要的是现实中的工作,而不是理论上的工作,」Pak在博客上写道。Gladkov和Zimin很快就要找工作了,最终,三人停止了这项工作。
虽然他们放弃了计算方法,却并未停止思考这个问题。接下来的几个月,他们拼命想做出一个不需要计算机的理论论证,却缺少所需的所有要素。
就在这时,一项来自英国的研究,让事情有了转机。
最后,不用计算机了
6月,剑桥大学的Lawrence Hollom在另一种语境下,证伪了上下铺问题的一个版本。
这个猜想的表述并非针对图,而是研究称为超图(hypergraph)的数学对象。在超图中,边的定义不再局限于连接一对顶点,而是可以连接任意数量的顶点。
Hollom找到了这个版本猜想的一个反例。他创建了一个小型超图,每条边都连接三个顶点:

Gladkov发现这篇论文后意识到,这正是他们三人所需要的!
他从晚上一直读到凌晨3点,并在睡觉前给Zimin发了短信。第二天,两个人便通了电话。就能否将Hollom的反例转化为一个能否推翻原始上下铺猜想的普通图,展开了讨论。

其实,这对老朋友之前就考虑过如何将超图转化为图。
去年年初,他们在一起参加音乐会之前讨论过这个问题。「红辣椒乐队在唱歌,而我在思考这个问题,」Gladkov说道。
后来,他们开发出了可以在特定情况下将超图转化为图的技术。
如今,这些技术刚好可以用来改造Hollom的超图。

Gladkov、Pak和Zimin用庞大的点集和普通边组成的集群,替换了超图中的每个三顶点边。
最终,他们得到了一个巨大的图,由7,222个顶点和14,422条边连接而成。
他们放弃了AI的方法后,利用构建的理论来重新证明。
最终,他们在图中发现,对于位于下路径的点,找到上路径的概率比找到下路径高出1/10^6,500个百分点——虽然这个数值极小,但并不为0。
由此可以证明:上下铺猜想是错误的!

果然,数学家们在任何时刻都不能想当然地接受任何事。普林斯顿数学家Noga Alon表示:「我们必须保持怀疑,即便是那些直觉上看起来极有可能为真的事情。」
不过,Gladkov、Pak和Zimin只是找到了许多符合该猜想的小图,但这些例子并且最终反映出——当顶点和边的数量足够多时,数学家可以构造出更为复杂且反直觉的图。
正如Hollom所言,「我们真的像我们自认为的那样,理解所有东西吗?」
目前,数学家们仍然相信激发上下铺猜想的关于固体中连接位置的物理命题。但他们需要找到其他方法来证明它。
与此同时,Pak表示,数学家们显然需要更积极地讨论数学证明的本质。他们最终并未依赖有争议的计算方法,而是以完全确定的方式推翻了猜想。
但随着计算机和AI的研究方法在数学研究中变得越来越普遍,一些数学家也在讨论:该领域的规范是否需要改变?
「这是一个哲学问题,」Alon说道,「我们该如何看待那些仅在高概率下成立的证明呢?」
罗格斯大学的数学家Doron Zeilberger认为,未来的数学圈会接受这样的概率性证明。在50年内或更短时间内,人们就会形成全新的态度。
在论文中,他经常把自己的计算机(Shalosh B. Ekhad)列为合著者。

「Shalosh」和「Ekhad」在希伯来语中分别意为「三」和「一」,也就是Zeilberger第一台计算机AT&T 3B1;代指他所用到的任意一台——从新泽西办公室里的戴尔电脑,到偶尔在奥地利调用的超级计算机
但也有一些人,则担心这样的未来可能会危及一些根本性的东西。「概率性证明可能会削弱我们对问题本质的理解和直觉,」Alon认为。
最后Pak建议,鉴于这类研究日益增多,应该为它们创建专门的学术期刊,以免其价值被数学界忽视。
「这个问题没有标准答案。但我希望学术界能够认真思考,当下一个类似的研究结果出现时,我们是否应该接受它。」
随着AI等技术持续渗透和改变数学领域,这个问题只会愈发紧迫。
团队介绍
Nikita Gladkov
Nikita Gladkov是加州大学洛杉矶分校数学系博士生,导师是Igor Pak。
此前,他在俄罗斯高等经济学院获得数学学士学位,导师是Alexander Kolesnikov,并曾在Yandex数据分析学校学习数据分析。
Igor Pak

Igor Pak是加州大学洛杉矶分校数学系教授,隶属于组合数学研究组,这是美国最古老的组合数学研究组之一。
此前,他曾在明尼苏达大学和麻省理工学院担任过副教授,在耶鲁大学担任过J. W. Gibbs讲师,并在MSRI担任过博士后研究员。
他于1993年在莫斯科国立大学获得数学学士学位,1997年在哈佛大学获得数学博士学位
Aleksandr Zimin

Aleksandr Zimin是麻省理工学院数学系博士三年级学生,在Philippe Rigollet教授的指导下进行研究。主要研究领域是最优运输理论。
他正在和Alexander Kolesnikov和Nikita Gladkov一起研究Monge-Kantorovich问题的广义化,并与Aleh Tsyvinski(耶鲁大学)和Job Boerma(威斯康星大学麦迪逊分校)合作研究在经济学中的应用。
同时,他还对计算机科学有浓厚的兴趣——曾在Yandex数据分析学校完成了为期两年的课程,深入学习了机器学习的不同领域。
他具有丰富的高质量计算机代码编写经验,从而能够在研究中进行复杂的数值实验。
他于2019年在莫斯科高等经济大学以最高荣誉获得数学学士学位,2021年在俄罗斯斯科尔科沃科学技术研究院获得数学与理论物理硕士学位,同年在莫斯科高等经济大学获得数学硕士学位。
参考资料:
https://www.quantamagazine.org/maths-bunkbed-conjecture-has-been-debunked-20241101/
https://igorpak.wordpress.com/2024/10/01/the-bunkbed-conjecture-is-false/
相关文章:
UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪
39年来一个看似理所当然的数学理论,刚刚被数学家证伪!UCLA和MIT的研究者证实:概率论中众所周知的假设「上下铺猜想」是错的。有趣的是,他们用AI已经证明到了99.99%的程度,但最终,靠的还是理论论证。 又一个…...
大厂面试真题-很多系统会使用netty进行长连接,连接太多会有问题吗
使用Netty进行长连接时,机器数量过多确实可能会因为连接数量过多而引发问题。这些问题主要涉及系统资源消耗、连接管理、性能优化等方面。以下是对这些潜在问题的详细分析: 一、系统资源消耗 文件句柄限制: 在Linux等操作系统中,…...
Android RecyclerView ,使用ItemDecoration设置边距的大坑:左右边距不均匀/不同,已解决。
写在前面:最近有一个需求,在长宽固定的一块区域内,使用RecyclerView实现APP显示界面,考虑一下使用了网格布局GridLayoutManager,弄成5列的网格。设置边距的时候,使用ItemDecoration设置上、左边距。但是恶心的事情发生了,明明所有Item都设置了同样的左边距,但是只有第一…...
系统上云-流量分析和链路分析
优质博文:IT-BLOG-CN 一、流量分析 【1】流量组成: 按协议划分,流量链路可分为HTTP、SOTP、QUIC三类。 HTTPSOTPQUIC场景所有HTTP请求,无固定场景国内外APP等海外APP端链路选择DNS/CDN(当前特指Akamai)APP端保底IP列表/动态IP下…...
Apache 配置出错常见问题及解决方法
Apache 配置出错常见问题及解决方法 一、端口被占用问题 问题描述:在启动 Apache 时,出现“Address already in use”或类似的错误提示,这意味着 Apache 想要使用的端口已经被其他程序占用,导致 Apache 无法正常启动。原因分析: 系统中已经有其他的应用程序在使用 Apache…...
DGL库之dgl.function.u_mul_e(代替dgl.function.src_mul_edge)
DGL库之dgl.function.u_mul_e 语法格式例子 语法格式 dgl.function.u_mul_e代替了dgl.function.src_mul_edge dgl.function.u_mul_e(lhs_field, rhs_field, out)一个用于计算消息传递的内置函数,它通过对源节点(u)和边(e&#x…...
题目练习之二叉树那些事儿
♥♥♥~~~~~~欢迎光临知星小度博客空间~~~~~~♥♥♥ ♥♥♥零星地变得优秀~也能拼凑出星河~♥♥♥ ♥♥♥我们一起努力成为更好的自己~♥♥♥ ♥♥♥如果这一篇博客对你有帮助~别忘了点赞分享哦~♥♥♥ ♥♥♥如果有什么问题可以评论区留言或者私信我哦~♥♥♥ 知道了二叉树的结…...
数字马力二面面试总结
24.03.07数字马力二面面试总结 前段时间找工作,做的一些面试笔记总结 大家有面试录音或者记录的也可以发给我,我来整理答案呀 数字马力二面面试总结 24.03.07数字马力二面面试总结你可以挑一个你的最有挑战性的,有难度的,最具有复杂性的项目,可以简单说一下。有没有和算…...
优化图片大小的方法
不能起到优化图片大小的方法有(C) A.减少每个像素点能够显示的颜色 B.减少像素点 C.使用ajax加载 D.使用WebP格式 C. 使用Ajax加载 Ajax是一种用于在网页中异步加载数据的技术,与图片大小的优化关系不大。它主要用于提高网页的加载效率&…...
DevOps-课堂笔记
各种 aaS 类比于计算机网络的 OSI 参考模型,一个软件应用项目需要不同的支撑层,例如从下至上大概需要: 硬件层面的服务器针对硬件做弹性分配的虚拟化机制,例如虚拟机在虚拟化环境内运行的 OS支撑软件应用的中间件,例…...
Redis - Hash 哈希
一、基本认识 ⼏乎所有的主流编程语⾔都提供了哈希(hash)类型,它们的叫法可能是哈希、字典、关联数 组、映射。在Redis中,哈希类型是指值本⾝⼜是⼀个键值对结构,形如key"key",value{{ field1, v…...
dns服务部署
配置主文件,编辑主配置文件设置监听IP , 重启服务:[rootlocalhost ~]# systemctl restart network 安装bind 主服务器IP信息: [rootlocalhost ~]# nmcli c modify ens160 ipv4.method manual ipv4.addresses 129.168.160.131/24…...
【Hadoop和Hbase集群配置】3台虚拟机、jdk+hadoop+hbase下载和安装、环境配置和集群测试
目录 一、环境 二、虚拟机配置 三、 JDK、Hadoop、HBase的安装和配置 【安装和配置JDK】 【安装和配置Hadoop】 【安装和配置Hbase】 四、 Hadoop和HBase集群测试 【Hadoop启动测试】 【Hbase启动测试】 一、环境 OS: CentOS-7 JDK: v1.8.0_131 Hadoop: v2.7.6 Hb…...
超萌!HTMLCSS:超萌卡通熊猫头
效果演示 创建了一个卡通风格的熊猫头 HTML <div class"box"><div class"head"><div class"head-copy"></div><div class"ears-left"></div><div class"ears-right"></di…...
人脑与机器连接:神经科技的伦理边界探讨
内容概要 在当今科技飞速发展的时代,人脑与机器连接已成为一个引人注目的前沿领域。在这一背景下,神经科技的探索为我们打开了一个全新的世界,从脑机接口到人工智能的飞跃应用,不仅加速了技术的进步,更触动了我们内心…...
Mac M1 Docker创建Rocketmq集群并接入Springboot项目
文章目录 前言Docker创建rocketmq集群创建rocketmq目录创建docker-compose.yml新增broker.conf文件启动容器 Springboot 接入 rocketmq配置maven依赖修改appplication.yml新增消息生产者新增消费者测试发送消息 总结 前言 最近公司给配置了一台mac,正好有时间给装一…...
k8s 查看cpu使用率最高的pod
在 Kubernetes 中,可以使用 kubectl top 命令查看 Pod 的资源使用情况,从而找到 CPU 使用率最高的 Pod。 步骤 使用 kubectl top pods 查看所有 Pod 的 CPU 使用情况 运行以下命令查看集群中所有 Pod 的 CPU 和内存使用情况: kubectl top po…...
jenkins 构建报错 Cannot run program “sh”
原因 在 windows 操作系统 jenkins 自动化部署的时候, 由于自动化构建的命令是 shell 执行的,而默认windows 从 path 路径拿到的 shell 没有 sh.exe ,因此报错。 解决方法 前提是已经安装过 git WINR 输入cmd 打开命令行, 然后输入where git 获取 git 的路径, …...
Netty ByteBuf 分配 | 池化复用 、直接内存
Netty ByteBuf 分配 本文主要内容关于 ByteBuf 分配介绍,为了更好的理解本文,我们可以带着几个问题思考 在IO密集型业务场景下,可能涉及大量ByteBuf分配,这时我们需 要考虑会不会产生OOM会不会出现频繁GC会不会内存泄露 根据上…...
【数据结构】堆和二叉树(2)
文章目录 前言一、建堆和堆排序1.堆排序 二、二叉树链式结构的实现1.二叉树的遍历 三、链式二叉树的功能函数1.二叉树结点个数2.二叉树叶子结点个数3.二叉树的高度4.二叉树第k层结点个数5. 二叉树查找值为x的结点6.二叉树销毁 总结 前言 接着上一篇博客,我们继续分…...
对比按次计费Taotoken的TokenPlan套餐为长期项目带来的成本变化
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 对比按次计费与Taotoken的TokenPlan套餐为长期项目带来的成本变化 在持续运营的AI项目中,成本的可预测性与可控性是团队…...
同样做App开发,两种技术栈到底适合谁?看完直接选不纠结
原生开发栈的适配人群前端苹果安卓原生开发后端Java,是互联网行业里沿用多年的经典组合。很多从计算机相关专业科班毕业的开发者,最早接触的就是这套路线。大学课程里会教Java基础,会分方向讲Android和iOS的原生开发知识,毕业之后…...
实战案例|向导布局一出手,企业流程表单直接专业满级
实战案例|向导布局一出手,企业流程表单直接专业满级 在企业系统里,有一类表单天生就必须按步骤走:用户注册、企业认证、项目申报、入职办理、采购申请、合同签署…这类表单一旦用 Tab 或折叠面板,就会显得不规范、不正…...
副本机制与 ISR 设计:为什么 Kafka 这么快又这么可靠
几年前我接手过一个"慢到不能忍"的消息系统。Kafka 集群,日处理 500 亿条消息,QPS 峰值 120 万。但是隔三差五出现"数据延迟积压",有时候一条消息从生产到消费,竟然要等几十秒。查了一周,发现跟 K…...
Navicat Premium试用期重置终极指南:三步恢复完整14天试用
Navicat Premium试用期重置终极指南:三步恢复完整14天试用 【免费下载链接】navicat-premium-reset-trial Reset macOS Navicat Premium 15/16/17 app remaining trial days 项目地址: https://gitcode.com/gh_mirrors/na/navicat-premium-reset-trial 你是否…...
在自动化工作流中集成大模型,利用Taotoken统一API调用与管理
🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 在自动化工作流中集成大模型,利用Taotoken统一API调用与管理 将大模型能力集成到自动化工作流中,例如CI/CD…...
终极指南:3分钟掌握英雄联盟智能助手League Akari的完整使用技巧 [特殊字符]
终极指南:3分钟掌握英雄联盟智能助手League Akari的完整使用技巧 🚀 【免费下载链接】League-Toolkit An all-in-one toolkit for LeagueClient. Gathering power 🚀. 项目地址: https://gitcode.com/gh_mirrors/le/League-Toolkit 想…...
java之微信机器人二次开发文档
WTAPI框架weixin ipad 协议 在微信个人号二次开发中的应用,涵盖技术架构、核心功能、开发流程及安全合规要点,为开发者提供系统化解决方案。 ⚡ 核心能力 好友管理:添加好友、删除好友、修改备注、创建标签、获取好友列表、搜索好友信息 消息…...
5CGTFD7D5F27C7N、支持550MHz全局时钟与287MHz DSP处理的高性能FPGA
内容介绍今天我要向大家介绍的是 Altera 的一款高性能现场可编程门阵列(FPGA)——5CGTFD7D5F27C7N。它采用先进的Cyclone V架构设计,专为工业级应用和高性能低功耗系统而设计。对于核心性能部分,5CGTFD7D5F27C7N在-7速度等级下&am…...
如何在Python中创建测试图像
原文地址:https://medium.com/itberrios6/how-to-make-a-test-image-in-python-1a6c2d41b6ab 学习如何制作测试图像 在计算机视觉和图像处理中,创建测试图像以更好地了解算法或滤波器将如何执行通常是有用的。测试图像是一个基准,可以将多种…...
