华人数学博士后反超DeepMind AI,停滞18年数学问题月内3次突破
创始人
2025-06-04 21:02:13

数学家出手反击AI!对AlphaEvolve在“集合和差问题”上的成果进一步改进。

DeepMind于5月14日宣布AlphaEvolve,不仅改进了矩阵乘法算法,还取得一系列成果,打破集合和差问题(Sums and differences of sets problem)自2007年来的纪录也是其中之一。

这一次,人类方法使用测度集中性来计算渐近值,只需要少量的计算机辅助

不到一个月时间,这个停滞18年的问题在人类与AI共同努力下3次取得突破

陶哲轩转发评价道:

对我来说,这生动展示了处理数学问题时,大量计算机辅助、适度计算机辅助和传统“纸笔”方法未来的相互作用,这些模式各有优缺点。

例如当前的AlphaEvolve很难处理后续论文中使用的渐近构造。

但另一方面,如果不先进行类似AlphaEvolve的半自动化搜索,人类方法也很难找到这些改进的机会。

最新成果来自西班牙数学科学研究所ICMAT的博士后Fan Zheng

这次他通过构造一系列特殊的集合U,在极限情况下将集合和差问题θ的下界提升至1.173077。

集合和差问题是集合论领域一个经典问题。

对于于两个整数集合A和B,它们的 “和集”(A+B)是所有可能的两数之和构成的集合,“差集”(A-B)是所有可能的两数之差构成的集合。

研究者想知道:当和集的大小被限制为不超过K倍A的大小时(即 | A+B| ≤ K|A|),差集的大小至少能有多大?

这个问题可以用一个指数θ来衡量,即差集大小至少是和集大小的θ次方级别(|A-B| ≥ c (K)・|A+B|^θ)。

θ越大,说明在和集大小被限制的情况下,差集的大小下限越高。提升θ的下界是该领域研究者的核心目标之一。

AlphaEvolve做了什么?

AlphaEvolve针对这个问题的解法比较暴力,先让Gemini大模型生成成百上千种候选方案,再通过自动化评估系统筛选。

AlphaEvolve采用了基于进化算法的框架,先用Gemini大模型生成的算法来构造满足条件的整数集合U,自动化评估系统计算以下内容:集合U的大小、和集|U+U|的大小、差集|U-U|的大小、相应的θ值。

表现优异的算法被保留、变异或组合,投入下一轮优化。这个过程持续迭代,直到算法性能不再提升。

最终构造出一个包含54265个整数的集合,将θ的下界提高到1.1584,比18年前的结果1.14465提高不少。

正如陶哲轩所说,AlphaEvolve的结果激发了更多后续研究。

人类数学家如何改进?

首先出手的是匈牙利数学家Robert Gerbicz

他曾创建同名的Gerbicz错误检查方法,被GIMPS和PrimeGrid等项目用于Proth质数、 Mersenne质数、Riesel质数等问题的检查。

这一次针对集合和差问题,Gerbicz引入坐标上界B,将原本的集合V(m,L)重新定义成W(m,L,B) 。

但新构造的集合既有和的约束(坐标和≤L),又有单个坐标的约束(每个坐标≤B),直接计算非常困难。

对于这一点,他利用组合数学中的容斥原理避免重复计算,先计算只有和约束的情况,再减去违反坐标约束的情况,最后考虑重叠部分的修正。

最终找到最优参数组合m=81411,L=65536,B=5,构造出构造出超过10^43546个元素的超大集合。

在这个问题上,大集合的离散误差的相对影响减小,能更好地逼近连续情况下的理论极限,还允许更大的参数选择空间,避免免小数效应导致的次优解。

他利用这个集合计算出对应的θ=1.173050,超越了AlphaEvolve的θ= 1.1584。

他使用免费的GMP库,整个计算过程约需15小时,相关代码Gerbicz也开源在了GitHub上。

仅仅10天后,Fan Zheng再次改进这个结果到θ=1.173077

虽然从θ=1.173050到θ=1.173077的提升看似微小,但他的主要贡献在于从具体构造转向理论分析。

在Gerbicz结果的基础上,Fan Zheng又引入了大偏差估计(Large Deviation Estimates)作为渐近分析框架。分析当m和L很大时,集合W(m,L,B)的大小在极限情况下的规律。

Fan Zheng的成果不仅在理论框架下获得的严格下界,还证明了通过渐近分析可以超越具体构造的限制,为进一步改进提供了系统性的方法。

对于这一系列成果,陶哲轩认为不应简单的看成是人类和AI谁赢谁输的零和博弈

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

在海能投顾交了12800服务费... 在海能投顾交了12800服务费怎么退?投顾被亏騙真相揭秘!退款其实很简单在跟海能投顾合作后,作为海能...
原创 9... 在即将到来的明年1月,各大厂商的中端新机都要陆续杀到了,其中最受期待的还是定于1月5日发布的荣耀Po...
金鳞订购APP如何退钱?违规白...   金鳞订购APP如何退钱?违规白银交易内幕真相曝光  投资有风险,投资需谨慎!针对网上素未谋面的网...
四川大.决策投顾违规荐股欺骗消... 四川大.决策投顾违规荐股欺骗消费者,曝光 退费流程公布!误导性宣传跟实际不符!证券公司正常利润来源是...
天鹅订购APP怎么样退亏的钱?... 天鹅订购APP怎么样退亏的钱?追回亏损不是空谈,真实经历教你避坑这类平台会利用各种手段进行大规模的宣...
上海亚商投顾股票咨询服务,虚假... 上海亚商投顾股票咨询服务,虚假宣传欺骗股民,频频亏损真相揭露,已依法退费!上海亚商服务费是可以退的。...
全程无人工干预,沪上高校推出全... 点菜、烹饪、结算,全程无人工干预 高校全场景AI食堂,啥样? 中午时分,走进餐厅,在电子屏前自助点份...
上海海能投顾徐习瑶荐股亏损严重... 上海海能投顾徐习瑶荐股亏损严重,曝光 退费流程公布!误导性宣传跟实际不符!证券公司正常利润来源是交易...
亿纬锂能取得电池包及用电设备专... 国家知识产权局信息显示,惠州亿纬锂能股份有限公司取得一项名为“电池包及用电设备”的专利,授权公告号C...
祥龙订购APP怎么退钱?忽悠手... 祥龙订购APP怎么退钱?忽悠手段大起底,真实退费案例来指路!掌上银牛APP、盈盈订购APP非法期货套...