你的位置:世博体育官网2024安卓最新版_手机app官方版免费安装下载 > 新闻 >
世博体育其中是需要优化的概率值-世博体育官网2024安卓最新版_手机app官方版免费安装下载
发布日期:2026-05-21 08:41 点击次数:169

无监督学习磨真金不怕火整数决议求解器的新范式来了。
中国科学技巧大学王杰教悔团队(MIRA Lab)建议了一种全新的整数决议求解步伐—— DiffILO(Differentiable Integer Linear Programming Optimization),联系论文已被东说念主工智能顶级海外会议 ICLR 2025 接受为 Spotlight。
成果泄漏:与现存主流的监督学习步伐对比,DiffILO 不仅权贵加速磨真金不怕火速率,还能生成更高质地的可行解。

小序:用机器学习解 ILP,为怎样此迤逦?
整数线性决议(ILP) 是组合优化中最基础亦然最关节的一类问题,平凡利用于工业退换、物流运载、收罗决议、芯片布图等实验场景。但是 ILP 的求解额外迤逦 —— 变量破裂、可行域复杂、搜索空间指数爆炸,内容上属于 NP 难问题。
连年来,机器学习缓缓被引入这一过程,尝试通过数据初始的方式加速求解器。但现时主流作念法大多依赖监督学习:先用传统求解器(如 Gurobi)生成一批解算作标签,然后磨真金不怕火模子去"师法"这些解。这种作念法存在两大瓶颈:
腾贵的磨真金不怕火本钱:每个样本齐需调用求解器生成标签;
磨真金不怕火方针与测试方针不一致:只优化揣摸差错,无法保险最终解的可行性与质地。
有莫得可能十足解脱标签依赖,平直让模子"我方"学会求解 ILP 问题?
谜底是:不错!该论文建议了DiffILO步伐,不错用梯度着落来"解整数决议"!

中枢步伐:DiffILO 是如何作念到的?
DiffILO,全称 Differentiable Integer Linear Programming Optimization,是一种无监督、端到端、可微分的 ILP 求解新范式。它的中枢改换是将破裂、带敛迹的整数决议问题,出动为一语气、可微、无敛迹的问题,并借助深度学习模子来平直揣摸高质地解。
步伐进程如下图所示:

步伐轻便不错分为三个步伐:
Step 1:从破裂到一语气——概率建模与敛迹生机化
ILP 问题的气象频繁如下:
DiffILO 的第一步是将每个 0-1 变量视为伯努利漫衍下的立地变量,即。
其中是需要优化的概率值。
传统 ILP 的"硬敛迹" 被出动为"生机敛迹抵拒为零":
这种生机建模方式有两个公道:
仍能保留原问题的最优解结构;
易于被惩办函数进一步出动为无敛迹气象。
Step 2:从敛迹到方针——惩办函数与可微重参数化
该步伐使用惩办函数法将上述生机敛迹合入方针函数:

但由于该函数的采样项并不成微,DiffILO 弃取了Gumbel-Softmax + 重参数手段,将破裂采样类似为一个一语气可导的函数:
使用 ,结束对伯努利的可微类似;
使用保留组合结构;
梯度通过回传,值通过保留,兼顾
"可微"和"破裂"的双重需求。
最终得到一个险些处处可导的方针函数,不错平直用梯度着落
进行优化。
Step 3:从图中学—— GNN 建模与端到端磨真金不怕火
每个 ILP 实例内容上不错被暗示为一个二分图:左边是变量,右边是敛迹,边代表变量出当今对应敛迹中。
使用一个图神经收罗(GNN)来编码这个结构,输入为图 G,输出为概率向量,再接入一个 MLP 进行最终揣摸。
磨真金不怕火过程十足无监督,方针是最小化上述可微方针函数。还引入了三种磨真金不怕火手段来增强褂讪性:
样本归一化:对方针函数作念归一处理,符合不同实例界限;
余弦退火:自符合学习率退换;
惩办所有这个词调控:动态调治 μ,均衡解质地与可行性。
实验成果
作家在多个尺度 ILP 数据集(如 Set Covering、Independent Set、Combinatorial Auction)上进行了系统评估。成果泄漏:与现存主流的监督学习步伐对比,DiffILO 不仅权贵加速磨真金不怕火速率,还能生成更高质地的可行解,而况在与 Gurobi、SCIP 集中使用时,权贵辅助求解器的举座性能。
作家先容
本论文作家耿子介是中国科学技巧大学 MIRA 实验室 2022 级博士生,师从王杰教悔。此前,他于 2022 年毕业于少年班学院,取得数学与利用数学专科学士学位。他的主要磋商主义包括机器学习在运筹优化与芯片打算等界限的利用、假话语模子等。他在 NeurIPS、ICML、ICLR 等东说念主工智能顶级会议上发表论文十余篇,其中五篇论文入选 Oral/Spotlight。他曾获 2024 年度国度奖学金;曾两次取得丘成桐大学生数学竞赛优越奖;曾在微软亚洲磋商院实习,取得"明日之星"称呼;曾屡次担任顶会审稿东说念主,获评 NeurIPS 2023 Top 审稿东说念主;参与创办南京真则收罗科技有限公司。
论文地址:
openreview.net/pdf?id=FPfCUJTsCn
一键三连「点赞」「转发」「谨防心」
接待在辩论区留住你的念念法!
— 完 —
学术投稿请于责任日发邮件到:
ai@qbitai.com
标题注明【投稿】,告诉咱们:
你是谁,从哪来,投稿内容
附上论文 / 气象主页延续,以及联系方式哦
咱们会(尽量)实时修起你

� � 点亮星标 � �
科技前沿发挥逐日见世博体育

