Paperjam

#5103 · Xiao Yang, Kai Sun, Hao Xin, Yushi Sun, Nikita Bhalla, Xiangsen Chen, Sajal Choudhary, Rongze Gui, Ziran Jiang, Ziyu Jiang, Lingkun Kong, Brian Moran, Jiaqi Wang, Yifan Xu, An Yan, Chenyu Yang, Eting Yuan, Hanwen Zha, Nan Tang, Lei Chen, Nicolas Scheffer, Yue Liu, Nirav Shah, Rakesh Wanga, Anuj Kumar, Scott Yih, Xin Dong

NewTerm: Benchmarking Real-Time New Terms for Large Language Models with Annual Updates

#5104 · Hexuan Deng, Wenxiang Jiao, Xuebo Liu, Min Zhang, Zhaopeng Tu

3DCoMPaT200: Language Grounded Large-Scale 3D Vision Dataset for Compositional Recognition

#5105 · Mahmoud Ahmed, Xiang Li, Arpit Prajapati, Mohamed Elhoseiny

Streaming Detection of Queried Event Start

#5106 · Cristobal Eyzaguirre, Eric Tang, Shyamal Buch, Adrien Gaidon, Jiajun Wu, Juan Carlos Niebles

Instruction Tuning Large Language Models to Understand Electronic Health Records

#5107 · Zhenbang Wu, Anant Dadu, Michael Nalls, Faraz Faghri, Jimeng Sun

TorchSpatial: A Location Encoding Framework and Benchmark for Spatial Representation Learning

#5108 · Nemin Wu, Qian Cao, Zhangyu Wang, Zeping Liu, Yanlin Qi, Jielu Zhang, Joshua Ni, X. Yao, Hongxu Ma, Lan Mu, Stefano Ermon, Tanuja Ganu, Akshay Nambi, Ni Lao, Gengchen Mai

DataComp-LM: In search of the next generation of training sets for language models

#5109 · Amro Abbas, Alon Albalak, Kushal Arora, Hritik Bansal, Yonatan Bitton, Yair Carmon, Khyathi Chandu, Mayee Chen, Giannis Daras, Achal Dave, Alex Dimakis, Alaaeldin El-Nouby, Fartash Faghri, Alex Fang, Samir Yitzhak Gadre, Josh Gardner, Saurabh Garg, Dhruba Ghosh, Aaron Gokaslan, Dirk Groeneveld, Etash Guha, Suchin Gururangan, Reinhard Heckel, Cheng-Yu Hsieh, Gabriel Ilharco, Maor Ivgi, Jenia Jitsev, Matt Jordan, Sham Kakade, Sedrick Scott Keh, Maciej Kilian, Pang Wei Koh, Thomas Kollar, Jeffrey Li, Kyle Lo, Kalyani Marathe, Jean Mercat, Niklas Muennighoff, Marianna Nezhurina, Thao Nguyen, Sewoong Oh, Hadi Pouransari, Sarah Pratt, Sunny Sanyal, Ludwig Schmidt, Vaishaal Shankar, Rulin Shao, Georgios Smyrnis, Luca Soldaini, Shuran Song, Alexander Toshev, Igor Vasiljevic, Stephanie Wang, Mitchell Wortsman, Rui Xin, Luke Zettlemoyer, Hanlin Zhang, Jieyu Zhang

MassSpecGym: A benchmark for the discovery and identification of molecules

#5110 · Roman Bushuiev, Anton Bushuiev, Niek de Jonge, Adamo Young, Fleming Kretschmer, Raman Samusevich, Janne Heirman, Fei Wang, Luke Zhang, Kai Dührkop, Marcus Ludwig, Nils Haupt, Apurva Kalia, Corinna Brungs, Robin Schmid, Russell Greiner, Bo Wang, David Wishart, Liping Liu, Juho Rousu, Wout Bittremieux, Hannes Rost, Tytus Mak, Soha Hassoun, Florian Huber, Justin J.J. van der Hooft, Michael Stravs, Sebastian Böcker, Josef Sivic, Tomáš Pluskal

RelBench: A Benchmark for Deep Learning on Relational Databases

#5200 · Joshua Robinson, Rishabh Ranjan, Weihua Hu, Kexin Huang, Jiaqi Han, Alejandro Dobles, Matthias Fey, Jan Eric Lenssen, Yiwen Yuan, Zecheng Zhang, Xinwei He, Jure Leskovec

ClashEval: Quantifying the tug-of-war between an LLM’s internal prior and external evidence

#5201 · Kevin Wu, Eric Wu, James Zou

WindsorML - High-Fidelity Computational Fluid Dynamics Dataset For Automotive Aerodynamics

#5202 · Neil Ashton, Jordan Angel, Aditya Ghate, Gaetan Kenway, Man Long Wong, Cetin Kiris, Astrid Walle, Danielle Maddix, Gary Page

Dataset and Lessons Learned from the 2024 SaTML LLM Capture-the-Flag Competition

#5203 · Edoardo Debenedetti, Javier Rando, Daniel Paleka, Silaghi Florin, Dragos Albastroiu, Niv Cohen, Yuval Lemberg, Reshmi Ghosh, Rui Wen, Ahmed Salem, Giovanni Cherubin, Santiago Zanella-Beguelin, Robin Schmid, Victor Klemm, Takahiro Miki, Chenhao Li, Stefan Kraft, Mario Fritz, Florian Tramer, Sahar Abdelnabi, Lea Schönherr

SafeSora: Towards Safety Alignment of Text2Video Generation via a Human Preference Dataset

#5204 · Juntao Dai, Tianle Chen, Xuyao Wang, Ziran Yang, Taiye Chen, Jiaming Ji, Yaodong Yang

Benchmark Repositories for Better Benchmarking

#5205 · Rachel Longjohn, Markelle Kelly, Sameer Singh, Padhraic Smyth

CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models

#5206 · Peng Xia, Ze Chen, Juanxi Tian, Yangrui Gong, Ruibo Hou, Yue Xu, Zhenbang Wu, Zhiyuan Fan, Yiyang Zhou, Kangyu Zhu, Wenhao Zheng, Zhaoyang Wang, Xiao Wang, Xuchao Zhang, Chetan Bansal, Marc Niethammer, Junzhou Huang, Hongtu Zhu, Yun Li, Jimeng Sun, Zongyuan Ge, Gang Li, James Zou, Huaxiu Yao

WebUOT-1M: Advancing Deep Underwater Object Tracking with A Million-Scale Benchmark

#5207 · Chunhui Zhang, Li Liu, Guanjie Huang, Hao Wen, XI ZHOU, Yanfeng Wang

PEACE: A Dataset of Pharmaceutical Care for Cancer Pain Analgesia Evaluation and Medication Decision

#5208 · Yutao Dou, Huimin Yu, Wei Li, Jingyang Li, Fei Xia, Jian Xiao

EgoSim: An Egocentric Multi-view Simulator for Body-worn Cameras during Human Motion

#5209 · Dominik Hollidt, Paul Streli, Jiaxi Jiang, Yasaman Haghighi, Changlin Qian, Xintong Liu, Christian Holz

Re-assembling the past: The RePAIR dataset and benchmark for real world 2D and 3D puzzle solving

#5210 · Theodore Tsesmelis, Luca Palmieri, Marina Khoroshiltseva, Adeela Islam, Gur Elkin, Ofir I Shahar, Gianluca Scarpellini, Stefano Fiorini, Yaniv Ohayon, Nadav Alali, Sinem Aslan, Pietro Morerio, Sebastiano Vascon, Elena gravina, Maria Napolitano, Giuseppe Scarpati, Gabriel zuchtriegel, Alexandra Spühler, Michel Fuchs, Stuart James, Ohad Ben-Shahar, Marcello Pelillo, Alessio Del Bue

UniBench: Visual Reasoning Requires Rethinking Vision-Language Beyond Scaling

#5211 · Haider Al-Tahan, Quentin Garrido, Randall Balestriero, Diane Bouchacourt, Caner Hazirbas, Mark Ibrahim

On the Effects of Data Scale on Computer Control Agents

#5300 · WEI Li, William Bishop, Alice Li, Christopher Rawles, Folawiyo Campbell-Ajala, Divya Tyamagundlu, Oriana Riva

LLMCBench: Benchmarking Large Language Model Compression for Efficient Deployment

#5301 · Jinyang Guo, Ge Yang, Changyi He, Jianyu Wu, Yifu Ding, Aishan Liu, Haotong Qin, Pengliang Ji, Xianglong Liu

Personalized Instance-based Navigation Toward User-Specific Objects in Realistic Environments

#5302 · Luca Barsellotti, Roberto Bigazzi, Marcella Cornia, Lorenzo Baraldi, Rita Cucchiara

MMDU: A Multi-Turn Multi-Image Dialog Understanding Benchmark and Instruction-Tuning Dataset for LVLMs

#5303 · Ziyu Liu, Tao Chu, Yuhang Zang, Xilin Wei, Xiaoyi Dong, Pan Zhang, Zijian Liang, Yuanjun Xiong, Dahua Lin, Yu Qiao, Jiaqi Wang

ChaosBench: A Multi-Channel, Physics-Based Benchmark for Subseasonal-to-Seasonal Climate Prediction

#5304 · Juan Nathaniel, Yongquan Qu, Tung Nguyen, Sungduk Yu, Julius Busecke, Aditya Grover, Pierre Gentine

Rethinking the Evaluation of Out-of-Distribution Detection: A Sorites Paradox

#5305 · Xingming Long, Jie Zhang, Shiguang Shan, Xilin Chen

EvoCodeBench: An Evolving Code Generation Benchmark with Domain-Specific Evaluations

#5306 · Jia Li, Ge Li, Xuanming Zhang, YunFei Zhao, Yihong Dong, Zhi Jin, Binhua Li, Fei Huang, Yongbin Li

A Data-Centric Perspective on Evaluating Machine Learning Models for Tabular Data

#5307 · Andrej Tschalzev, Sascha Marton, Stefan Lüdtke, Christian Bartelt, Heiner Stuckenschmidt

A New Multi-Source Light Detection Benchmark and Semi-Supervised Focal Light Detection

#5308 · Jae-Yong Baek, Yong-Sang Yoo, Seung-Hwan Bae

LucidAction: A Hierarchical and Multi-model Dataset for Comprehensive Action Quality Assessment

#5309 · Linfeng Dong, Wei Wang, Yu Qiao, Xiao Sun

HARMONIC: Harnessing LLMs for Tabular Data Synthesis and Privacy Protection

#5310 · Yuxin Wang, Duanyu Feng, Yongfu Dai, Zhengyu Chen, Jimin Huang, Sophia Ananiadou, Qianqian Xie, Hao Wang

Web2Code: A Large-scale Webpage-to-Code Dataset and Evaluation Framework for Multimodal LLMs

#5311 · Sukmin Yun, haokun lin, Rusiru Thushara, Mohammad Bhat, Yongxin Wang, zutao jiang, Mingkai Deng, Jinhong Wang, Tianhua Tao, Junbo Li, Haonan Li, Preslav Nakov, Timothy Baldwin, Zhengzhong Liu, Eric Xing, Xiaodan Liang, Zhiqiang Shen

Paloma: A Benchmark for Evaluating Language Model Fit

#5400 · Ian Magnusson, Akshita Bhagia, Valentin Hofmann, Luca Soldaini, Ananya Harsh Jha, Oyvind Tafjord, Dustin Schwenk, Evan Walsh, Yanai Elazar, Kyle Lo, Dirk Groeneveld, Iz Beltagy, Hannaneh Hajishirzi, Noah Smith, Kyle Richardson, Jesse Dodge

Efficient Lifelong Model Evaluation in an Era of Rapid Progress

#5401 · Ameya Prabhu, Vishaal Udandarao, Philip Torr, Matthias Bethge, Adel Bibi, Samuel Albanie

Fair Kernel K-Means: from Single Kernel to Multiple Kernel

#5402 · Peng Zhou, Rongwen Li, Liang Du

Achievable Fairness on Your Data With Utility Guarantees

#5403 · Muhammad Faaiz Taufiq, Jean-Francois Ton, Yang Liu

A Closer Look at AUROC and AUPRC under Class Imbalance

#5404 · Matthew McDermott, Haoran Zhang, Lasse Hansen, Giovanni Angelotti, Jack Gallifant

Fairness in Social Influence Maximization via Optimal Transport

#5405 · Shubham Chowdhary, Giulia De Pasquale, Nicolas Lanzetti, Ana-Andreea Stoica, Florian Dorfler

Fair Wasserstein Coresets

#5406 · Zikai Xiong, Niccolo Dalmasso, Shubham Sharma, Freddy Lecue, Daniele Magazzeni, Vamsi Potluru, Tucker Balch, Manuela Veloso

Scale-invariant Optimal Sampling for Rare-events Data and Sparse Models

#5407 · Jing Wang, HaiYing Wang, Hao Zhang

Universal Rates of Empirical Risk Minimization

#5408 · Steve Hanneke, Mingyue Xu

PAC-Bayes-Chernoff bounds for unbounded losses

#5409 · Ioar Casado Telletxea, Luis Antonio Ortega Andrés, Aritz Pérez, Andres Masegosa

Learning the Infinitesimal Generator of Stochastic Diffusion Processes

#5410 · Vladimir Kostic, Hélène Halconruy, Timothée Devergne, Karim Lounici, Massimiliano Pontil

Global Rewards in Restless Multi-Armed Bandits

#5500 · Naveen Raman, Zheyuan Shi, Fei Fang

On $f$-Divergence Principled Domain Adaptation: An Improved Framework

#5501 · Ziqiao Wang, Yongyi Mao

A provable control of sensitivity of neural networks through a direct parameterization of the overall bi-Lipschitzness

#5502 · Yuri Kinoshita, Taro Toyoizumi

Achieving $\tilde{O}(1/\epsilon)$ Sample Complexity for Constrained Markov Decision Process

#5503 · Jiashuo Jiang, Yinyu Ye

Controlling Multiple Errors Simultaneously with a PAC-Bayes Bound

#5504 · Reuben Adams, John Shawe-Taylor, Benjamin Guedj

How Transformers Utilize Multi-Head Attention in In-Context Learning? A Case Study on Sparse Linear Regression

#5505 · Xingwu Chen, Lei Zhao, Difan Zou

On the Sparsity of the Strong Lottery Ticket Hypothesis

#5506 · Emanuele Natale, Davide Ferre, Giordano Giambartolomei, Frederic Giroire, Frederik Mallmann-Trenn

Compositional PAC-Bayes: Generalization of GNNs with persistence and beyond

#5507 · Kirill Brilliantov, Amauri Souza, Vikas Garg

One-Layer Transformer Provably Learns One-Nearest Neighbor In Context

#5508 · Zihao Li, Yuan Cao, Cheng Gao, Yihan He, Han Liu, Jason Klusowski, Jianqing Fan, Mengdi Wang

High-dimensional (Group) Adversarial Training in Linear Regression

#5509 · Yiling Xie, Xiaoming Huo

Nearly Minimax Optimal Regret for Multinomial Logistic Bandit

#5510 · Joongkyu Lee, Min-hwan Oh

A Theory of Optimistically Universal Online Learnability for General Concept Classes

#5600 · Steve Hanneke, Hongao Wang

Stabilizing Linear Passive-Aggressive Online Learning with Weighted Reservoir Sampling

#5601 · Skyler Wu, Fred Lu, Edward Raff, James Holt

Learning to Price Homogeneous Data

#5602 · Keran Chen, Joon Suk Huh, Kirthevasan Kandasamy

A Best-of-both-worlds Algorithm for Bandits with Delayed Feedback with Robustness to Excessive Delays

#5603 · Saeed Masoudian, Julian Zimmert, Yevgeny Seldin

Provably Efficient Interactive-Grounded Learning with Personalized Reward

#5604 · Mengxiao Zhang, Yuheng Zhang, Haipeng Luo, Paul Mineiro

RefDrop: Controllable Consistency in Image or Video Generation via Reference Feature Guidance

#5605 · Jiaojiao Fan, Haotian Xue, Qinsheng Zhang, Yongxin Chen

Strategic Multi-Armed Bandit Problems Under Debt-Free Reporting

#5606 · Ahmed Ben Yahmed, Clément Calauzènes, Vianney Perchet

Fast Rates in Stochastic Online Convex Optimization by Exploiting the Curvature of Feasible Sets

#5607 · Taira Tsuchiya, Shinji Ito

Contextual Active Model Selection

#5608 · Xuefeng Liu, Fangfang Xia, Rick Stevens, Yuxin Chen

A Continuous-time Stochastic Gradient Descent Method for Continuous Data

#5609 · Kexin Jin, Jonas Latz, Chenguang Liu, Carola-Bibiane Schönlieb

S-STE: Continuous Pruning Function for Efficient 2:4 Sparse Pre-training

#5610 · Yuezhou Hu, Jun Zhu, Jianfei Chen

GLinSAT: The General Linear Satisfiability Neural Network Layer By Accelerated Gradient Descent

#5700 · Hongtai Zeng, Chao Yang, Yanzhen Zhou, Cheng Yang, Qinglai Guo

Optimizing over Multiple Distributions under Generalized Quasar-Convexity Condition

#5701 · Ding Shihong, Long Yang, Luo Luo, Cong Fang

Low-Rank Optimal Transport through Factor Relaxation with Latent Coupling

#5702 · Peter Halmos, Xinhao Liu, Julian Gold, Benjamin Raphael

Pretrained Optimization Model for Zero-Shot Black Box Optimization

#5703 · Xiaobin Li, Kai Wu, yujian li, Xiaoyu Zhang, Handing Wang, Jing Liu

Geometry-aware training of factorized layers in tensor Tucker format

#5704 · Emanuele Zangrando, Steffen Schotthöfer, Gianluca Ceruti, Jonas Kusch, Francesco Tudisco

Learning Generalized Linear Programming Value Functions

#5705 · Tu Anh-Nguyen, Joey Huchette, Christian Tjandraatmadja

Stochastic Newton Proximal Extragradient Method

#5706 · Ruichen Jiang, Michal Derezinski, Aryan Mokhtari

Adaptive and Optimal Second-order Optimistic Methods for Minimax Optimization

#5707 · Ruichen Jiang, Ali Kavis, Qiujiang Jin, Sujay Sanghavi, Aryan Mokhtari

LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning

#5708 · Rui Pan, Xiang Liu, SHIZHE DIAO, Renjie Pi, Jipeng Zhang, Chi Han, Tong Zhang

SCAFFLSA: Taming Heterogeneity in Federated Linear Stochastic Approximation and TD Learning

#5709 · Paul Mangold, Sergey Samsonov, Safwan Labbi, Ilya Levin, REDA ALAMI, Alexey Naumov, Eric Moulines

Emergence of heavy tails in homogenized stochastic gradient descent

#5710 · Zhezhe Jiao, Martin Keller-Ressel

The Iterative Optimal Brain Surgeon: Faster Sparse Recovery by Leveraging Second-Order Information

#5800 · Diyuan Wu, Ionut-Vlad Modoranu, Mher Safaryan, Denis Kuznedelev, Dan Alistarh

TorchOpt: An Efficient Library for Differentiable Optimization

#5801 · Jie Ren, Xidong Feng, Bo Liu, Xuehai Pan, Yao Fu, Luo Mai, Yaodong Yang

First-Order Methods for Linearly Constrained Bilevel Optimization

#5802 · Guy Kornowski, Swati Padmanabhan, Kai Wang, Zhe Zhang, Suvrit Sra

Non-asymptotic Global Convergence Analysis of BFGS with the Armijo-Wolfe Line Search

#5803 · Qiujiang Jin, Ruichen Jiang, Aryan Mokhtari

ALPS: Improved Optimization for Highly Sparse One-Shot Pruning for Large Language Models

#5804 · Xiang Meng, Kayhan Behdin, Haoyue Wang, Rahul Mazumder

Slack-Free Spiking Neural Network Formulation for Hypergraph Minimum Vertex Cover

#5805 · Tam Nguyen, Anh-Dzung Doan, zhipeng cai, Tat-Jun Chin

Practical $0.385$-Approximation for Submodular Maximization Subject to a Cardinality Constraint

#5806 · Morad Tukan, Loay Mualem, Moran Feldman

Byzantine Robustness and Partial Participation Can Be Achieved at Once: Just Clip Gradient Differences

#5807 · Grigory Malinovsky, Peter Richtarik, Samuel Horváth, Eduard Gorbunov

Lower Bounds and Optimal Algorithms for Non-Smooth Convex Decentralized Optimization over Time-Varying Networks

#5808 · Dmitry Kovalev, Ekaterina Borodich, Alexander Gasnikov, Dmitrii Feoktistov

On the Optimal Time Complexities in Decentralized Stochastic Asynchronous Optimization

#5809 · Alexander Tyurin, Peter Richtarik

Hierarchical Federated Learning with Multi-Timescale Gradient Correction

#5810 · Wenzhi Fang, Dong-Jun Han, Evan Chen, Shiqiang Wang, Christopher Brinton

Auditing Privacy Mechanisms via Label Inference Attacks

#5900 · Róbert Busa-Fekete, Travis Dick, Claudio Gentile, Andres Munoz Medina, Adam Smith, Marika Swanberg

Federated Behavioural Planes: Explaining the Evolution of Client Behaviour in Federated Learning

#5901 · Dario Fenoglio, Gabriele Dominici, Pietro Barbiero, Alberto Tonda, Martin Gjoreski, Marc Langheinrich

Instance-Specific Asymmetric Sensitivity in Differential Privacy

#5902 · David Durfee

Drago: Primal-Dual Coupled Variance Reduction for Faster Distributionally Robust Optimization

#5903 · Ronak Mehta, Jelena Diakonikolas, Zaid Harchaoui

Lookback Prophet Inequalities

#5904 · Ziyad Benomar, Dorian Baudry, Vianney Perchet

Adaptive Variance Reduction for Stochastic Optimization under Weaker Assumptions

#5905 · Wei Jiang, Sifan Yang, Yibo Wang, Lijun Zhang

Non-geodesically-convex optimization in the Wasserstein space

#5906 · Hoang Phuc Hau Luu, Hanlin Yu, Bernardo Williams, Petrus Mikkola, Marcelo Hartmann, Kai Puolamäki, Arto Klami

DistrictNet: Decision-aware learning for geographical districting

#5907 · Cheikh Ahmed, Alexandre Forel, Axel Parmentier, Thibaut Vidal

Performative Control for Linear Dynamical Systems

#5908 · Songfu Cai, Fei Han, Xuanyu Cao

HyperPrism: An Adaptive Non-linear Aggregation Framework for Distributed Machine Learning over Non-IID Data and Time-varying Communication Links

#5909 · Haizhou Du, Yijian Chen, Ryan Yang, Yuchen Li, Linghe Kong

Communication Efficient Distributed Training with Distributed Lion

#5910 · Bo Liu, Lemeng Wu, Lizhang Chen, Kaizhao Liang, Jiaxu Zhu, Chen Liang, Raghuraman Krishnamoorthi, Qiang Liu

Weight for Robustness: A Comprehensive Approach towards Optimal Fault-Tolerant Asynchronous ML

#5911 · Tehila Dahan, Kfir Y. Levy

The Limits of Differential Privacy in Online Learning

#6000 · Bo Li, Wei Wang, Peng Ye

HuRef: HUman-REadable Fingerprint for Large Language Models

#6001 · Boyi Zeng, Lizheng Wang, Yuncong Hu, Yi Xu, Chenghu Zhou, Xinbing Wang, Yu Yu, Zhouhan Lin

Differentially Private Reinforcement Learning with Self-Play

#6002 · Dan Qiao, Yu-Xiang Wang

Differentially Private Graph Diffusion with Applications in Personalized PageRanks

#6003 · Rongzhe Wei, Eli Chien, Pan Li

Faster Algorithms for User-Level Private Stochastic Convex Optimization

#6004 · Andrew Lowy, Daogao Liu, Hilal Asi

Dimension-free Private Mean Estimation for Anisotropic Distributions

#6005 · Yuval Dagan, Michael Jordan, Xuelin Yang, Lydia Zakynthinou, Nikita Zhivotovskiy

OASIS: Conditional Distribution Shaping for Offline Safe Reinforcement Learning

#6006 · Yihang Yao, Zhepeng Cen, Wenhao Ding, Haohong Lin, Shiqi Liu, Tingnan Zhang, Wenhao Yu, DING ZHAO

Learning Versatile Skills with Curriculum Masking

#6007 · Yao Tang, Zhihui Xie, Zichuan Lin, Deheng Ye, Shuai Li

Zero-Shot Reinforcement Learning from Low Quality Data

#6008 · Scott Jeen, Tom Bewley, Jonathan Cullen

Simplifying Latent Dynamics with Softly State-Invariant World Models

#6009 · Tankred Saanum, Peter Dayan, Eric Schulz

AlphaMath Almost Zero: Process Supervision without Process

#6010 · Guoxin Chen, Minpeng Liao, Chengxi Li, Kai Fan

Adversarial Environment Design via Regret-Guided Diffusion Models

#6011 · Hojun Chung, Junseo Lee, Minsoo Kim, Dohyeong Kim, Songhwai Oh

Solving Minimum-Cost Reach Avoid using Reinforcement Learning

#6012 · Oswin So, Cheng Ge, Chuchu Fan

Multi-Agent Imitation Learning: Value is Easy, Regret is Hard

#6101 · Jingwu Tang, Gokul Swamy, Fei Fang, Steven Wu

Coevolving with the Other You: Fine-Tuning LLM with Sequential Cooperative Multi-Agent Reinforcement Learning

#6102 · Hao Ma, Tianyi Hu, Zhiqiang Pu, Liu Boyin, Xiaolin Ai, Yanyan Liang, Min Chen

Boosting Sample Efficiency and Generalization in Multi-agent Reinforcement Learning via Equivariance

#6103 · Josh McClellan, Naveed Haghani, John Winder, Furong Huang, Pratap Tokekar

Value-Based Deep Multi-Agent Reinforcement Learning with Dynamic Sparse Training

#6104 · Pihe Hu, Shaolong Li, Zhuoran Li, Ling Pan, Longbo Huang

Feint Behaviors and Strategies: Formalization, Implementation and Evaluation

#6105 · Junyu Liu, Xiangjun Peng

The Dormant Neuron Phenomenon in Multi-Agent Reinforcement Learning Value Factorization

#6106 · Haoyuan Qin, Chennan Ma, Deng, Zhengzhu Liu, Songzhu Mei, Xinwang Liu, Cheng Wang, Siqi Shen

Aligning Individual and Collective Objectives in Multi-Agent Cooperation

#6107 · Yang Li, Wenhao Zhang, Jianhong Wang, Shao Zhang, Yali Du, Ying Wen, Wei Pan

AdaSociety: An Adaptive Environment with Social Structures for Multi-Agent Decision-Making

#6108 · Yizhe Huang, Xingbo Wang, Hao Liu, Fanqi Kong, Aoyang Qin, Min Tang, Xiaoxi Wang, Song-Chun Zhu, Mingjie Bi, Siyuan Qi, Xue Feng

Near-Optimal Dynamic Regret for Adversarial Linear Mixture MDPs

#6109 · Long-Fei Li, Peng Zhao, Zhi-Hua Zhou

GenRL: Multimodal-foundation world models for generalization in embodied agents

#6110 · Pietro Mazzaglia, Tim Verbelen, Bart Dhoedt, Aaron Courville, Sai Rajeswar Mudumba

What type of inference is planning?

#6200 · Miguel Lazaro-Gredilla, Li Ku, Kevin Murphy, Dileep George

Goal Reduction with Loop-Removal Accelerates RL and Models Human Brain Activity in Goal-Directed Learning

#6201 · Huzi Cheng, Joshua Brown

Identifying Latent State-Transition Processes for Individualized Reinforcement Learning

#6202 · Yuewen Sun, Biwei Huang, Yu Yao, Donghuo Zeng, Xinshuai Dong, Songyao Jin, Boyang Sun, Roberto Legaspi, Kazushi Ikeda, Peter Spirtes, Kun Zhang

Variational Delayed Policy Optimization

#6204 · Qingyuan Wu, Simon Zhan, Yixuan Wang, Yuhui Wang, Chung-Wei Lin, Chen Lv, Qi Zhu, Chao Huang

On the Role of Information Structure in Reinforcement Learning for Partially-Observable Sequential Teams and Games

#6205 · Awni Altabaa, Zhuoran Yang

Incremental Learning of Retrievable Skills For Efficient Continual Task Adaptation

#6206 · Daehee Lee, Minjong Yoo, Woo Kyung Kim, Wonje Choi, Honguk Woo

REBEL: Reinforcement Learning via Regressing Relative Rewards

#6207 · Zhaolin Gao, Jonathan Chang, Wenhao Zhan, Owen Oertell, Gokul Swamy, Kianté Brantley, Thorsten Joachims, Drew Bagnell, Jason Lee, Wen Sun

Nonparametric Regression for 3D Point Cloud Learning

#6208 · Xinyi Li, Shan Yu, Yueying Wang, Guannan Wang, Li Wang, Ming-Jun Lai

Conformal Classification with Equalized Coverage for Adaptively Selected Groups

#6209 · Yanfei Zhou, Matteo Sesia

Verifiably Robust Conformal Prediction

#6210 · Linus Jeary, Tom Kuipers, Mehran Hosseini, Nicola Paoletti

Carrot and Stick: Eliciting Comparison Data and Beyond

#6300 · Yiling Chen, Shi Feng, Fang-Yi Yu

Learning the Expected Core of Strictly Convex Stochastic Cooperative Games

#6301 · Phuong Nam Tran, The Anh Ta, shuqing shi, Debmalya Mandal, Yali Du, Long Tran-Thanh

Bayesian Strategic Classification

#6302 · Lee Cohen, Saeed Sharifi-Malvajerdi, Kevin Stangl, Ali Vakilian, Juba Ziani

Convergence of No-Swap-Regret Dynamics in Self-Play

#6303 · Renato Leme, Georgios Piliouras, Jon Schneider

Computational Aspects of Bayesian Persuasion under Approximate Best Response

#6304 · Kunhe Yang, Hanrui Zhang

LaSCal: Label-Shift Calibration without target labels

#6305 · Teodora Popordanoska, Gorjan Radevski, Tinne Tuytelaars, Matthew Blaschko

LFME: A Simple Framework for Learning from Multiple Experts in Domain Generalization

#6306 · Liang Chen, Yong Zhang, Yibing Song, Zhiqiang Shen, Lingqiao Liu

DapperFL: Domain Adaptive Federated Learning with Model Fusion Pruning for Edge Devices

#6307 · Yongzhe Jia, Xuyun Zhang, Hongsheng Hu, Kim-Kwang Raymond Choo, Lianyong Qi, Xiaolong Xu, Amin Beheshti, Wanchun Dou

Generalized Tensor Decomposition for Understanding Multi-Output Regression under Combinatorial Shifts

#6308 · Andong Wang, Yuning Qiu, Mingyuan Bai, Zhong Jin, Guoxu Zhou, Qibin Zhao

Using Surrogates in Covariate-adjusted Response-adaptive Randomization Experiments with Delayed Outcomes

#6309 · Lei Shi, Waverly Wei, Jingshen Wang

Attention boosted Individualized Regression

#6310 · Guang Yang, Yuan Cao, Long Feng

Learning to Mitigate Externalities: the Coase Theorem with Hindsight Rationality

#6400 · Antoine Scheid, Aymeric Capitaine, Etienne Boursier, Eric Moulines, Michael Jordan, Alain Durmus

Symmetries in Overparametrized Neural Networks: A Mean Field View

#6401 · Javier Maass, Joaquin Fontbona

Learning General Parameterized Policies for Infinite Horizon Average Reward Constrained MDPs via Primal-Dual Policy Gradient Algorithm

#6402 · Qinbo Bai, Washim Mondal, Vaneet Aggarwal

Randomized Exploration for Reinforcement Learning with Multinomial Logistic Function Approximation

#6403 · Wooseong Cho, Taehyun Hwang, Joongkyu Lee, Min-hwan Oh

Offline Oracle-Efficient Learning for Contextual MDPs via Layerwise Exploration-Exploitation Tradeoff

#6404 · Jian Qian, Haichen Hu, David Simchi-Levi

Truncated Variance Reduced Value Iteration

#6405 · Yujia Jin, Ishani Karmarkar, Aaron Sidford, Jiayi Wang

Preference-based Pure Exploration

#6406 · Apurv Shukla, Debabrota Basu

Thompson Sampling For Combinatorial Bandits: Polynomial Regret and Mismatched Sampling Paradox

#6407 · Raymond Zhang, Richard Combes

Online Control in Population Dynamics

#6408 · Noah Golowich, Elad Hazan, Zhou Lu, Dhruv Rohatgi, Y. Jennifer Sun

Hybrid Reinforcement Learning Breaks Sample Size Barriers In Linear MDPs

#6409 · Kevin Tan, Wei Fan, Yuting Wei

Towards the Transferability of Rewards Recovered via Regularized Inverse Reinforcement Learning

#6410 · Andreas Schlaginhaufen, Maryam Kamgarpour

DenseFusion-1M: Merging Vision Experts for Comprehensive Multimodal Perception

#6500 · Xiaotong Li, Fan Zhang, Haiwen Diao, Yueze Wang, Xinlong Wang, LINGYU DUAN

There is No Silver Bullet: Benchmarking Methods in Predictive Combinatorial Optimization

#6501 · Haoyu Geng, Hang Ruan, Runzhong Wang, Yang Li, YANG WANG, Lei Chen, Junchi Yan

STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases

#6502 · Shirley Wu, Shiyu Zhao, Michihiro Yasunaga, Kexin Huang, Kaidi Cao, Qian Huang, Vassilis Ioannidis, Karthik Subbian, James Zou, Jure Leskovec

A Novel Benchmark for Decision-Making in Uncertain and Competitive Games

#6503 · Kefan Su, Yusen Huo, ZHILIN ZHANG, Shuai Dou, Chuan Yu, Jian Xu, Zongqing Lu, Bo Zheng

NeuralPlane: An Efficiently Parallelizable Platform for Fixed-wing Aircraft Control with Reinforcement Learning

#6504 · Chuanyi Xue, Qihan Liu, Xiaoteng Ma, Xinyao Qin, Gui Ning, Yang Qi, Jinsheng Ren, Bin Liang, Jun Yang

CleanDiffuser: An Easy-to-use Modularized Library for Diffusion Models in Decision Making

#6505 · Zibin Dong, Yifu Yuan, Jianye Hao, Fei Ni, Yi Ma, Pengyi Li, YAN ZHENG

MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions

#6506 · Xuan Ju, Yiming Gao, Zhaoyang Zhang, Ziyang Yuan, Xintao Wang, AILING ZENG, Yu Xiong, Qiang Xu, Ying Shan

Pretrained Transformer Efficiently Learns Low-Dimensional Target Functions In-Context

#6507 · Kazusato Oko, Yujin Song, Taiji Suzuki, Denny Wu

Axioms for AI Alignment from Human Feedback

#6508 · Luise Ge, Daniel Halpern, Evi Micha, Ariel Procaccia, Itai Shapira, Yevgeniy Vorobeychik, Junlin Wu

Dissecting the Interplay of Attention Paths in a Statistical Mechanics Theory of Transformers

#6509 · Lorenzo Tiberi, Francesca Mignacco, Kazuki Irie, Haim Sompolinsky

Variance estimation in compound decision theory under boundedness

#6510 · Subhodh Kotekal

ProbTS: Benchmarking Point and Distributional Forecasting across Diverse Prediction Horizons

#6600 · Jiawen Zhang, Xumeng Wen, Zhenwei Zhang, Shun Zheng, Jia Li, Jiang Bian

CompBench: A Comparative Reasoning Benchmark for Multimodal LLMs

#6601 · Jihyung Kil, Zheda Mai, Justin Lee, Zihe Wang, Kerrie Cheng, Lemeng Wang, Ye Liu, Arpita Chowdhury, Wei-Lun (Harry) Chao

$E^3$: Exploring Embodied Emotion Through A Large-Scale Egocentric Video Dataset

#6602 · wang lin, Yueying Feng, WenKang Han, Tao Jin, Zhou Zhao, Fei Wu, Chang Yao, Jingyuan Chen

Mimicking To Dominate: Imitation Learning Strategies for Success in Multiagent Games

#6603 · The Viet Bui, Tien Mai, Thanh Nguyen

When to Sense and Control? A Time-adaptive Approach for Continuous-Time RL

#6604 · Lenart Treven, Bhavya, Yarden As, Florian Dorfler, Andreas Krause

Can LLMs Learn by Teaching for Better Reasoning? A Preliminary Study

#6605 · Xuefei Ning, Zifu Wang, Shiyao Li, Zinan Lin, Peiran Yao, Tianyu Fu, Matthew Blaschko, Guohao Dai, Huazhong Yang, Yu Wang

Understanding the Expressive Power and Mechanisms of Transformer for Sequence Modeling

#6606 · Mingze Wang, Weinan E

BAdam: A Memory Efficient Full Parameter Optimization Method for Large Language Models

#6607 · Qijun Luo, Hengxu Yu, Xiao Li

A Global Depth-Range-Free Multi-View Stereo Transformer Network with Pose Embedding

#6608 · Yitong Dong, Yijin Li, Zhaoyang Huang, Weikang Bian, Jingbo Liu, Hujun Bao, Zhaopeng Cui, Hongsheng Li, Guofeng Zhang

ETO:Efficient Transformer-based Local Feature Matching by Organizing Multiple Homography Hypotheses

#6609 · Junjie Ni, Guofeng Zhang, Guanglin Li, Yijin Li, Xinyang Liu, Zhaoyang Huang, Hujun Bao

FlexSBDD: Structure-Based Drug Design with Flexible Protein Modeling

#6610 · ZAIXI ZHANG, Mengdi Wang, Qi Liu

TOPA: Extending Large Language Models for Video Understanding via Text-Only Pre-Alignment

#6611 · Wei Li, Hehe Fan, Yongkang Wong, Mohan Kankanhalli, Yi Yang

Provably and Practically Efficient Adversarial Imitation Learning with General Function Approximation

#6612 · Tian Xu, Zhilong Zhang, Ruishuo Chen, Yihao Sun, Yang Yu

OTTER: Effortless Label Distribution Adaptation of Zero-shot Models

#6700 · Changho Shin, Jitian Zhao, Sonia Cromp, Harit Vishwakarma, Frederic Sala

Decomposable Transformer Point Processes

#6701 · Aristeidis Panos

Enhancing LLM Reasoning via Vision-Augmented Prompting

#6702 · Ziyang Xiao, Dongxiang Zhang, Xiongwei Han, Xiaojin Fu, Wing Yin YU, Tao Zhong, Sai Wu, Yuan Wang, Jianwei Yin, Gang Chen

From Text to Trajectory: Exploring Complex Constraint Representation and Decomposition in Safe Reinforcement Learning

#6703 · Pusen Dong, Tianchen Zhu, yue qiu, Haoyi Zhou, Jianxin Li

Injecting Undetectable Backdoors in Obfuscated Neural Networks and Language Models

#6704 · Alkis Kalavasis, Amin Karbasi, Argyris Oikonomou, Katerina Sotiraki, Grigoris Velegkas, Manolis Zampetakis

SG-Nav: Online 3D Scene Graph Prompting for LLM-based Zero-shot Object Navigation

#6705 · Hang Yin, Xiuwei Xu, Zhenyu Wu, Jie Zhou, Jiwen Lu

CoLoR-Filter: Conditional Loss Reduction Filtering for Targeted Language Model Pre-training

#6706 · David Brandfonbrener, Hanlin Zhang, Andreas Kirsch, Jonathan Richard Schwarz, Sham Kakade

On the Parameter Identifiability of Partially Observed Linear Causal Models

#6707 · Xinshuai Dong, Ignavier Ng, Biwei Huang, Yuewen Sun, Songyao Jin, Roberto Legaspi, Peter Spirtes, Kun Zhang

Out-Of-Distribution Detection with Diversification (Provably)

#6708 · Haiyun Yao, Zongbo Han, Huazhu Fu, Xi Peng, Qinghua Hu, Changqing Zhang

RL on Incorrect Synthetic Data Scales the Efficiency of LLM Math Reasoning by Eight-Fold

#6709 · Amrith Setlur, Saurabh Garg, Xinyang Geng, Naman Garg, Virginia Smith, Aviral Kumar

MSPE: Multi-Scale Patch Embedding Prompts Vision Transformers to Any Resolution

#6710 · Wenzhuo Liu, Fei Zhu, Shijie Ma, Cheng-lin Liu

Ensemble sampling for linear bandits: small ensembles suffice

#6800 · David Janz, Alexander Litvak, Csaba Szepesvari

Interfacing Foundation Models' Embeddings

#6801 · Xueyan Zou, Linjie Li, Jianfeng Wang, Jianwei Yang, Mingyu Ding, Junyi Wei, Zhengyuan Yang, Feng Li, Hao Zhang, Shilong Liu, Arul Aravinthan, Yong Jae Lee, Lijuan Wang

Meta-DT: Offline Meta-RL as Conditional Sequence Modeling with World Model Disentanglement

#6802 · Zhi Wang, Li Zhang, Wenhao Wu, Yuanheng Zhu, Dongbin Zhao, Chunlin Chen

Connectivity-Driven Pseudo-Labeling Makes Stronger Cross-Domain Segmenters

#6803 · Dong Zhao, Qi Zang, Shuang Wang, Nicu Sebe, Zhun Zhong

PageRank Bandits for Link Prediction

#6804 · Yikun Ban, Jiaru Zou, Zihao Li, Yunzhe Qi, Dongqi Fu, Jian Kang, Hanghang Tong, Jingrui He

Efficient Reinforcement Learning by Discovering Neural Pathways

#6805 · Samin Yeasar Arnob, Riyasat Ohib, Sergey Plis, Amy Zhang, Alessandro Sordoni, Doina Precup

ALPINE: Unveiling The Planning Capability of Autoregressive Learning in Language Models

#6806 · Siwei Wang, Yifei Shen, Shi Feng, Haoran Sun, Shang-Hua Teng, Wei Chen

Gliding over the Pareto Front with Uniform Designs

#6807 · Xiaoyuan Zhang, Genghui Li, Xi Lin, Yichi Zhang, Yifan Chen, Qingfu Zhang

Gradient Rewiring for Editable Graph Neural Network Training

#6808 · Zhimeng Jiang, Zirui Liu, Xiaotian Han, Qizhang Feng, Hongye Jin, Qiaoyu Tan, Kaixiong Zhou, Na Zou, Xia Hu

Neural Flow Diffusion Models: Learnable Forward Process for Improved Diffusion Modelling

#6809 · Grigory Bartosh, Dmitry Vetrov, Christian Andersson Naesseth

DeTrack: In-model Latent Denoising Learning for Visual Object Tracking

#6810 · Xinyu Zhou, Jinglun Li, Lingyi Hong, Kaixun Jiang, Pinxue Guo, Weifeng Ge, Wenqiang Zhang

An Analysis of Tokenization: Transformers under Markov Data

#6900 · Nived Rajaraman, Jiantao Jiao, Kannan Ramchandran

Data Free Backdoor Attacks

#6901 · Bochuan Cao, Jinyuan Jia, Chuxuan Hu, Wenbo Guo, Zhen Xiang, Jinghui Chen, Bo Li, Dawn Song

Shuffling Gradient-Based Methods for Nonconvex-Concave Minimax Optimization

#6902 · Quoc Tran Dinh, Trang H. Tran, Lam Nguyen

QUEST: Quadruple Multimodal Contrastive Learning with Constraints and Self-Penalization

#6903 · Qi Song, Tianxiang Gong, Shiqi Gao, Haoyi Zhou, Jianxin Li

Parameter Competition Balancing for Model Merging

#6904 · Guodong DU, Junlin Lee, Jing Li, Runhua Jiang, Yifei Guo, Shuyang Yu, Hanting Liu, Sim Kuan Goh, Ho-Kin Tang, Daojing He, Min Zhang

Acceleration Exists! Optimization Problems When Oracle Can Only Compare Objective Function Values

#6905 · Aleksandr Lobanov, Alexander Gasnikov, Andrey Krasnov

A Bayesian Approach for Personalized Federated Learning in Heterogeneous Settings

#6906 · Disha Makhija, Joydeep Ghosh, Nhat Ho

On the Target-kernel Alignment: a Unified Analysis with Kernel Complexity

#6907 · Chao Wang, Xin HE, Yuwen Wang, Junhui Wang

KptLLM: Unveiling the Power of Large Language Model for Keypoint Comprehension

#6908 · Jie Yang, Wang ZENG, Sheng Jin, Lumin Xu, Wentao Liu, Chen Qian, Ruimao Zhang

MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes

#6909 · Zhenhui Ye, Tianyun Zhong, Yi Ren, Ziyue Jiang, Jiawei Huang, Rongjie Huang, Jinglin Liu, Jinzheng He, Chen Zhang, Zehan Wang, Xize Cheng, Xiang Yin, Zhou Zhao

Unlock the Intermittent Control Ability of Model Free Reinforcement Learning

#6910 · Jiashun Liu, Jianye Hao, Xiaotian Hao, Yi Ma, YAN ZHENG, Yujing Hu, Tangjie Lv

Bridging Model-Based Optimization and Generative Modeling via Conservative Fine-Tuning of Diffusion Models

#7000 · Masatoshi Uehara, Yulai Zhao, Ehsan Hajiramezanali, Gabriele Scalia, Gokcen Eraslan, Avantika Lal, Sergey Levine, Tommaso Biancalani

Neural Gaffer: Relighting Any Object via Diffusion

#7001 · Haian Jin, Yuan Li, Fujun Luan, Yuanbo Xiangli, Sai Bi, Kai Zhang, Zexiang Xu, Jin Sun, Noah Snavely

Cooperative Hardware-Prompt Learning for Snapshot Compressive Imaging

#7002 · JIAMIAN WANG, Zongliang Wu, Yulun Zhang, Xin Yuan, Tao Lin, Zhiqiang Tao