multi-task - NeurIPS 2025

today local_bar

multi-task

2 papers across 2 sessions

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

MMTU: A Massive Multi-Task Table Understanding and Reasoning Benchmark

#1804 · Junjie Xing, Yeye He, Mengyu Zhou, Haoyu Dong, Shi Han, Lingjiao Chen, Dongmei Zhang, Surajit Chaudhuri, H. V. Jagadish

We introduce a new comprehensive benchmark, MMTU, designed to evaluate models ability to understand, reason, and manipulate diverse tables.

Poster Session 3

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

LIFEBENCH: Evaluating Length Instruction Following in Large Language Models

#3502 · Wei Zhang, Zhenhong Zhou, Kun Wang, Junfeng Fang, Rongwu Xu, Yuanhe Zhang, Rui Wang, Ge Zhang, Xinfeng Li, Li Sun, Lingjuan Lyu, Yang Liu, Sen Su