Data Science - NeurIPS 2025

today local_bar

Data Science

1 paper across 1 session

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

RADAR: Benchmarking Language Models on Imperfect Tabular Data

#2402 · Ken Gu, Zhihan Zhang, Kate Lin, Yuwei Zhang, Akshay Paruchuri, Hong Yu, Mehran Kazemi, Kumar Ayush, A. Ali Heydari, Max Xu, Yun Liu, Ming-Zher Poh, Yuzhe Yang, Mark Malhotra, Shwetak Patel, Hamid Palangi, Xuhai "Orson" Xu, Daniel McDuff, Tim Althoff, Xin Liu

A framework and benchmark to evaluate language models' reasoning on imperfect tabular data