Audio Reasoning - NeurIPS 2025

today local_bar

Audio Reasoning

3 papers across 3 sessions

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

AudSemThinker: Enhancing Audio-Language Models Through Reasoning over Semantics of Sound

#1906 · Gijs Wijngaard, Elia Formisano, Michele Esposito, Michel Dumontier

This paper introduces AudSemThinker, an audio-language model that reasons on the semantics of sound

Poster Session 3

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Mellow: a small audio language model for reasoning

#2008 · Soham Deshmukh, Satvik Dixit, Rita Singh, Bhiksha Raj

a small audio-language model for audio reasoning that achieves SoTA performance with 50 times fewer parameters and 60 times fewer audio hours.

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

MMAR: A Challenging Benchmark for Deep Reasoning in Speech, Audio, Music, and Their Mix

#1800 · Ziyang Ma, Yinghao Ma, Yanqiao Zhu, Chen Yang, Yi-Wen Chao, Ruiyang Xu, Wenxi Chen, Yuanzhe Chen, Zhuo Chen, Jian Cong, Kai Li, Keliang Li, Siyou Li, Xinfeng Li, Xiquan Li, Zheng Lian, Yuzhe Liang, Minghao Liu, Zhikang Niu, Tianrui Wang, Wang Yuping, Yuxuan Wang, Yihao Wu, Guanrou Yang, Jianwei Yu, Ruibin Yuan, Zhisheng Zheng, Ziya Zhou, Haina Zhu, Wei Xue, Emmanouil Benetos, Kai Yu, Eng-Siong Chng, Xie Chen

We introduce MMAR, a new benchmark designed to evaluate the deep reasoning capabilities of Audio-Language Models (ALMs) across massive multi-disciplinary tasks.