spatial audio generation

1 paper across 1 session

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

MRSAudio: A Large-Scale Multimodal Recorded Spatial Audio Dataset with Refined Annotations

#1913 · Wenxiang Guo, Changhao Pan, Zhiyuan Zhu, Xintong Hu, Yu Zhang, Li Tang, Rui Yang, Han Wang, Zongbao Zhang, Yuhan Wang, Yixuan Chen, Hankun Xu, Ke Xu, PengFei Fan, ZheTao Chen, Yanhao Yu, Qiange Huang, Fei Wu, Zhou Zhao

This paper presents MRSAudio, a large-scale multimodal recorded spatial audio dataset with refined annotations, designed for spatial audio generation and understanding tasks, along with its benchmarks.