Multi-modal LLMs - NeurIPS 2025

today local_bar

Multi-modal LLMs

3 papers across 2 sessions

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

SAVVY: Spatial Awareness via Audio-Visual LLMs through Seeing and Hearing

#5014 · Mingfei Chen, Zijun Cui, Xiulong Liu, Jinlin Xiang, Yang Zheng, Jingyuan Li, Eli Shlizerman

A novel 3D audio-visual QA benchmark and training-free spatial reasoning pipeline for Audio-Visual LLMs

SafePTR: Token-Level Jailbreak Defense in Multimodal LLMs via Prune-then-Restore Mechanism

#5410 · Beitao Chen, Xinyu Lyu, Shengming Yuan, Jingkuan Song, Hengtao Shen, Lianli Gao

Poster Session 2

Wednesday, December 3, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Generative RLHF-V: Learning Principles from Multi-modal Human Preference

#5308 · Jiayi Zhou, Jiaming Ji, Boyuan Chen, Jiapeng Sun, wenqi chen, Donghai Hong, Sirui Han, Yike Guo, Yaodong Yang

A novel alignment framework that integrates generative reward models with multi-modal RLHF.