Audio-visual processing

1 paper across 1 session

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

AVCD: Mitigating Hallucinations in Audio-Visual Large Language Models through Contrastive Decoding

#1907 · Chaeyoung Jung, Youngjoon Jang, Joon Son Chung

We introduce Audio-Visual Contrastive Decoding (AVCD), a training-free framework for mitigating hallucinations in AV-LLMs by reformulating the existing contrastive decoding framework to support trimodal interactions.