OCR - NeurIPS 2025

today local_bar

OCR

2 papers across 2 sessions

Poster Session 3

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Seeing is Believing? Mitigating OCR Hallucinations in Multimodal Large Language Models

#4813 · zhentao he, Can Zhang, Ziheng Wu, Zhenghao Chen, Yufei Zhan, Yifan Li, Zhao Zhang, XIAN WANG, Minghui Qiu

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios

#4610 · Yang Shi, Huanqian Wang, Xie, Huanyao Zhang, Lijie Zhao, yifan zhang, Xinfeng Li, Chaoyou Fu, Zhuoer Wen, Wenting Liu, Zhuoran Zhang, Xinlong Chen, Bohan Zeng, Sihan Yang, Yushuo Guan, Zhang Zhang, Liang Wang, Haoxuan Li, Zhouchen Lin, Yuanxing Zhang, Pengfei Wan, Haotian Wang, Wenjing Yang

A novel, bilingual, and comprehensive benchmark designed to assess MLLMs’ OCR-based capabilities in video scenarios.