Chuofan Ma

PhD student, University of Hong Kong

2 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 1

1 paper

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Vision Foundation Models as Effective Visual Tokenizers for Autoregressive Generation

#4303 · Anlin Zheng, Xin Wen, Xuanyang Zhang, Chuofan Ma, Tiancai Wang, Gang YU, Xiangyu Zhang, XIAOJUAN QI

This work utilizes vision foundation models to construct a visual tokenizer, which is trained in an end-to-end manner for AR image generation, achieving state-of-the-art results on the $256\times256$ class-to-image generation task on ImageNet.

Poster Session 3

1 paper

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

UniTok: a Unified Tokenizer for Visual Generation and Understanding

#4815 Spotlight · Chuofan Ma, Yi Jiang, Junfeng Wu, Jihan Yang, Xin Yu, Zehuan Yuan, BINGYUE PENG, XIAOJUAN QI

This paper introduces a unified visual tokenizer to facilitate unification of visual generation and understanding within a single autoregressive framework.