Chelsea Finn

Researcher, Physical Intelligence

3 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 3

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

MJ-Video: Benchmarking and Rewarding Video Generation with Fine-Grained Video Preference

#4305 Spotlight · Haibo Tong, Zhaoyang Wang, Zhaorun Chen, Haonian Ji, Shi Qiu, Siwei Han, Kexin Geng, Zhongkai Xue, Yiyang Zhou, Peng Xia, Mingyu Ding, Rafael Rafailov, Chelsea Finn, Huaxiu Yao

We introduce MJ-Bench-Video, a large-scale video preference dataset for comprehensively evaluating the reward models of text-to-video generation as well as a MoE-based video reward model

MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?

#3501 · Zhaorun Chen, Zichen Wen, Yichao Du, Yiyang Zhou, Chenhang Cui, Siwei Han, Zhenzhen Weng, Chaoqi Wang, Zhengwei Tong, Leria HUANG, Canyu Chen, Haoqin Tu, Qinghao Ye, Zhihong Zhu, Yuqing Zhang, Jiawei Zhou, Zhuokai Zhao, Rafael Rafailov, Chelsea Finn, Huaxiu Yao

A novel benchmark using a comprehensive preference dataset to evaluate multimodal judges across multiple key perspectives

Poster Session 6

1 paper

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

SutureBot: A Precision Framework & Benchmark For Autonomous End-to-End Suturing

#2100 · Jesse Haworth, Juo-Tung Chen, Nigel Nelson, Ji Woong Kim, Masoud Moghani, Chelsea Finn, Axel Krieger

SutureBot: A benchmark and dataset for evaluating goal-conditioned VLAs on precision suturing.