Task Planning

2 papers across 1 session

Poster Session 5

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

VLA-OS: Structuring and Dissecting Planning Representations and Paradigms in Vision-Language-Action Models

#2213 · Chongkai Gao, Zixuan Liu, Zhenghao Chi, Junshan Huang, Xin Fei, Yiwen Hou, Yuxuan Zhang, Yudi Lin, Zhirui Fang, Lin Shao

A Planning Representation and Paradigm Investigation of Vision-Language-Action Models

PhyBlock: A Progressive Benchmark for Physical Understanding and Planning via 3D Block Assembly

#1504 · Liang Ma, Jiajun Wen, Min Lin, Rongtao Xu, Xiwen Liang, Bingqian Lin, Jun Ma, Yongxin Wang, Ziming Wei, haokun lin, Mingfei Han, Meng Cao, Bokui Chen, Ivan Laptev, Xiaodan Liang

We introduce PhyBlock, a progressive benchmark evaluating large vision-language models on physical understanding and spatial planning via robotic 3D block assembly tasks.