Post-Training Efficiency - NeurIPS 2025

today local_bar

Post-Training Efficiency

1 paper across 1 session

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Mozart: Modularized and Efficient MoE Training on 3.5D Wafer-Scale Chiplet Architectures

#811 Spotlight · Shuqing Luo, Ye Han, Pingzhi Li, Jiayin Qin, Jie Peng, Yang Zhao, Yu Cao, Tianlong Chen

We propose a framework for efficient MoE post-training on 3.5D Wafer-scale chiplets.