University of Minnesota Twin Cities

🏛 University of Minnesota Twin Cities

4 papers across 2 sessions

Poster Session 1

1 paper

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

Mozart: Modularized and Efficient MoE Training on 3.5D Wafer-Scale Chiplet Architectures

#811 Spotlight · Shuqing Luo, Ye Han, Pingzhi Li, Jiayin Qin, Jie Peng, Yang Zhao, Yu Cao, Tianlong Chen

We propose a framework for efficient MoE post-training on 3.5D Wafer-scale chiplets.

Poster Session 5

3 papers

Friday, December 5, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

TRiCo: Triadic Game-Theoretic Co-Training for Robust Semi-Supervised Learning

#4900 · Hongyang He, Xinyuan Song, Yangfan He, Zeyu Zhang, Yanshu Li, Haochen You, Lifan Sun, Wenqiao Zhang

A novel semi-supervised learning paradigm that unifies view-wise co-training, meta-learned supervision, and adversarial perturbation through a structured triadic game.

Longer Context, Deeper Thinking: Uncovering the Role of Long-Context Ability in Reasoning

#4200 · Wang Yang, Zirui Liu, Hongye Jin, Qingyu Yin, Vipin Chaudhary, Xiaotian Han

uncovering the Role of Long-Context Ability in Reasoning Training

Breaking the Frozen Subspace: Importance Sampling for Low-Rank Optimization in LLM Pretraining

#902 · Haochen Zhang, Junze Yin, Guanchu Wang, Zirui Liu, Lin Yang, Tianyi Zhang, Anshumali Shrivastava, Vladimir Braverman

We introduce a new method for selecting subspaces in low-rank optimization for memory-efficient pretraining of large language models (LLMs).