today local_bar

Ting Sun

Researcher, Lionrock AI Lab

1 paper at NeurIPS 2025

OpenReview· Semantic Scholar· Google Scholar

Poster Session 4

Thursday, December 4, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

HyGen: Efficient LLM Serving via Elastic Online-Offline Request Co-location

#806 · Ting Sun, Penghan Wang, Fan Lai

Colocating online and offline LLM inference requests in the same inference engine.