today local_bar

Parand A. Alamdari

PhD student, University of Toronto

1 paper at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 6

Friday, December 5, 2025 · 4:30 PM → 7:30 PM

Exhibit Hall C,D,E

Ground-Compose-Reinforce: Grounding Language in Agentic Behaviours using Limited Data

#416 · Andrew C Li, Toryn Q. Klassen, Andrew Wang, Parand A. Alamdari, Sheila A. McIlraith

We train RL agents directly from high-level specifications, without reward functions or domain-specific oracles.