Carlos E Jimenez

Researcher, Anthropic

2 papers at NeurIPS 2025

Homepage· OpenReview· Semantic Scholar· Google Scholar

Poster Session 1

Wednesday, December 3, 2025 · 11:00 AM → 2:00 PM

SWE-smith: Scaling Data for Software Engineering Agents

#113 Spotlight · John Yang, Kilian Lieret, Carlos E Jimenez, Alexander Wettig, Kabir Khandpur, Yanzhe Zhang, Binyuan Hui, Ofir Press, Ludwig Schmidt, Diyi Yang

SWE-smith auto-generates large-scale software engineering tasks by breaking tests in Python repos, enabling a new open-source model that sets state-of-the-art results on SWE-bench.

Poster Session 3

1 paper

Thursday, December 4, 2025 · 11:00 AM → 2:00 PM

Exhibit Hall C,D,E

When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration

#1517 · Quan Shi, Carlos E Jimenez, Shunyu Yao, Nick Haber, Diyi Yang, Karthik R Narasimhan

We conduct a user study to evaluate how well language models help humans internalize their reasoning, revealing that strong model performance alone doesn't guarantee effective reasoning transfer.