SimpleRL-Zoo: Investigating and Taming Zero Reinforcement Learning for Open Base Models in the Wild

Published in Preprint, 2025

We present SimpleRL-Zoo, a deep investigation of zero RL training across diverse model families and sizes.

Authors: Weihao Zeng, Yuzhen Huang, Qian Liu, Wei Liu, Keqing He, Zejun Ma, Junxian He

Recommended citation: Weihao Zeng*, Yuzhen Huang*, Qian Liu, Wei Liu, Keqing He, Zejun Ma, Junxian He. (2025). "SimpleRL-Zoo: Investigating and Taming Zero Reinforcement Learning for Open Base Models in the Wild." Preprint.
Download Paper

Share on

Bluesky Facebook LinkedIn Mastodon X (formerly Twitter)