zhangzhenduo's picture

2

zhangzhenduo

ericzdzhang

·

AI & ML interests

None yet

Organizations

None yet

authored 4 papers 2 months ago

Every Sample Matters: Leveraging Mixture-of-Experts and High-Quality Data for Efficient and Accurate Code LLM

Paper • 2503.17793 • Published Mar 22, 2025 • 23

Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs

Paper • 2506.14731 • Published Jun 17, 2025 • 8

Towards High Data Efficiency in Reinforcement Learning with Verifiable Reward

Paper • 2509.01321 • Published Sep 1, 2025

Every Step Evolves: Scaling Reinforcement Learning for Trillion-Scale Thinking Model

Paper • 2510.18855 • Published Oct 21, 2025 • 71