RL - a mapuna Collection

Models
Datasets
Spaces
Buckets new
Docs
Enterprise
免费去水印
Log In
Sign Up

mapuna 's Collections

RL

updated 29 days ago

Inverse Reinforcement Learning Meets Large Language Model Post-Training: Basics, Advances, and Opportunities

Paper • 2507.13158 • Published Jul 17, 2025 • 24
DataChef: Cooking Up Optimal Data Recipes for LLM Adaptation via Reinforcement Learning

Paper • 2602.11089 • Published Feb 11 • 18
Experiential Reinforcement Learning

Paper • 2602.13949 • Published Feb 15 • 71

Collection guide
Browse collections

Company

TOS Privacy About Careers

Website

Models Datasets 免费Z-image图片生成免费去水印 Vibevoice

🎉 Free Image Generator Now Available!

Totally Free + Zero Barriers + No Login Required