Oria's picture

4 1

Oria

Ethan2222

AI & ML interests

None yet

Recent Activity

liked a dataset about 2 months ago

nvidia/Nemotron-Math-v2

upvoted a paper 4 months ago

Arbitrary Entropy Policy Optimization: Entropy Is Controllable in Reinforcement Fine-tuning

upvoted a paper 4 months ago

Agentic Entropy-Balanced Policy Optimization

View all activity

Organizations

None yet

upvoted 2 papers 4 months ago

Arbitrary Entropy Policy Optimization: Entropy Is Controllable in Reinforcement Fine-tuning

Paper • 2510.08141 • Published Oct 9, 2025 • 1

Agentic Entropy-Balanced Policy Optimization

Paper • 2510.14545 • Published Oct 16, 2025 • 106

upvoted 2 papers 8 months ago

Advancing Multimodal Reasoning via Reinforcement Learning with Cold Start

Paper • 2505.22334 • Published May 28, 2025 • 36

Unsupervised Post-Training for Multi-Modal LLM Reasoning via GRPO

Paper • 2505.22453 • Published May 28, 2025 • 46