·
AI & ML interests
Machine learning, RLHF
Organizations
weqweasdas/single_turn_minverval_tora_test
Viewer
• Updated
• 272 • 4
weqweasdas/kumar_minvervalsecond
Viewer
• Updated
• 272 • 4
weqweasdas/self_rewardingppo_minvervalsecond
Viewer
• Updated
• 272 • 5
weqweasdas/self_rewardingppo_minverval
Viewer
• Updated
• 272 • 4
weqweasdas/single_turn_minverval
Viewer
• Updated
• 272 • 4
weqweasdas/kmr_07_step120_one_turn
Viewer
• Updated
• 500 • 4
weqweasdas/ift_ppo_07_one_turn_conssitent_rm
Viewer
• Updated
• 500 • 4
weqweasdas/ift_ppo_07_one_turn
Viewer
• Updated
• 500 • 4
weqweasdas/kmr_07_step120
Viewer
• Updated
• 500 • 4
Viewer
• Updated
• 500 • 4
Viewer
• Updated
• 500 • 4
Viewer
• Updated
• 500 • 4
weqweasdas/ift_07_one_turn
Viewer
• Updated
• 500 • 4
Viewer
• Updated
• 500 • 4
Viewer
• Updated
• 500 • 4
Viewer
• Updated
• 500 • 4
Viewer
• Updated
• 500 • 4
Viewer
• Updated
• 40 • 4
Viewer
• Updated
• 272 • 116
Viewer
• Updated
• 675 • 112
Viewer
• Updated
• 30 • 108
Viewer
• Updated
• 500 • 122
Viewer
• Updated
• 10.7k • 4
Viewer
• Updated
• 29.2k • 4
Viewer
• Updated
• 30.6k • 4
Viewer
• Updated
• 7.5k • 5
Viewer
• Updated
• 5k • 7
Viewer
• Updated
• 1.32k • 4
weqweasdas/rs_gsm8k_train
Viewer
• Updated
• 7.47k • 6
Viewer
• Updated
• 5.18M • 8