Yuan Pu's picture

2 3

Yuan Pu

puyuan1996

·

AI & ML interests

None yet

Recent Activity

updated a dataset 3 days ago

puyuan1996/unizero_mt_moco_dmc8_concat_task_embed_nlayer8_20250221

updated a dataset 3 days ago

puyuan1996/unizero_mt_dmc18_concat_task_embed_nlayer8_20250221

updated a dataset 3 days ago

puyuan1996/unizero_mt_atari8_concat_task_embed_nlayer8_20250221

View all activity

Organizations

puyuan1996's activity

updated 3 datasets 3 days ago

puyuan1996/unizero_mt_moco_dmc8_concat_task_embed_nlayer8_20250221

Preview • Updated 3 days ago • 11

puyuan1996/unizero_mt_dmc18_concat_task_embed_nlayer8_20250221

Preview • Updated 3 days ago • 4

puyuan1996/unizero_mt_atari8_concat_task_embed_nlayer8_20250221

Preview • Updated 3 days ago • 6

published 3 datasets 3 days ago

puyuan1996/unizero_mt_moco_dmc8_concat_task_embed_nlayer8_20250221

Preview • Updated 3 days ago • 11

puyuan1996/unizero_mt_dmc18_concat_task_embed_nlayer8_20250221

Preview • Updated 3 days ago • 4

puyuan1996/unizero_mt_atari8_concat_task_embed_nlayer8_20250221

Preview • Updated 3 days ago • 6

upvoted an article 7 months ago

Article

Illustrating Reinforcement Learning from Human Feedback (RLHF)

Dec 9, 2022

• 169

liked a Space 11 months ago

ZeroPal

Ask LightZero questions, get detailed answers

updated a dataset 12 months ago

puyuan1996/pong_muzero_2episodes_gsl400_v0.0.4

Updated Mar 7, 2024 • 104

upvoted a paper about 1 year ago

LightZero: A Unified Benchmark for Monte Carlo Tree Search in General Sequential Decision Scenarios

Paper • 2310.08348 • Published Oct 12, 2023 • 4

liked 2 models over 1 year ago

mistralai/Mistral-7B-Instruct-v0.1

Text Generation • Updated Aug 22, 2024 • 199k • 1.58k

HansBug/genshin-nlp-finetuning

Updated Oct 26, 2023 • 1