Open to Collab

12 7 3

Junrulu

https://www.linkedin.com/in/junrulu/

LuJunru

AI & ML interests

None yet

Recent Activity

authored a paper about 17 hours ago

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

commented on a paper 2 days ago

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

upvoted a paper 2 days ago

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

View all activity

Organizations

Articles 2

Article

结合Deepseek代码探讨MLA的改进及收益

Article

models 7

Junrulu/Reproduced-tulu2-dpo-13b

Text Generation • 13B • Updated Oct 19, 2025 • 11 • 1

Junrulu/MemoChat-Vicuna-7B

Text Generation • 7B • Updated Jun 13, 2025 • 10 • 1

Junrulu/MemoChat-Vicuna-13B

Text Generation • 13B • Updated May 29, 2025 • 9

Junrulu/FIPO-IPL-IPO-Tulu2-70B

Text Generation • 69B • Updated Apr 28, 2025 • 10

Junrulu/MemoChat-Vicuna-33B

Text Generation • 33B • Updated Apr 27, 2025 • 11

Junrulu/Llama-3-8B-Instruct-Iterative-SamPO

Text Generation • 8B • Updated Jun 14, 2024 • 7 • 1

Junrulu/MemoChat-Fastchat-T5-3B

3B • Updated Mar 12, 2024 • 12

datasets 5

Junrulu/RoleMRC

Preview • Updated Mar 20, 2025 • 113 • 5

Junrulu/Reproduced-tulu2-test-sets

Preview • Updated Mar 25, 2024 • 18

Junrulu/MT-Bench-Plus

Viewer • Updated Mar 12, 2024 • 54 • 21 • 2

Junrulu/MemoChat_Instructions

Viewer • Updated Mar 12, 2024 • 10k • 23 • 1

Junrulu/Prompt_Preference_Dataset

Viewer • Updated Feb 19, 2024 • 30k • 201 • 1

Junrulu

AI & ML interests

Recent Activity

Organizations

Articles 2

结合Deepseek代码探讨MLA的改进及收益

大模型偏好优化技术：DPO及其变种

Collections 3

Junrulu/RoleMRC

RoleMRC: A Fine-Grained Composite Benchmark for Role-Playing and Instruction-Following

jiazhengli/Llama-3.1-8B-RoleMRC-sft

jiazhengli/Llama-3.1-8B-RoleMRC-dpo

jiazhengli/Pythia-2.8B-HH-RLHF-Iterative-SamPO

jiazhengli/Pythia-2.8B-TLDR-Iterative-SamPO

Junrulu/Llama-3-8B-Instruct-Iterative-SamPO

Eliminating Biased Length Reliance of Direct Preference Optimization via Down-Sampled KL Divergence

Junrulu/RoleMRC

RoleMRC: A Fine-Grained Composite Benchmark for Role-Playing and Instruction-Following

jiazhengli/Llama-3.1-8B-RoleMRC-sft

jiazhengli/Llama-3.1-8B-RoleMRC-dpo

jiazhengli/Pythia-2.8B-HH-RLHF-Iterative-SamPO

jiazhengli/Pythia-2.8B-TLDR-Iterative-SamPO

Junrulu/Llama-3-8B-Instruct-Iterative-SamPO

Eliminating Biased Length Reliance of Direct Preference Optimization via Down-Sampled KL Divergence

Papers 17

models 7

Junrulu/Reproduced-tulu2-dpo-13b

Junrulu/MemoChat-Vicuna-7B

Junrulu/MemoChat-Vicuna-13B

Junrulu/FIPO-IPL-IPO-Tulu2-70B

Junrulu/MemoChat-Vicuna-33B

Junrulu/Llama-3-8B-Instruct-Iterative-SamPO

Junrulu/MemoChat-Fastchat-T5-3B

datasets 5

Junrulu/RoleMRC

Junrulu/Reproduced-tulu2-test-sets

Junrulu/MT-Bench-Plus

Junrulu/MemoChat_Instructions

Junrulu/Prompt_Preference_Dataset

Junrulu

AI & ML interests

Recent Activity

Organizations

Articles 2

结合Deepseek代码探讨MLA的改进及收益

大模型偏好优化技术：DPO及其变种

Collections 3

Papers 17

models 7 Sort: Recently updated

datasets 5 Sort: Recently updated

🎉 Free Image Generator Now Available!

models 7

datasets 5