5 26 121

Siyuan Wang

OldKingMeister

Wangmerlyn

AI & ML interests

ML system

Recent Activity

upvoted a paper 2 days ago

GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models

liked a model 2 days ago

deepseek-ai/DeepSeek-R1-Distill-Qwen-14B

upvoted a paper 7 days ago

Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing

View all activity

Organizations

Collections 2

Papers 1

arxiv:2502.20082

models 2

OldKingMeister/SPMM-Pretrained

Updated May 16 • 1

OldKingMeister/Qwen2.5-1.5B-Instruct-YaRN

Text Generation • 2B • Updated Apr 28 • 4.2k • 1

datasets 2

OldKingMeister/gsm8k-256

Viewer • Updated Jul 12 • 512 • 20

OldKingMeister/gsm8k-16

Viewer • Updated Jul 12 • 32 • 23

Siyuan Wang

AI & ML interests

Recent Activity

Organizations

Collections 2

Uni-SMART: Universal Science Multimodal Analysis and Research Transformer

LongRoPE2: Near-Lossless LLM Context Window Scaling

Uni-SMART: Universal Science Multimodal Analysis and Research Transformer

LongRoPE2: Near-Lossless LLM Context Window Scaling

Papers 1

models 2

OldKingMeister/SPMM-Pretrained

OldKingMeister/Qwen2.5-1.5B-Instruct-YaRN

datasets 2

OldKingMeister/gsm8k-256

OldKingMeister/gsm8k-16

Siyuan Wang

AI & ML interests

Recent Activity

Organizations

Collections 2

Papers 1

models 2 Sort: Recently updated

datasets 2 Sort: Recently updated

models 2

datasets 2