1 216 14

Chan Kim

chanmuzi

chanmuzi

AI & ML interests

None yet

Recent Activity

upvoted a paper about 16 hours ago

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

upvoted a paper 3 days ago

Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity

upvoted a paper 5 days ago

Large Language Diffusion Models

View all activity

Organizations

chanmuzi's activity

upvoted a paper about 16 hours ago

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 3 days ago • 150

upvoted a paper 3 days ago

Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity

Paper • 2502.13063 • Published 5 days ago • 60

upvoted a paper 5 days ago

Large Language Diffusion Models

Paper • 2502.09992 • Published 10 days ago • 75

updated a Space 9 days ago

First Agent Template

⚡

Search for information or check the time

upvoted a paper 10 days ago

Distillation Scaling Laws

Paper • 2502.08606 • Published 11 days ago • 43

upvoted a paper 11 days ago

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Paper • 2502.06394 • Published 13 days ago • 85

upvoted a paper 15 days ago

SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

Paper • 2502.02737 • Published 19 days ago • 190

upvoted an article 17 days ago

Article

Open-source DeepResearch – Freeing our search agents

20 days ago

• 1.08k

upvoted a paper 18 days ago

Preference Leakage: A Contamination Problem in LLM-as-a-judge

Paper • 2502.01534 • Published 20 days ago • 37

upvoted a paper 22 days ago

Large Language Models Think Too Fast To Explore Effectively

Paper • 2501.18009 • Published 25 days ago • 23

upvoted a paper 25 days ago

Optimizing Large Language Model Training Using FP4 Quantization

Paper • 2501.17116 • Published 26 days ago • 35

upvoted an article 28 days ago

Article

SmolVLM Grows Smaller – Introducing the 250M & 500M Models!

Jan 23

• 142

upvoted 2 papers about 1 month ago

Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps

Paper • 2501.09732 • Published Jan 16 • 69

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 273

liked a Space about 1 month ago

524

Open Ko-LLM Leaderboard

📉

Explore and filter language model benchmark results

upvoted a paper about 1 month ago

Entropy-Guided Attention for Private LLMs

Paper • 2501.03489 • Published Jan 7 • 14

upvoted 4 papers about 2 months ago

Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models

Paper • 2501.01830 • Published Jan 3 • 18

MLLM-as-a-Judge for Image Safety without Human Labeling

Paper • 2501.00192 • Published Dec 31, 2024 • 25

Xmodel-2 Technical Report

Paper • 2412.19638 • Published Dec 27, 2024 • 26

Explanatory Instructions: Towards Unified Vision Tasks Understanding and Zero-shot Generalization

Paper • 2412.18525 • Published Dec 24, 2024 • 75