Tang's picture

139

Tang

tommysally

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 12 hours ago

Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images

upvoted a paper about 12 hours ago

Multimodal RewardBench: Holistic Evaluation of Reward Models for Vision Language Models

upvoted a paper about 12 hours ago

LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention

View all activity

Organizations

None yet

tommysally's activity

upvoted 7 papers about 12 hours ago

Symmetrical Visual Contrastive Optimization: Aligning Vision-Language Models with Minimal Contrastive Images

Paper • 2502.13928 • Published 4 days ago • 2

Multimodal RewardBench: Holistic Evaluation of Reward Models for Vision Language Models

Paper • 2502.14191 • Published 4 days ago • 4

LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention

Paper • 2502.14866 • Published 3 days ago • 8

RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers

Paper • 2502.14377 • Published 3 days ago • 10

From RAG to Memory: Non-Parametric Continual Learning for Large Language Models

Paper • 2502.14802 • Published 3 days ago • 9

S^2R: Teaching LLMs to Self-verify and Self-correct via Reinforcement Learning

Paper • 2502.12853 • Published 5 days ago • 22

How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?

Paper • 2502.14502 • Published 3 days ago • 65

upvoted 10 papers 3 days ago

Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

Paper • 2502.14846 • Published 3 days ago • 13

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 3 days ago • 148

AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO

Paper • 2502.14669 • Published 3 days ago • 8

Dynamic Concepts Personalization from Single Videos

Paper • 2502.14844 • Published 3 days ago • 13

S*: Test Time Scaling for Code Generation

Paper • 2502.14382 • Published 3 days ago • 51

Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning

Paper • 2502.14768 • Published 3 days ago • 32

PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

Paper • 2502.14282 • Published 4 days ago • 14

LongWriter-V: Enabling Ultra-Long and High-Fidelity Generation in Vision-Language Models

Paper • 2502.14834 • Published 3 days ago • 22

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 3 days ago • 99

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published 3 days ago • 87

upvoted 3 papers 7 days ago

Diverse Inference and Verification for Advanced Reasoning

Paper • 2502.09955 • Published 10 days ago • 16

Large Language Diffusion Models

Paper • 2502.09992 • Published 9 days ago • 75

STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning

Paper • 2502.10177 • Published 9 days ago • 5