70 1349 2113

taesiri PRO

taesiri

https://taesiri.ai/

AI & ML interests

AGI ... one linear layer at a time

Recent Activity

updated a dataset less than a minute ago

taesiri/RedditDailyBackup

updated a dataset 1 minute ago

taesiri/RedditDailyBackup

updated a dataset 1 minute ago

taesiri/RedditDailyBackup

View all activity

Organizations

taesiri's activity

upvoted 5 papers 2 days ago

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 3 days ago • 147

S*: Test Time Scaling for Code Generation

Paper • 2502.14382 • Published 3 days ago • 49

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 3 days ago • 99

Scaling Text-Rich Image Understanding via Code-Guided Synthetic Multimodal Data Generation

Paper • 2502.14846 • Published 3 days ago • 13

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published 3 days ago • 87

upvoted 2 articles 3 days ago

Article

Introducing Three New Serverless Inference Providers: Hyperbolic, Nebius AI Studio, and Novita 🔥

6 days ago

• 87

Article

SmolVLM2: Bringing Video Understanding to Every Device

4 days ago

• 135

upvoted a paper 3 days ago

Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published 4 days ago • 136

upvoted an article 4 days ago

Article

PaliGemma 2 Mix - New Instruction Vision Language Models by Google

5 days ago

• 53

upvoted a collection 4 days ago

PaliGemma 2 Mix

Collection

13 items • Updated 4 days ago • 55

upvoted 10 papers 4 days ago

Crowd Comparative Reasoning: Unlocking Comprehensive Evaluations for LLM-as-a-Judge

Paper • 2502.12501 • Published 6 days ago • 5

HealthGPT: A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation

Paper • 2502.09838 • Published 10 days ago • 9

Magma: A Foundation Model for Multimodal AI Agents

Paper • 2502.13130 • Published 5 days ago • 42

RealSyn: An Effective and Scalable Multimodal Interleaved Document Transformation Paradigm

Paper • 2502.12513 • Published 5 days ago • 15

Multimodal Mamba: Decoder-only Multimodal State Space Model via Quadratic to Linear Distillation

Paper • 2502.13145 • Published 5 days ago • 35

SafeRoute: Adaptive Model Selection for Efficient and Accurate Safety Guardrails in Large Language Models

Paper • 2502.12464 • Published 6 days ago • 26

Rethinking Diverse Human Preference Learning through Principal Component Analysis

Paper • 2502.13131 • Published 5 days ago • 34

SoFar: Language-Grounded Orientation Bridges Spatial Reasoning and Object Manipulation

Paper • 2502.13143 • Published 5 days ago • 28

Phantom: Subject-consistent video generation via cross-modal alignment

Paper • 2502.11079 • Published 7 days ago • 49

Continuous Diffusion Model for Language Modeling

Paper • 2502.11564 • Published 6 days ago • 48