Unknown Entity's picture

Unknown Entity

unknownentity

·

AI & ML interests

None yet

Recent Activity

liked a model 6 days ago

stepfun-ai/stepvideo-t2v-turbo

liked a model 6 days ago

microsoft/OmniParser-v2.0

liked a Space 6 days ago

microsoft/OmniParser-v2

View all activity

Organizations

None yet

unknownentity's activity

upvoted 2 papers 12 days ago

Enhance-A-Video: Better Generated Video for Free

Paper • 2502.07508 • Published 13 days ago • 18

Magic 1-For-1: Generating One Minute Video Clips within One Minute

Paper • 2502.07701 • Published 12 days ago • 32

upvoted a paper 19 days ago

VideoJAM: Joint Appearance-Motion Representations for Enhanced Motion Generation in Video Models

Paper • 2502.02492 • Published 19 days ago • 56

upvoted 2 papers about 1 month ago

UI-TARS: Pioneering Automated GUI Interaction with Native Agents

Paper • 2501.12326 • Published Jan 21 • 51

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 273

upvoted a paper 3 months ago

Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency

Paper • 2409.02634 • Published Sep 4, 2024 • 94

upvoted a paper 5 months ago

OmniGen: Unified Image Generation

Paper • 2409.11340 • Published Sep 17, 2024 • 111

upvoted a paper about 1 year ago

Dolphins: Multimodal Language Model for Driving

Paper • 2312.00438 • Published Dec 1, 2023 • 14

upvoted 12 papers over 1 year ago

Orca 2: Teaching Small Language Models How to Reason

Paper • 2311.11045 • Published Nov 18, 2023 • 73

Make Pixels Dance: High-Dynamic Video Generation

Paper • 2311.10982 • Published Nov 18, 2023 • 69

Exponentially Faster Language Modelling

Paper • 2311.10770 • Published Nov 15, 2023 • 118

The Chosen One: Consistent Characters in Text-to-Image Diffusion Models

Paper • 2311.10093 • Published Nov 16, 2023 • 58

Mirasol3B: A Multimodal Autoregressive model for time-aligned and contextual modalities

Paper • 2311.05698 • Published Nov 9, 2023 • 14

JARVIS-1: Open-World Multi-task Agents with Memory-Augmented Multimodal Language Models

Paper • 2311.05997 • Published Nov 10, 2023 • 37

OtterHD: A High-Resolution Multi-modality Model

Paper • 2311.04219 • Published Nov 7, 2023 • 33

AnyMAL: An Efficient and Scalable Any-Modality Augmented Language Model

Paper • 2309.16058 • Published Sep 27, 2023 • 55

Vision Transformers Need Registers

Paper • 2309.16588 • Published Sep 28, 2023 • 78

Chain-of-Verification Reduces Hallucination in Large Language Models

Paper • 2309.11495 • Published Sep 20, 2023 • 38

Kosmos-2.5: A Multimodal Literate Model

Paper • 2309.11419 • Published Sep 20, 2023 • 50

FreeU: Free Lunch in Diffusion U-Net

Paper • 2309.11497 • Published Sep 20, 2023 • 65