1 29

Chi-Pin Huang

jasper0314-huang

AI & ML interests

None yet

Recent Activity

upvoted a paper 7 days ago

EmbodiedOneVision: Interleaved Vision-Text-Action Pretraining for General Robot Control

upvoted a paper 10 days ago

Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning

upvoted a paper 10 days ago

Discrete Diffusion VLA: Bringing Discrete Diffusion to Action Decoding in Vision-Language-Action Policies

View all activity

Organizations

None yet

upvoted a paper 7 days ago

EmbodiedOneVision: Interleaved Vision-Text-Action Pretraining for General Robot Control

Paper • 2508.21112 • Published 10 days ago • 72

upvoted 2 papers 10 days ago

Pref-GRPO: Pairwise Preference Reward-based GRPO for Stable Text-to-Image Reinforcement Learning

Paper • 2508.20751 • Published 10 days ago • 85

Discrete Diffusion VLA: Bringing Discrete Diffusion to Action Decoding in Vision-Language-Action Policies

Paper • 2508.20072 • Published 11 days ago • 28

upvoted a paper 11 days ago

MovieCORE: COgnitive REasoning in Movies

Paper • 2508.19026 • Published 12 days ago • 5

upvoted a paper 12 days ago

Autoregressive Universal Video Segmentation Model

Paper • 2508.19242 • Published 12 days ago • 26

upvoted a paper 18 days ago

Embodied-R1: Reinforced Embodied Reasoning for General Robotic Manipulation

Paper • 2508.13998 • Published 19 days ago • 16

upvoted a paper 19 days ago

LongSplat: Robust Unposed 3D Gaussian Splatting for Casual Long Videos

Paper • 2508.14041 • Published 19 days ago • 57

upvoted a paper 27 days ago

MolmoAct: Action Reasoning Models that can Reason in Space

Paper • 2508.07917 • Published 27 days ago • 41

upvoted a paper about 1 month ago

DeepPHY: Benchmarking Agentic VLMs on Physical Reasoning

Paper • 2508.05405 • Published Aug 7 • 63

upvoted a paper about 2 months ago

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

Paper • 2507.17512 • Published Jul 23 • 36

authored 3 papers about 2 months ago

VideoMage: Multi-Subject and Motion Customization of Text-to-Video Diffusion Models

Paper • 2503.21781 • Published Mar 27

MotionMatcher: Motion Customization of Text-to-Video Diffusion Models via Motion Feature Matching

Paper • 2502.13234 • Published Feb 18

ThinkAct: Vision-Language-Action Reasoning via Reinforced Visual Latent Planning

Paper • 2507.16815 • Published Jul 22 • 38

upvoted a paper about 2 months ago

ThinkAct: Vision-Language-Action Reasoning via Reinforced Visual Latent Planning

Paper • 2507.16815 • Published Jul 22 • 38

commented a paper about 2 months ago

ThinkAct: Vision-Language-Action Reasoning via Reinforced Visual Latent Planning

Paper • 2507.16815 • Published Jul 22 • 38 •

upvoted 5 papers about 2 months ago

GR-3 Technical Report

Paper • 2507.15493 • Published Jul 21 • 45

"PhyWorldBench": A Comprehensive Evaluation of Physical Realism in Text-to-Video Models

Paper • 2507.13428 • Published Jul 17 • 15

Streaming 4D Visual Geometry Transformer

Paper • 2507.11539 • Published Jul 15 • 14

AnyCap Project: A Unified Framework, Dataset, and Benchmark for Controllable Omni-modal Captioning

Paper • 2507.12841 • Published Jul 17 • 41

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

Paper • 2507.13348 • Published Jul 17 • 73

Chi-Pin Huang

AI & ML interests

Recent Activity

Organizations

jasper0314-huang's activity