Chmielewski's picture

Chmielewski

Eryk-Chmielewski

·

AI & ML interests

Senior AI Agent Architect

Recent Activity

upvoted a paper about 5 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

upvoted a paper about 15 hours ago

STATe-of-Thoughts: Structured Action Templates for Tree-of-Thoughts

upvoted a paper 3 days ago

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

View all activity

Organizations

upvoted a paper about 5 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published 14 days ago • 77

upvoted a paper about 15 hours ago

STATe-of-Thoughts: Structured Action Templates for Tree-of-Thoughts

Paper • 2602.14265 • Published 8 days ago • 20

upvoted 6 papers 3 days ago

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

Paper • 2602.15547 • Published 6 days ago • 20

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

Paper • 2602.12670 • Published 10 days ago • 50

Multi-agent cooperation through in-context co-player inference

Paper • 2602.16301 • Published 5 days ago • 15

Discovering Multiagent Learning Algorithms with Large Language Models

Paper • 2602.16928 • Published 5 days ago • 9

Arcee Trinity Large Technical Report

Paper • 2602.17004 • Published 4 days ago • 16

Unified Latents (UL): How to train your latents

Paper • 2602.17270 • Published 4 days ago • 37

upvoted 8 papers 5 days ago

DISPO: Enhancing Training Efficiency and Stability in Reinforcement Learning for Large Language Model Mathematical Reasoning

Paper • 2602.00983 • Published 22 days ago • 1

R^3L: Reflect-then-Retry Reinforcement Learning with Language-Guided Exploration, Pivotal Credit, and Positive Amplification

Paper • 2601.03715 • Published Jan 7 • 2

R^3: Replay, Reflection, and Ranking Rewards for LLM Reinforcement Learning

Paper • 2601.19620 • Published 27 days ago • 1

Structured Reasoning for Large Language Models

Paper • 2601.07180 • Published Jan 12 • 1

Internalizing Meta-Experience into Memory for Guided Reinforcement Learning in Large Language Models

Paper • 2602.10224 • Published 13 days ago • 19

CLEANER: Self-Purified Trajectories Boost Agentic Reinforcement Learning

Paper • 2601.15141 • Published Jan 21 • 1

GLM-5: from Vibe Coding to Agentic Engineering

Paper • 2602.15763 • Published 6 days ago • 81

STAPO: Stabilizing Reinforcement Learning for LLMs by Silencing Rare Spurious Tokens

Paper • 2602.15620 • Published 6 days ago • 3

upvoted 2 papers 6 days ago

REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

Paper • 2602.14234 • Published 8 days ago • 21

Experiential Reinforcement Learning

Paper • 2602.13949 • Published 9 days ago • 63

liked a model 7 days ago

unsloth/Qwen3.5-397B-A17B-GGUF

Image-Text-to-Text • 396B • Updated 7 days ago • 84.5k • 182

upvoted a paper 7 days ago

Alleviating Sparse Rewards by Modeling Step-Wise and Long-Term Sampling Effects in Flow-Based GRPO

Paper • 2602.06422 • Published 17 days ago • 44