DarkoButte's picture

24 2

DarkoButte

DarkoButte

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 24 days ago

HierSearch: A Hierarchical Enterprise Deep Search Framework Integrating Local and Web Searches

upvoted a paper about 2 months ago

MemOS: A Memory OS for AI System

upvoted a paper about 2 months ago

SingLoRA: Low Rank Adaptation Using a Single Matrix

View all activity

Organizations

None yet

upvoted a paper 24 days ago

HierSearch: A Hierarchical Enterprise Deep Search Framework Integrating Local and Web Searches

Paper • 2508.08088 • Published 28 days ago • 28

upvoted 3 papers about 2 months ago

MemOS: A Memory OS for AI System

Paper • 2507.03724 • Published Jul 4 • 153

SingLoRA: Low Rank Adaptation Using a Single Matrix

Paper • 2507.05566 • Published Jul 8 • 111

Skywork-R1V3 Technical Report

Paper • 2507.06167 • Published Jul 8 • 70

upvoted 6 papers 2 months ago

EAQuant: Enhancing Post-Training Quantization for MoE Models via Expert-Aware Optimization

Paper • 2506.13329 • Published Jun 16 • 1

Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

Paper • 2506.16406 • Published Jun 19 • 126

GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning

Paper • 2507.01006 • Published Jul 1 • 234

Mind2Web 2: Evaluating Agentic Search with Agent-as-a-Judge

Paper • 2506.21506 • Published Jun 26 • 51

LongWriter-Zero: Mastering Ultra-Long Text Generation via Reinforcement Learning

Paper • 2506.18841 • Published Jun 23 • 56

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published Mar 26 • 165

upvoted a collection 3 months ago

Qwen3-Reranker

3 items • Updated Jul 21 • 62

upvoted 9 papers 3 months ago

Let's Predict Sentence by Sentence

Paper • 2505.22202 • Published May 28 • 19

Universal Reasoner: A Single, Composable Plug-and-Play Reasoner for Frozen LLMs

Paper • 2505.19075 • Published May 25 • 21

SageAttention2++: A More Efficient Implementation of SageAttention2

Paper • 2505.21136 • Published May 27 • 47

R2R: Efficiently Navigating Divergent Reasoning Paths with Small-Large Model Token Routing

Paper • 2505.21600 • Published May 27 • 71

Scaling Law for Quantization-Aware Training

Paper • 2505.14302 • Published May 20 • 76

Reverse Preference Optimization for Complex Instruction Following

Paper • 2505.22172 • Published May 28 • 6

Beyond Standard MoE: Mixture of Latent Experts for Resource-Efficient Language Models

Paper • 2503.23100 • Published Mar 29 • 1

How Post-Training Reshapes LLMs: A Mechanistic View on Knowledge, Truthfulness, Refusal, and Confidence

Paper • 2504.02904 • Published Apr 3 • 1

Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models

Paper • 2505.14810 • Published May 20 • 63