Talha Rüzgar Akkuş's picture

Talha Rüzgar Akkuş

Q-bert

·

AI & ML interests

AI, NLP, Math Hypothesis,NP Problems,Competitive programming

Recent Activity

upvoted a paper about 1 month ago

NeuralOS: Towards Simulating Operating Systems via Neural Generative Models

upvoted a paper 2 months ago

Wait, We Don't Need to "Wait"! Removing Thinking Tokens Improves Reasoning Efficiency

updated a dataset 3 months ago

Q-bert/Custom-2204

View all activity

Organizations

upvoted a paper about 1 month ago

NeuralOS: Towards Simulating Operating Systems via Neural Generative Models

Paper • 2507.08800 • Published Jul 11 • 79

upvoted a paper 2 months ago

Wait, We Don't Need to "Wait"! Removing Thinking Tokens Improves Reasoning Efficiency

Paper • 2506.08343 • Published Jun 10 • 49

upvoted a paper 3 months ago

Reasoning Models Can Be Effective Without Thinking

Paper • 2504.09858 • Published Apr 14 • 12

upvoted 2 papers 4 months ago

Thought Manipulation: External Thought Can Be Efficient for Large Reasoning Models

Paper • 2504.13626 • Published Apr 18 • 8

PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters

Paper • 2504.08791 • Published Apr 7 • 134

upvoted 3 papers 5 months ago

MoCha: Towards Movie-Grade Talking Character Synthesis

Paper • 2503.23307 • Published Mar 30 • 138

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published Mar 12 • 73

Forgetting Transformer: Softmax Attention with a Forget Gate

Paper • 2503.02130 • Published Mar 3 • 32

upvoted a paper 6 months ago

Chain of Draft: Thinking Faster by Writing Less

Paper • 2502.18600 • Published Feb 25 • 50

upvoted a paper 7 months ago

SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

Paper • 2502.02737 • Published Feb 4 • 241

upvoted an article 7 months ago

Article

Welcome to Inference Providers on the Hub 🔥

By

and 6 others •

Jan 28

• 488

upvoted a paper 7 months ago

Enhancing Human-Like Responses in Large Language Models

Paper • 2501.05032 • Published Jan 9 • 57

upvoted a collection 8 months ago

Human-Like LLMs

Human-Like LLMs series. • 5 items • Updated Jan 20 • 13

upvoted a paper 11 months ago

Were RNNs All We Needed?

Paper • 2410.01201 • Published Oct 2, 2024 • 53

upvoted a paper 12 months ago

Diffusion Models Are Real-Time Game Engines

Paper • 2408.14837 • Published Aug 27, 2024 • 127

upvoted 2 papers over 1 year ago

TURNA: A Turkish Encoder-Decoder Language Model for Enhanced Understanding and Generation

Paper • 2401.14373 • Published Jan 25, 2024 • 11

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Paper • 2312.00752 • Published Dec 1, 2023 • 145

upvoted a collection over 1 year ago

Mamba

Mamba SSM Models with hf_integration. • 7 items • Updated Dec 28, 2023 • 7

upvoted a paper almost 2 years ago

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 172