Jason Weston's picture

Jason Weston

spermwhale

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 15 days ago

CharacterFlywheel: Scaling Iterative Improvement of Engaging and Steerable LLMs in Production

upvoted a paper 3 months ago

AI & Human Co-Improvement for Safer Co-Superintelligence

commentedon a paper 3 months ago

AI & Human Co-Improvement for Safer Co-Superintelligence

View all activity

Organizations

None yet

upvoted a paper 15 days ago

CharacterFlywheel: Scaling Iterative Improvement of Engaging and Steerable LLMs in Production

Paper • 2603.01973 • Published 19 days ago • 6

upvoted a paper 3 months ago

AI & Human Co-Improvement for Safer Co-Superintelligence

Paper • 2512.05356 • Published Dec 5, 2025 • 10

upvoted a paper 4 months ago

Scaling Agent Learning via Experience Synthesis

Paper • 2511.03773 • Published Nov 5, 2025 • 83

upvoted 2 papers 5 months ago

SPICE: Self-Play In Corpus Environments Improves Reasoning

Paper • 2510.24684 • Published Oct 28, 2025 • 18

The Alignment Waltz: Jointly Training Agents to Collaborate for Safety

Paper • 2510.08240 • Published Oct 9, 2025 • 41

upvoted 2 papers 6 months ago

The Era of Real-World Human Interaction: RL from User Conversations

Paper • 2509.25137 • Published Sep 29, 2025 • 19

The Majority is not always right: RL training for solution aggregation

Paper • 2509.06870 • Published Sep 8, 2025 • 15

upvoted 2 papers 7 months ago

Jointly Reinforcing Diversity and Quality in Language Model Generations

Paper • 2509.02534 • Published Sep 2, 2025 • 25

StepWiser: Stepwise Generative Judges for Wiser Reasoning

Paper • 2508.19229 • Published Aug 26, 2025 • 20

upvoted a paper 10 months ago

Self-Challenging Language Model Agents

Paper • 2506.01716 • Published Jun 2, 2025 • 10

upvoted a paper over 1 year ago

Meta-Rewarding Language Models: Self-Improving Alignment with LLM-as-a-Meta-Judge

Paper • 2407.19594 • Published Jul 28, 2024 • 21

upvoted 7 papers over 2 years ago

System 2 Attention (is something you might need too)

Paper • 2311.11829 • Published Nov 20, 2023 • 43

The ART of LLM Refinement: Ask, Refine, and Trust

Paper • 2311.07961 • Published Nov 14, 2023 • 11

Branch-Solve-Merge Improves Large Language Model Evaluation and Generation

Paper • 2310.15123 • Published Oct 23, 2023 • 8

Chain-of-Verification Reduces Hallucination in Large Language Models

Paper • 2309.11495 • Published Sep 20, 2023 • 40

Self-Alignment with Instruction Backtranslation

Paper • 2308.06259 • Published Aug 11, 2023 • 43

Leveraging Implicit Feedback from Deployment Data in Dialogue

Paper • 2307.14117 • Published Jul 26, 2023 • 5

System-Level Natural Language Feedback

Paper • 2306.13588 • Published Jun 23, 2023 • 11