Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

1,128

Full-text search

Active filters: reinforcement-learning, transformers

habanoz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 2

FabioDataGeek/ppo-LunarLander-v2

Reinforcement Learning • Updated May 2, 2023 • 1

mkahari/RL_testing

Reinforcement Learning • Updated Jan 11, 2023 • 1

arenbeglaryan/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 8, 2023 • 1

MHaurel/ppo-LunarLander-v2

Reinforcement Learning • Updated May 30, 2023 • 2

akoshel/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 27, 2023 • 1

rootacess/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 5, 2023 • 3

morganjeffries/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 19, 2023 • 1

jrnold/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 1, 2023 • 1

lewtun/dummy-trl-model

Reinforcement Learning • Updated Jan 24, 2023 • 15 • 1

stinoco/PPO-LunarLander-v2

Reinforcement Learning • Updated Mar 6, 2023 • 1

mili7522/ppo-cleanrl-LunarLander-v2

Reinforcement Learning • Updated Apr 16, 2023 • 3

EdenYav/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 22, 2023 • 2

victorivus/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 3, 2023 • 1

slopezay/ppo-LunarLander-v2

Reinforcement Learning • Updated May 20, 2023 • 2

nikogarro/PPO-LunarLander-v2

Reinforcement Learning • Updated Feb 16, 2023 • 1

jamesthong/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 3

ybelkada/gpt-neo-125m-detox

Reinforcement Learning • Updated Feb 17, 2023 • 31

ybelkada/gpt-neo-125m-detoxified-long-context

Reinforcement Learning • Updated Feb 17, 2023 • 3

dungtd2403/CartPole-v1

Reinforcement Learning • Updated Mar 5, 2023 • 1

ZhihongDeng/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 30, 2023 • 1

mkuntz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 1

Gabcsor/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 13, 2023 • 1

dcduplooy/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 15, 2023 • 2

Yureeh/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 6, 2023 • 1

TRiddle/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 21, 2023 • 1

JulianZas/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 27, 2023 • 1

ElementBrawlerAI/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 28, 2023 • 2

MarkieMark1/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 29, 2023 • 2

D0k-tor/LunarLander-v2

Reinforcement Learning • Updated Mar 21, 2023 • 2