Edit Models filters

Multimodal

Image-Text-to-Text

Visual Question Answering

Document Question Answering

Video-Text-to-Text

Computer Vision

Image Classification

Object Detection

Video Classification

Image Segmentation

Zero-Shot Image Classification

Image Feature Extraction

Mask Generation

Depth Estimation

Zero-Shot Object Detection

Unconditional Image Generation

Keypoint Detection

Natural Language Processing

Text Generation

Text Classification

Text2Text Generation

Token Classification

Question Answering

Feature Extraction

Sentence Similarity

Zero-Shot Classification

Table Question Answering

Audio

Automatic Speech Recognition

Audio Classification

Voice Activity Detection

Tabular

Tabular Classification

Tabular Regression

Time Series Forecasting

Reinforcement Learning

Reinforcement Learning

Other

Graph Machine Learning

Models

801

Full-text search

Active filters: reinforcement-learning, transformers

akoshel/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 27, 2023 • 4

rootacess/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 5, 2023 • 3

morganjeffries/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 19, 2023 • 2

jrnold/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 1, 2023 • 1

lewtun/dummy-trl-model

Reinforcement Learning • Updated Jan 24, 2023 • 29 • 1

stinoco/PPO-LunarLander-v2

Reinforcement Learning • Updated Mar 6, 2023 • 6

mili7522/ppo-cleanrl-LunarLander-v2

Reinforcement Learning • Updated Apr 16, 2023 • 2

EdenYav/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 22, 2023 • 4

victorivus/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 3, 2023 • 2

slopezay/ppo-LunarLander-v2

Reinforcement Learning • Updated May 20, 2023 • 2

nikogarro/PPO-LunarLander-v2

Reinforcement Learning • Updated Feb 16, 2023 • 3

jamesthong/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 3

ybelkada/gpt-neo-125m-detox

Reinforcement Learning • Updated Feb 17, 2023 • 13

ybelkada/gpt-neo-125m-detoxified-long-context

Reinforcement Learning • Updated Feb 17, 2023 • 16

dungtd2403/CartPole-v1

Reinforcement Learning • Updated Mar 5, 2023 • 3

ZhihongDeng/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 30, 2023 • 4

mkuntz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 3

Gabcsor/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 13, 2023 • 1

dcduplooy/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 15, 2023

Yureeh/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 6, 2023 • 5

TRiddle/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 21, 2023 • 1

JulianZas/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 27, 2023 • 1

ElementBrawlerAI/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 28, 2023 • 3

MarkieMark1/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 29, 2023 • 6

D0k-tor/LunarLander-v2

Reinforcement Learning • Updated Mar 21, 2023 • 4

dean-r/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 25, 2023 • 3

dineshresearch/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 13, 2023 • 3

dineshresearch/ppo-LunarLander-v3

Reinforcement Learning • Updated Mar 13, 2023

yyq90/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 20, 2023 • 2

aiartwork/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 18, 2023 • 2