Upload data_reward_model_training.csv

Data for training the reward model.
`chosen`: formatted from textual label
`rejected`: generated by gpt2

Files changed (1) hide show

data_reward_model_training.csv ADDED Viewed

The diff for this file is too large to render. See raw diff