Laurie
/

gpt2-imdb-pos-v2

Model card Files Files and versions

gpt2-imdb-pos-v2 / README.md

Laurie's picture

Create README.md

b389afd over 2 years ago

|

history blame contribute delete

232 Bytes


	license: apache-2.0

	datasets: mdb

	language: English

	为了实现InstructGPT的SFT-RW-PPO

	此repo采用GPT2作为SFT模型，经过GPT2生成的文字再经过DistilBERT加以评估取生成positive的分数，再经过PPO优化