✨ 概要: このモデルは OfficialのPretrained GPT Modelを基に、約650時間分のHシーンボイス(喘ぎ声を除く)でFinetuneされたモデルです。このモデルは、一般的な日本語能力と特定の「そういう」シーンの読み上げ能力においてある程度の改善していたと思います。

🔧 トレーニング詳細:

🖥️ ハードウェア: RTX-4090 x 1

⏳ トレーニング時間: 16時間

🔄 エポック数: DPOなしで15エポック、DPOありで2エポック

📈 今後の計画: https://huggingface.co/AkitoP/GPT-SoVITS-JA-ProsodyControl_model での日本語特化版GPT-SoVITSにおけるFinetune作業も予定しています。この作業を通じて、モデルのさらなる改善を目指します。

🎯 目標: このモデルを用いることで、より自然で感情的な読み上げが可能となり、特に「そういう」シーンにおけるパフォーマンスが大きく向上することを目指しています。

✨ 概要:这个模型是基于官方预训练的GPT模型,通过大约650小时的H场景声音(除去喘息声)进行Fine-tune得到的。

🔧 训练详情:

🖥️ 硬件:RTX-4090 x 1

⏳ 训练时间:16小时

🔄 迭代次数:无DPO训练15个epoch,使用DPO训练2个epoch

🎯 目标:使用这个模型,我们的目标是实现更自然、更富有情感的朗读能力,特别是在“那种”场景下,大幅提升性能。

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.
The model cannot be deployed to the HF Inference API: The model has no library tag.