کاربرد مدلهای بنیادی و نمایش تعمیم پذیری مدلهای RL در این مقاله رو بسیار خوب توضیح دادند
▪️ SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person