Forward from: TechTube 𝕏 تک توب
🆓 مدل R1 حدود 671 میلیارد پارامتر داره که حجم نسخه اصلی اون بالای 700 گیگ هست و با اینکه میشه اون روی سخت افزار گرون قیمتی اجرا کرد اما چنین سخت افزاری در دسترس همه نیست، در نتیجه دیپ سیک حتی برای اون هم چاره ای اندیشیده و نسخه سبکتری (Distill) از مدل R1 رو با ترکیب با مدلهای Llama و Qwen عرضه کرده که میشه حتی با 2 گیگ رم هم اون رو اجرا کرد که طبعا قدرت اون از نسخه پرحجم بسیار کمتره ولی از مدلهای با اندازه مشابه قویتر هست. این مدلها رو میتونید با نرم افزار LM Studio روی کامپیپوترتون دانلود و اجرا کنید.
⬇️ در هنگام دانلود مدل دقت کنید که هر چه تعداد پارامترها بزرگتر باشه نیاز به رم بیشتری هست، مثلا اگر رم 32 گیگ دارین نسخه 32B رو دانلود کنین یا اگر رم 8 گیگ دارین دارین نسخه 7B رو.
🎮 در صفحه هر مدل لینکهای مختلفی برای دانلود وجود دارن که میزان فشرده کردن مدل با Quantization رو نشون میدن. هر چی عدد جلوی Q بیشتر باشه، دقت مدل بالاتر ولی در عوض رم بیشتری مصرف میکنه. معمولا Q4 تعادلی بین سرعت، کیفیت و مصرف رمه بنابراین نسخه Q4_K_L یا Q4_K_M رو دانلود کنید.
📍 @TechTube
⬇️ در هنگام دانلود مدل دقت کنید که هر چه تعداد پارامترها بزرگتر باشه نیاز به رم بیشتری هست، مثلا اگر رم 32 گیگ دارین نسخه 32B رو دانلود کنین یا اگر رم 8 گیگ دارین دارین نسخه 7B رو.
🎮 در صفحه هر مدل لینکهای مختلفی برای دانلود وجود دارن که میزان فشرده کردن مدل با Quantization رو نشون میدن. هر چی عدد جلوی Q بیشتر باشه، دقت مدل بالاتر ولی در عوض رم بیشتری مصرف میکنه. معمولا Q4 تعادلی بین سرعت، کیفیت و مصرف رمه بنابراین نسخه Q4_K_L یا Q4_K_M رو دانلود کنید.
📍 @TechTube