شرکت چینی دیپ سیک که چند ماه پیش مدل استدلالی R1 رو به صورت انلاین در سایتش برای استفاده
عرضه کرده بود، حالا این مدل رو به صورت متن باز عرضه کرده که قدرتمندترین مدل هوش مصنوعی متن باز هست و عرضه اون نگاه انتقادی به هزینه های کمرشکن مدلهای امریکایی رو شروع کرده!
بعد از عرضه موفقیت امیز مدل
V3 توسط این شرکت که قدرتی نزدیک به GPT 4o داشت، مدل R1، رقیب مستقیم OpenAI O1 هست. این مدل یک مدل استدلالی هست که برخلاف مدلهای عادی مثل 4o که بعد از گرفتن دستور سریعا جواب میدن، مدلهای استدلالی مرحله ای برای تفکر و استدلال دارن که در هنگام جواب دادن به کاربر، مدل برنامه ای برای حل مساله ای که کاربر داده، میسازه و بعد از اون جوابهای مختلف برای حل اون مساله رو بررسی میکنه تا در نهایت به جوابی که از همه بهتره برسه و جواب نهایی رو برای کاربر بفرسته.
بدین صورت، به مدل در حین اجرا و جواب دادن به درخواستهای کاربر، زمانی برای تفکر داده میشه که باعث افزایش مدت زمان پاسخگویی و منابع موردنیاز میشه، ولی در عوض میتونه سوالات پیچیده و چالشی رو بهتر حل کنه.
این مدل عملکرد قدرتمندی هم داره و در ازمایشهایی مختلف قدرتی نزدیک به مدل O1 رو از خودش نشون داده!
مدل R1 به چند دلیل مهم و حائر اهمیتیه:
1. این مدل برخلاف مدلهای OpenAI کاملا متن بازه بنابراین روی سخت افزار خودتون میشه اون رو اجرا کرد و مثل O1 وابسته به شرکت سازنده نیستین.
2. این مدل تنها در 4 ماه بعد از O1 عرضه شده و دیپ سیک مقاله فنی بسیار کاملی در مورد نحوه تمرین اون منتشر کرده که شرکتهای مختلف تونستن براساس اون مدلهای دیگه ای رو تمرین بدن و اطلاعات اون رو تایید کنن.
3. این مدل با هزینه بسیار کمتر و فقط با 3 درصد هزینه O1 و حدود 6 میلیون دلار تمرین داده شده که نبوغ مهندسان دیپ سیک در این زمینه رو نشون میده که باعث میشه هزینه API اون هم خیلی از O1 ارزونتر باشه!
4. برخلاف OpenAI که اجازه نمیده کاربر به تفکرات کامل O1 دسترسی داشته باشه، R1 کل تفکرات مدل رو نشون میده و میتونین ببینین چطوری به این جواب مدنظر رسیده که بسیار جالب هست.
5. و در نهایت برخلاف O1 که نیاز به اشتراک داره، R1 رایگانه!
این مدل به صورت رایگان از سایت
chat.deepseek.com یا اپ
deepseek در دسترس هست و برای استفاده از اون فقط کافیه دکمه DeepThink رو فشار بدین.
🔎
arstechnica 📍
@TechTube