هفته گذشته بحث مدل زبانی بزرگ DeepSeek خیلی داغ شد. این چند وقت کلی خبر در مورد مدلهای زبانی بوده و من هیچ وقت سراغ «وای این مدل اومده» نرفتم چون به نظرم مسیری ادامه دار است ولی دیپ سیک واقعا قدمی رو به جلو بود. بخصوص مهم برای ما. چون:
۱. آزاد است و می تونیم به خوبی ازش استفاده کنیم و بفهمیم چه میکنه
۲. ساخت مدلش بسیار کم هزینهتر از مدلهای قبلی بوده
۳. استفاده ازش بسیار کم هزینهتر از مدلهای دیگه بوده
این شد که فکر کردم آخر روز کاریام کمی در موردش گپ بزنم. ویدئوی چیزی بین بحث فنی / بحث عمومی است و نسبتا فی البداهه ولی به نظرم درک خوبی از ماجرا میده.
https://youtu.be/ej1uoCib7WM
۱. آزاد است و می تونیم به خوبی ازش استفاده کنیم و بفهمیم چه میکنه
۲. ساخت مدلش بسیار کم هزینهتر از مدلهای قبلی بوده
۳. استفاده ازش بسیار کم هزینهتر از مدلهای دیگه بوده
این شد که فکر کردم آخر روز کاریام کمی در موردش گپ بزنم. ویدئوی چیزی بین بحث فنی / بحث عمومی است و نسبتا فی البداهه ولی به نظرم درک خوبی از ماجرا میده.
https://youtu.be/ej1uoCib7WM