شرکت چینی Deepseek بزرگترین و قدرتمندین هوش مصنوعی متن باز جهان رو عرضه کرده که حتی از مدلهای متن بسته شرکتهای بزرگ هم قویتره!
این مدل که Deepseek V3 نام داره، دارای 671 میلیارد پارامتر هست و بزرگترین در بین مدلهای متن بازه که بیش از 700 گیگ حجم داره! برای مقایسه بزرگترین مدل LLAMA فقط 405 میلیارد پارامتر داشت. این مدل تنها با هزینه ای حدود 5.5 میلیون دلار تمرین داده شده.
در تستها این مدل هم عملکرد بسیار خوبی داشته و نه تنها از GPT 4o پیشی گرفته بلکه در تستهایی مختلف به خصوص برای برنامه نویسی، به Claude 3.5 Sonnet نزدیک شده و حتی در تستهایی از اون پیشی گرفته که برای یک مدل متن باز نتیجه بسیار خوبی هست. علاوه بر این قیمت API اون هم نسبت به Sonnet بسیار ارزانتر هست.
مدل Deepseek V3 به صورت رایگان از اینجا قابل استفاده هست.
🔎 the-decoder.com
📍 @TechTube
این مدل که Deepseek V3 نام داره، دارای 671 میلیارد پارامتر هست و بزرگترین در بین مدلهای متن بازه که بیش از 700 گیگ حجم داره! برای مقایسه بزرگترین مدل LLAMA فقط 405 میلیارد پارامتر داشت. این مدل تنها با هزینه ای حدود 5.5 میلیون دلار تمرین داده شده.
در تستها این مدل هم عملکرد بسیار خوبی داشته و نه تنها از GPT 4o پیشی گرفته بلکه در تستهایی مختلف به خصوص برای برنامه نویسی، به Claude 3.5 Sonnet نزدیک شده و حتی در تستهایی از اون پیشی گرفته که برای یک مدل متن باز نتیجه بسیار خوبی هست. علاوه بر این قیمت API اون هم نسبت به Sonnet بسیار ارزانتر هست.
مدل Deepseek V3 به صورت رایگان از اینجا قابل استفاده هست.
🔎 the-decoder.com
📍 @TechTube