دیپسیک هزینه train یا آموزش دادن مدلی که ساخته رو ۵.۶ میلیون دلار اعلام کرده نه هزینه ساخت این مدلرو. یکی از دلایلی که این هزینه برای مدلهای پیشرو مثل GPT و Gemini زیاد هست اینه که مدلها به حجم زیادی از نیروی انسانی برای آموزش دادن نیاز دارن، در کنار اینکه بخش بزرگی از دیتاهای مورد نیاز خودشون رو خریداری میکنن.
دیپسیک اما تونسته از GPT-4o و مدلهای پیشرو برای آموزش دادن ۲ مدل خودش یعنی R1 و V3 استفاده کنه و این دلیلی هست که تونستن هزینههای آموزش دادن مدل خودشون رو کاهش بدن. یکی از دلایلی که وقتی روزهای اول از دیپسیک سوال میشد تورو کی ساخته و جواب میداد OpenAI هم همین موضوع هست.
reddit
@geekalerts
دیپسیک اما تونسته از GPT-4o و مدلهای پیشرو برای آموزش دادن ۲ مدل خودش یعنی R1 و V3 استفاده کنه و این دلیلی هست که تونستن هزینههای آموزش دادن مدل خودشون رو کاهش بدن. یکی از دلایلی که وقتی روزهای اول از دیپسیک سوال میشد تورو کی ساخته و جواب میداد OpenAI هم همین موضوع هست.
@geekalerts