🔹مدل متنباز DeepSeek R1 منتشر شد؛ رقیب OpenAI o1 اما ٩۵ درصد کمهزینهتر
🔸استارتاپ #هوش_مصنوعی چینی DeepSeek بهتازگی DeepSeek-R1 را منتشر کرده است که مدلی متنباز و استدلالگر محسوب میشود. به ادعای این استارتاپ، این مدل در برخی بنچمارکها مدل o1 از شرکت OpenAI را شکست میدهد. نکته قابلتوجه این است که هزینههای مدل چینی تا ۹۵ درصد کمتر از مدل آمریکایی است.
🔸دیپسیک ضمن انتشار مدل DeepSeek-R1 در Hugging Face، در گزارشی عملکرد این مدل استدلالگر را در بنچمارکهای مختلف نشان داده است. مدل R1 توانسته در بنچمارکهای AIME ،MATH-500 و SWE-bench Verified مدل o1 را شکست دهد. این مدل در تستهای ریاضی AIME امتیاز ۷۹.۸ درصد و در MATH-500 امتیاز ۹۷.۳ درصد را کسب کرد. همچنین امتیاز ۲ هزار و ۲۹ را در تست Codeforces به دست آورد؛ بهتر از ۹۶.۳ درصد برنامهنویسان انسانی عمل کرده است. در مقابل، مدل o1 بهترتیب امتیازهای ۷۹.۲ درصد، ۹۶.۴ درصد و ۹۶.۶ درصد را در این بنچمارکها به دست آورده بود.
🔸البته این مدل در بنچمارک MMLU که مربوط به دانش عمومی است، امتیاز ۹۰.۸ درصد را کسب کرد که کمی کمتر از امتیاز ۹۱.۸ درصد o1 است. درکل، امتیازهای این ۲ مدل خیلی به یکدیگر نزدیک است، با این تفاوت که مدل استارتاپ چینی با هزینهای ۹۰ تا ۹۵ درصد کمتر از مدل o1 این محاسبات را انجام میدهد.
🔸🔸🔸
🟣 Digiato
🎞 Digiatoofficial
🤖 Digiato
💭 @Digiato
🔸استارتاپ #هوش_مصنوعی چینی DeepSeek بهتازگی DeepSeek-R1 را منتشر کرده است که مدلی متنباز و استدلالگر محسوب میشود. به ادعای این استارتاپ، این مدل در برخی بنچمارکها مدل o1 از شرکت OpenAI را شکست میدهد. نکته قابلتوجه این است که هزینههای مدل چینی تا ۹۵ درصد کمتر از مدل آمریکایی است.
🔸دیپسیک ضمن انتشار مدل DeepSeek-R1 در Hugging Face، در گزارشی عملکرد این مدل استدلالگر را در بنچمارکهای مختلف نشان داده است. مدل R1 توانسته در بنچمارکهای AIME ،MATH-500 و SWE-bench Verified مدل o1 را شکست دهد. این مدل در تستهای ریاضی AIME امتیاز ۷۹.۸ درصد و در MATH-500 امتیاز ۹۷.۳ درصد را کسب کرد. همچنین امتیاز ۲ هزار و ۲۹ را در تست Codeforces به دست آورد؛ بهتر از ۹۶.۳ درصد برنامهنویسان انسانی عمل کرده است. در مقابل، مدل o1 بهترتیب امتیازهای ۷۹.۲ درصد، ۹۶.۴ درصد و ۹۶.۶ درصد را در این بنچمارکها به دست آورده بود.
🔸البته این مدل در بنچمارک MMLU که مربوط به دانش عمومی است، امتیاز ۹۰.۸ درصد را کسب کرد که کمی کمتر از امتیاز ۹۱.۸ درصد o1 است. درکل، امتیازهای این ۲ مدل خیلی به یکدیگر نزدیک است، با این تفاوت که مدل استارتاپ چینی با هزینهای ۹۰ تا ۹۵ درصد کمتر از مدل o1 این محاسبات را انجام میدهد.
🔸🔸🔸
🟣 Digiato
🎞 Digiatoofficial
🤖 Digiato
💭 @Digiato