🎥
قویتر از رقبای چینی و آمریکایی؛ علیبابا هوش مصنوعی Qwen2.5-Max را با عملکرد خیرهکننده معرفی کرد🔹شرکت فناوری چینی Alibaba نسخه جدیدی از مدل هوش مصنوعی Qwen 2.5 خود رونمایی کرد. براساس اعلام Alibaba، مدل جدید Qwen2.5-Max در بنچمارکهایی مانند Arena-Hard ،LiveCodeBench و GPQA-Diamond از DeepSeek V3 بهتر عمل میکند.
🔹در دیگر بنچمارکها نیز تقریباً همسطح مدل دیپسیک است. همچنین این شرکت میگوید که مدلش از GPT-4o و Llama-3.1-405B در بخشهای مختلفی عملکرد بهتری دارد.
🔹اکنون میتوانید به API این مدل در Alibaba Cloud دسترسی داشته باشید. همچنین این مدل قدرتمند در Qwen Chat منتشر شده است که در آن میتوانید عکس و ویدیو نیز تولید کنید.
🔹مدل Qwen2.5-Max یک مدل MoE (ترکیب متخصصان) در مقیاس بزرگ است که روی بیش از ٢٠ تریلیون توکن و با روشهای تنظیم دقیق نظارتشده (SFT) و یادگیری تقویتی از بازخورد انسانی (RLHF) آموزش دیده است. درکل رویکرد MoE کمک میکند تا هوش مصنوعی بدون خوشههای GPU عظیم توسعه یابد و هزینههای زیرساخت را ۴٠ تا ۶٠ درصد نسبت به سایر رویکردهای مدلهای زبانی بزرگ کاهش میدهد.
🔹دیجیاتو
@Golestan_Best