شرکت OpenAI از قدرتمندترین مدل هوش مصنوعی با نام o3 رونمایی کرده.
این دومین مدل از سری o مدلهای متنی OpenAI هست که اصولا باید o2 نام میگرفت، ولی به دلیل تداخل با نام اپراتور انگلیسی o2، نام o3 برای اون استفاده شده. برخلاف مدلهای قبلی مثل 4o که سریعا جواب میدادن، این مدلها مرحله ای برای تفکر و استدلال دارن که در هنگام جواب دادن به کاربر، مدل برنامه ای برای حل مساله ای که کاربر داده، میسازه و بعد از اون جوابهای مختلف برای حل اون مساله رو بررسی میکنه تا در نهایت به جوابی که از همه بهتره برسه.
در گذشته طراحان مدلها تمام توانشون رو در حین تمرین مدلها (Pre-Training) میذاشتن تا کارایی اونهارو افزایش بدن، ولی این شیوه به دلایل نیاز روزافزون به سخت افزارهای قویتر دیگه مثل سابق اونقدرها که باید توان مدلهارو افزایش نمیده در نتیجه طراحان مدلها از شیوه جدیدی برای تفکر و استدلال مدل در حین اجرا (Post-Training) استفاده میکنن تا کارایی اونهارو بالاتر ببرن.
بدین صورت به مدل در حین اجرا و جواب دادن به درخواستهای کاربر، زمانی برای تفکر داده میشه که باعث افزایش زمان پاسخگویی و منابع موردنیاز میشه، ولی در عوض میتونه سوالات پیچیده و چالشی رو بهتر حل کنه.
نتایج این مدل هم درخشان هستن، در حالی که بقیه مدلها در تست Frontier Math، که شامل سوالات بسیار پیچیده ریاضی هست، فقط امتیاز 2 درصدی کسب کردن، در این o3 امتیاز 25 درصدی رو به دست اورده!
در تست ARC-AGI، که شامل سوالاتی هست که برای انسان به نسبت ساده هستن ولی برای مدلهای هوش مصنوعی سختن، مدل o1 امتیاز 32 درصدی کسب کرده بود ولی حالا o3 رکورد این تست رو شکونده و امتیازی 87.5 درصدی کسب کرده! برای مقایسه امتیاز مدل 4o در این تست 5 درصد و امتیاز انسان در این تست حدود 85 درصد هست.
اما این مدل، مدل بسیار سنگینی هست و تخمین زده میشه که برای حل 100 سوال ARC-AGI، بین نیم تا یک میلیون دلار هزینه اجرای این مدل بوده! این هزینه به مرور زمان پایینتر میاد ولی کماکان هزینه بسیار بالایی هست و به شایعه اشتراک جدید OpenAI که 2000 دلار در ماه قیمت داره، قوت بیشتری میده!
مدل o3 و نسخه سبکتر و سریعتر اون o3-mini در حال حاضر در ازمایشات ایمنی به سر میبرن و مدل مینی احتمالا اوایل سال اینده میلادی به صورت محدود در دسترس کاربران قرار بگیره.
🔎 arstechnica
📍 @TechTube
این دومین مدل از سری o مدلهای متنی OpenAI هست که اصولا باید o2 نام میگرفت، ولی به دلیل تداخل با نام اپراتور انگلیسی o2، نام o3 برای اون استفاده شده. برخلاف مدلهای قبلی مثل 4o که سریعا جواب میدادن، این مدلها مرحله ای برای تفکر و استدلال دارن که در هنگام جواب دادن به کاربر، مدل برنامه ای برای حل مساله ای که کاربر داده، میسازه و بعد از اون جوابهای مختلف برای حل اون مساله رو بررسی میکنه تا در نهایت به جوابی که از همه بهتره برسه.
در گذشته طراحان مدلها تمام توانشون رو در حین تمرین مدلها (Pre-Training) میذاشتن تا کارایی اونهارو افزایش بدن، ولی این شیوه به دلایل نیاز روزافزون به سخت افزارهای قویتر دیگه مثل سابق اونقدرها که باید توان مدلهارو افزایش نمیده در نتیجه طراحان مدلها از شیوه جدیدی برای تفکر و استدلال مدل در حین اجرا (Post-Training) استفاده میکنن تا کارایی اونهارو بالاتر ببرن.
بدین صورت به مدل در حین اجرا و جواب دادن به درخواستهای کاربر، زمانی برای تفکر داده میشه که باعث افزایش زمان پاسخگویی و منابع موردنیاز میشه، ولی در عوض میتونه سوالات پیچیده و چالشی رو بهتر حل کنه.
نتایج این مدل هم درخشان هستن، در حالی که بقیه مدلها در تست Frontier Math، که شامل سوالات بسیار پیچیده ریاضی هست، فقط امتیاز 2 درصدی کسب کردن، در این o3 امتیاز 25 درصدی رو به دست اورده!
در تست ARC-AGI، که شامل سوالاتی هست که برای انسان به نسبت ساده هستن ولی برای مدلهای هوش مصنوعی سختن، مدل o1 امتیاز 32 درصدی کسب کرده بود ولی حالا o3 رکورد این تست رو شکونده و امتیازی 87.5 درصدی کسب کرده! برای مقایسه امتیاز مدل 4o در این تست 5 درصد و امتیاز انسان در این تست حدود 85 درصد هست.
اما این مدل، مدل بسیار سنگینی هست و تخمین زده میشه که برای حل 100 سوال ARC-AGI، بین نیم تا یک میلیون دلار هزینه اجرای این مدل بوده! این هزینه به مرور زمان پایینتر میاد ولی کماکان هزینه بسیار بالایی هست و به شایعه اشتراک جدید OpenAI که 2000 دلار در ماه قیمت داره، قوت بیشتری میده!
مدل o3 و نسخه سبکتر و سریعتر اون o3-mini در حال حاضر در ازمایشات ایمنی به سر میبرن و مدل مینی احتمالا اوایل سال اینده میلادی به صورت محدود در دسترس کاربران قرار بگیره.
🔎 arstechnica
📍 @TechTube