شرکت OpenAI امشب در آخرین روز از «۱۲ روز با OpenAI» از مدل o3 رونمایی کردن. این مدل به حدی قوی بوده که در بنچمارکهای ARC-AGI که یک بنچمارک برای وظایفی که از یک AGI انتظار میره هست، تونسته به 83% برسه. درحالی که مدل o1 فقط به 13درصد رسیده بود. از طرفی هنوز در بعضی از تسکهای این بنچمارک ضعفهایی رو نشون داده که نشوندهنده راه دراز برای رسیدن به یک AGI کامل هست اما بسیار پیشرفت چشمگیریه. این مدل به ریتینگ 2727 کدفرسز رسیده که این یعنی رتبه 175م این سایت، به طوری که از 99.9% انسانهای فعلی بهتر میتونه سوالات این سایت رو حل کنه. نسخه mini این مدل در اواخر ماه بعد عرضه خواهد شد.
tweet
@SEYED_BAX | @geekalerts
tweet
@SEYED_BAX | @geekalerts