📝 محققان دیپمایند گوگل روشی جدید برای آموزش مدلهای هوش مصنوعی پیشنهاد میدهند
مدلهای جدید مانند o1 و o3 از شرکت OpenAI از روش جدیدی برای پاسخ به درخواستهای کاربران استفاده میکنند که به آن پردازش زمان آموزش یا استدلال (test-time or inference-time compute) میگویند.
در این روش، هوش مصنوعی درخواستهای شما را به بخشهای کوچکتری تقسیم و هرکدام را به پرامپت جدیدی تبدیل میکند. هر مرحله نیاز به اجرای درخواست جدیدی دارد که مرحله استنتاج در هوش مصنوعی شناخته میشود. این امر زنجیرهای از استدلالها را ایجاد میکند که در آن هر بخش از مسئله حل میشود. مدل تا زمانی که هر قسمت را حل نکند و بتواند درنهایت پاسخ نهایی بهتری ارائه بدهد، به مرحله بعدی نمیرود.
طبق بنچمارکهای منتشرشده مدلهای جدید اغلب، بهویژه درمورد سؤالات ریاضی، خروجیهای بهتری نسبت به مدلهای قبلی تولید میکنند. محققان میگویند این خروجیهای باکیفیت میتوانند همان دادههای آموزشی جدید باشند.
📖 مجله هوش مصنوعی
➖➖➖➖➖
🆔 : @HomeAI
💟 : instagram.com/homeai.ir
مدلهای جدید مانند o1 و o3 از شرکت OpenAI از روش جدیدی برای پاسخ به درخواستهای کاربران استفاده میکنند که به آن پردازش زمان آموزش یا استدلال (test-time or inference-time compute) میگویند.
در این روش، هوش مصنوعی درخواستهای شما را به بخشهای کوچکتری تقسیم و هرکدام را به پرامپت جدیدی تبدیل میکند. هر مرحله نیاز به اجرای درخواست جدیدی دارد که مرحله استنتاج در هوش مصنوعی شناخته میشود. این امر زنجیرهای از استدلالها را ایجاد میکند که در آن هر بخش از مسئله حل میشود. مدل تا زمانی که هر قسمت را حل نکند و بتواند درنهایت پاسخ نهایی بهتری ارائه بدهد، به مرحله بعدی نمیرود.
طبق بنچمارکهای منتشرشده مدلهای جدید اغلب، بهویژه درمورد سؤالات ریاضی، خروجیهای بهتری نسبت به مدلهای قبلی تولید میکنند. محققان میگویند این خروجیهای باکیفیت میتوانند همان دادههای آموزشی جدید باشند.
📖 مجله هوش مصنوعی
➖➖➖➖➖
🆔 : @HomeAI
💟 : instagram.com/homeai.ir