متد جدیدی که در این کار ارایه شده بسیار حائز اهمیته و به مدلهای زبانی اجازه میده تا خودشون رو بهبود بدن. این به معنای کاهش وابستگی به دادههای آموزشیه که یکی از چالشهای اصلی در توسعه مدلهای زبانی این روزهاست
این روش شبیه به نحوه عملکرد AlphaZero هست. Demis Hassabis نیز مدتیه در مورد ترکیب بازی خودکار با مدلهای زبانی بزرگ صحبت میکنه. نکات ارزشمندی رد و بدل میشه
https://youtu.be/eqXfhejDeqA?feature=shared
این روش شبیه به نحوه عملکرد AlphaZero هست. Demis Hassabis نیز مدتیه در مورد ترکیب بازی خودکار با مدلهای زبانی بزرگ صحبت میکنه. نکات ارزشمندی رد و بدل میشه
https://youtu.be/eqXfhejDeqA?feature=shared