ارائهی دکتر سلیمانی - سوی تعمیمپذیری خارج از توزیع
160 بار بازدید -
2 سال پیش
-
موضوع : سوی تعمیمپذیری خارج
موضوع : سوی تعمیمپذیری خارج از توزیع
سخنران: دکتر مهدیه سلیمانی
۳۰ آذر ۱۴۰۱
چکیده:
چکیده:
به تازگی مدلهای بنیادین عظیم (مانند GPT3 ، CLIP و DALL-E2) از حجم بالای داده جهت تعمیم در دامنه یادگیری بهره میبرند. با این حال، این مدلها در تعمیم خارج از توزیع، شامل دادههای مرتبط با آموزش با توزیع متفاوت، از مشکلات زیادی رنج میبرند. در این سخنرانی، به برخی از این نقاط ضعف اشاره میشود و سوگیریهای قیاسی معرفی میشوند که به نظر میرسد در سطوح بالاتر تعمیمپذیری و هوشمندی مفید هستند. به عنوان نمونه، با الهام از سیستم شناختی انسان، معماریهای تنکتر و پیمانهایتر اجازه یادگیری دانش و مکانیزمهای قابل بازاستفاده را میدهند. به علاوه، یادگیری نمایش علی، نیز در یادگیری مدلهای مقاوم در برابر تغییرات دنیای واقعی در توزیع موثر هستند. این سوگیریهای قیاسی نه تنها باعث بهبود تعمیم خارج از توزیع میشوند، بلکه مقیاسپذیری و تفسیرپذیری مدلها را نیز بهبود میدهند.
2 سال پیش
در تاریخ 1401/10/02 منتشر شده
است.
160
بـار بازدید شده