یادگیری تقویتی - جلسه چهارم (روشهای Value Iteration و Policy Iteration )
557 بار بازدید -
4 ماه پیش
-
مباحث این جلسه به روشهای
مباحث این جلسه به روشهای Value Iteration و Policy Iteration و اثبات همگرائی آنها اختصاص دارد.
4 ماه پیش
در تاریخ 1402/12/18 منتشر شده
است.
557
بـار بازدید شده