یادگیری تقویتی - جلسه چهارم (روشهای Value Iteration و Policy Iteration )

محمدحسین رهبان
محمدحسین رهبان
557 بار بازدید - 4 ماه پیش - مباحث این جلسه به روشهای
مباحث این جلسه به روشهای Value Iteration و Policy Iteration و اثبات همگرائی آنها اختصاص دارد.
4 ماه پیش در تاریخ 1402/12/18 منتشر شده است.
557 بـار بازدید شده
... بیشتر