Dummy, Ordinal, Standardization

2aegh
2aegh
89 بار بازدید - پارسال - در این آموزش، ما روی
در این آموزش، ما روی مجموعه داده سرطان پروستات کار کرده‌ایم و یک مدل رگرسیون خطی ساده روی آن اجرا کرده‌ایم، در کنار آن مقادیر ترتیبی، مقادیر باینری , مشکل مقیاس داده ها و در نهایت نحوه محاسبه Z-score بررسی شده‌اند. اصلاحیه: تفاوت استاندارد سازی و نرمال سازی داده ها: نرمال‌سازی داده‌ها یک تکنیک استفاده شده برای مقیاس دهی داده‌ها بین ۰ و ۱، که در آن ۰ بیانگر حداقل مقدار در داده‌ها و ۱ بیانگر بیشینه مقدار در داده‌ها است. این تکنیک زمانی کاربردی است که دامنه مقادیر داده‌ها بسیار گسترده است و می‌خواهیم مقادیر را به یک محدوده کوچک‌تر تغییر دهیم. از سوی دیگر، استانداردسازی یک تکنیک استفاده شده برای تبدیل داده‌ها به گونه‌ای که میانگین آن‌ها صفر و واریانس آن‌ها ثابت باشد. این تکنیک زمانی کاربردی است که محدوده مقادیر داده‌ها بسیار گسترده است و می‌خواهیم مطمئن شویم که مقادیر در حدود صفر متمرکز شده و دارای مقیاس مشابهی باشند. در کل، نرمال‌سازی زمانی مورد استفاده قرار می‌گیرد که توزیع داده‌ها شناخته نشده باشد یا زمانی که توزیع گوسی نباشد، در حالی که استانداردسازی زمانی کاربرد دارد که توزیع داده‌ها گوسی باشد و یا در زمانی که توزیع را نشناسیم اما می‌خواهیم به همه ویژگی‌ها اهمیت یکسانی بدهیم.
پارسال در تاریخ 1402/01/22 منتشر شده است.
89 بـار بازدید شده
... بیشتر