Dummy, Ordinal, Standardization
89 بار بازدید -
پارسال
-
در این آموزش، ما روی
در این آموزش، ما روی مجموعه داده سرطان پروستات کار کردهایم و یک مدل رگرسیون خطی ساده روی آن اجرا کردهایم، در کنار آن مقادیر ترتیبی، مقادیر باینری , مشکل مقیاس داده ها و در نهایت نحوه محاسبه Z-score بررسی شدهاند.
اصلاحیه:
تفاوت استاندارد سازی و نرمال سازی داده ها:
نرمالسازی دادهها یک تکنیک استفاده شده برای مقیاس دهی دادهها بین ۰ و ۱، که در آن ۰ بیانگر حداقل مقدار در دادهها و ۱ بیانگر بیشینه مقدار در دادهها است. این تکنیک زمانی کاربردی است که دامنه مقادیر دادهها بسیار گسترده است و میخواهیم مقادیر را به یک محدوده کوچکتر تغییر دهیم.
از سوی دیگر، استانداردسازی یک تکنیک استفاده شده برای تبدیل دادهها به گونهای که میانگین آنها صفر و واریانس آنها ثابت باشد. این تکنیک زمانی کاربردی است که محدوده مقادیر دادهها بسیار گسترده است و میخواهیم مطمئن شویم که مقادیر در حدود صفر متمرکز شده و دارای مقیاس مشابهی باشند.
در کل، نرمالسازی زمانی مورد استفاده قرار میگیرد که توزیع دادهها شناخته نشده باشد یا زمانی که توزیع گوسی نباشد، در حالی که استانداردسازی زمانی کاربرد دارد که توزیع دادهها گوسی باشد و یا در زمانی که توزیع را نشناسیم اما میخواهیم به همه ویژگیها اهمیت یکسانی بدهیم.
پارسال
در تاریخ 1402/01/22 منتشر شده
است.
89
بـار بازدید شده