بهترین روش برای یافتن داده noise بین استفاده از IQR یا Z-Score
ایجاد شده در ۰۴ بهمن ۱۴۰۳
دادههای noise رو بر اساس کدوم پیدا کنیم بهتره؟ IQR یا Z-Score؟
جواب سوال رو با کمک copilot به این شکل بدست اوردم گفتم برای بقیه هم بذارم (البته دوست دارم استاد و سایر دوستان هم جواب بدند که مطمئن بشم) : پیدا کردن دادههای نویزی: IQR یا Z-Score؟ انتخاب بین IQR (Interquartile Range) و Z-Score به توزیع دادهها و شرایط شما بستگی دارد:
IQR برای شناسایی نویز در دادههایی که توزیع نرمال ندارند بهتر است، چون به میانه و چارکها وابسته است.
Z-Score برای دادههای نرمال مناسبتر است، چون بر اساس میانگین و انحراف معیار محاسبه میشود.
دانیال حاجی رجبی۰۴ بهمن ۱۴۰۳، ۲۲:۰۶
اگر تعداد دادههای نویز زیاد نباشد و یا کل دادهها (به جز دادههای نویز) نرمال باشند، از Z-Score استفاده میشود. در غیر این صورت (یعنی از یکی از دو شرط بالا برقرار نباشد) عموما از روش IQR استفاده میشود