آیا میتوان برای بررسی نویزی بودن دادهها از توابع توزیع برنولی و باینومیال مشابه تابع توزیع نرمال که استفاده کردید استفاده کرد ؟ یا این دو تابع توزیع برای بررسی دادههای مربوط به یک سری دادههای خاص بکار میرود که بسته به نوع کاربرد دارد؟
در قسمت پیشپردازش و outlier detection به این موضوع خواهیم پرداخت. پاسخ کوتاه این است که در کل میتوان از هر نوع توزیعی برای بررسی دادههای نویزی استفاده کرد
برای مثال اگر برخی از دادههای ما توزیع مورد نظر را به هم میریختند، میتوان آنها را حذف کرد و نویز در نظر گرفت. اما این کار نیاز به تستهایی دارد چون ممکن است همان دادهها، دادههای مفیدی نیز باشند