استاد در الگوریتم خوشه بندی ما هیچ شناختی از داده ورودی نداریم ولی اینجا دیدیم که الگوریتم LOF برای کارکرد صحیح نیاز به تنظیم پارامتر contamination داشت. این خودش تناقض نیست؟
سلام
درسته که نداریم، ولی contamination یک نوع راهنمایی کم به الگوریتم است
معمولاً هیچ شناختی صحیح نیست چون بلاخره دادهها را داریم و میتوانیم اطلاعات آماری از دادهها داشته باشیم
میتوانیم یک مجموعهی کم از دادهها را به صورت دستی طبقهبندی کنیم و بعد از آن مثلاً ببینیم چند درصد از دادهها نویز هستند تا مقدار contamination را به صورت حدودی محاسبه کرده باشیم