🎉 سال نو، مهارت نو، مشاوره رایگان نقشه راه برنامه نویسی (آفر ویژه ثبت نام قبل از افزایش قیمت 🔥)
۰ ثانیه
۰ دقیقه
۰ ساعت
۱ وحید فرجی
تفاوت عدد مربوط به correlation با عدد بدست آمده برای Feature Importance
جامعه هوش مصنوعی ایجاد شده در ۱۲ اردیبهشت ۱۴۰۲

سلام و عرض ادب

ببخشید بیشترین همبستگی (correlation) بین ستون کنسل کردن و ستون مربوط به deposit_type_non_refund بود. اما زمان استفاده Feature Importance، ستون Leading time از بیشترین اهمیت برای داده وابسته کنسلی هتل برخوردار بود. خواستم اگر امکانش باشه تفاوت مفهومی این دوتا را توضیح بدهید.

البته از نظر منطقی هم نباید زمانی که امکان بازگشت ودیعه وجود نداره تعداد کنسلی‌ها بالا باشه و برعکسش منطقی‌تر به نظر میرسه

سلام سلامت باشید

همبستگی میزان رابطه‌ی خطی (linear) را نشان می‌دهد در حالی که الگوریتم xgboost یک الگوریتم قدرتمند غیر خطی است که می‌تواند رابطه‌های غیر خطی را نیز درک کند. برای همین با توجه به رابطه‌ی غیر خطی گفته است که deposit_type_non_refund اهمیت بالایی دارد

بهترین پاسخ
مسعود کاویانی ۱۷ اردیبهشت ۱۴۰۲، ۲۰:۰۴