🎉 سال نو، مهارت نو، مشاوره رایگان نقشه راه برنامه نویسی (آفر ویژه ثبت نام قبل از افزایش قیمت 🔥)
۰ ثانیه
۰ دقیقه
۰ ساعت
۱ سجاد طهماسبی
اینکودینگ برای ویژگی با کاردینالیتی بالا
جامعه هوش مصنوعی ایجاد شده در ۰۷ مرداد ۱۴۰۲

با سلام

از اونجایی که one hot encoding برای ویژگی با کاردینالیتی بالا باعث ایجاد ستون‌های زیاد میشه و ابعاد دیتا ست رو بالا میبره و از طرفی label encoding هم الگوریتم‌های رگرسیون رو به اشتباه میندازه ، شما برای این جور موارد که نمونه هاش هم تو واقعیت کم نیستند (مثل ویژگی آدرس تو دیتاست مسکن تهران) چه روش هایی و پیشنهاد میدین ؟ (آیا تو دوره علم داده این مورد کامل توضیح داده شده ؟ )

سلام

الگوریتم‌های جدید توانایی کار با داده‌هایی با ابعاد بالا را دارند ولی برای هر مورد بستگی به مسئله میشه از ویژگی‌هایی عددی به جای ویژگی‌های غیرعددی استفاده کرد

برای مثال به جای کدپستی می‌تواند lat و lang جغرافیایی را قرار داد

بهترین پاسخ
مسعود کاویانی ۱۷ مرداد ۱۴۰۲، ۱۷:۲۸