با سلام
از اونجایی که one hot encoding برای ویژگی با کاردینالیتی بالا باعث ایجاد ستونهای زیاد میشه و ابعاد دیتا ست رو بالا میبره و از طرفی label encoding هم الگوریتمهای رگرسیون رو به اشتباه میندازه ، شما برای این جور موارد که نمونه هاش هم تو واقعیت کم نیستند (مثل ویژگی آدرس تو دیتاست مسکن تهران) چه روش هایی و پیشنهاد میدین ؟ (آیا تو دوره علم داده این مورد کامل توضیح داده شده ؟ )