با سلام اگر دادههای جدیدی برای پردیکت داشته باشیم که در متن انها کلماتی وجود داشته باشند که مدل اولیه ما وجود نداشته باشند قطعا مدل به ارور میخورد چون فچیرهای دادههایترین با دادههای پردیکت متفاوت است رفع و هندل این موضوع در تکست ماینیگ بسیار پیچیده میشود چون تعداد فیچرها بسیار بالا است کم و زیاد بودن یک فیچر میتونه ما رو به بن بست برسونه به نظرم در موضوع تکست ماینیگ حداقل به یک آموزش دیگه برای روشن شدن قضیه نیازمنده چون در دنیای واقعی پردیکت فقط بر اساس دادههای تست انجام نمیشه هدف اینکه دادههای واقعی پیش بینی بشه لطفا درباره این موضوع چگونه فیت کردن دادههای متفاوت با دادههایترین یک اموزش ساخته شود سپاس