در بحث آماده سازی دادهها متغیر هایی باید انتخاب بشود که قابل تکرار هستند که بتوان از آنها نکته ای دریافت کرد اما متغیر هایی که این ویژگی را ندارند کارایی برای الگوریتم ندارند
به عنوان مثال ستونهای تاریخ ایجاد یا تاریخ پایان یا ستونهای شناسه ای یا....
اما نکته ای که در این جا وجود دارد این است که میتوان چندین ستون بی فایده را به گونه ای با یکدیگر ترکیب کرد که بتوان یک یا چند ستون با مقادیری تکراری ایجاد نمود که توجه به این نکته از اهمیت بالایی برخوردار است .