🎉 سال نو، مهارت نو، مشاوره رایگان نقشه راه برنامه نویسی (آفر ویژه ثبت نام قبل از افزایش قیمت 🔥)
۰ ثانیه
۰ دقیقه
۰ ساعت
۱ Mohammad MohammadAlian
دلیل پیاده سازی HyperLogLog در ردیس
جامعه هوش مصنوعی ایجاد شده در ۱۹ مرداد ۱۴۰۱

سلام، وقتتون بخیر.

امیدوارم حالتون عالی باشه.

الگوریتم HyperLogLog طبق برداشت من برای این استفاده میشه که ما توی یه مجموعه داده بزرگی که داریم بتونیم با یه درصد خطای پایین و مصرف مموری خیلی پایین موارد منحصر به فرد رو پیدا بکنیم.

سوالی که دارم اینه که برای تشخیص دادن اینکه یک مقدار یونیک هست یا نه مگه نباید کل مجموعه‌ای که تا الان insert شده رو داشته باشیم؟ (که بتونیم تشخیص بدیم قبلا این مورد اضافه شده یا نه)

پس چرا ردیس باید این الگوریتم رو داخل خودش پیاده سازی بکنه؟ (ذخیره کردن آیتم‌ها توی مموری خب خیلی هزینه بره و هدف الگوریتمم اینه که با مموری کم اینکار رو انجام بده!)

سلام

ببینید فکر کنید داده‌های شما ۲۰ گیگ دیتا هست و همش توی رم جا گرفته

توی این شرایط استفاده از hypyerLogLog کاملا منطقیه

ولی اگه داده‌ها حجمش کم باشه منطقی نیست و گفته‌ی شما درسته

مسعود کاویانی ۱۹ مرداد ۱۴۰۱، ۲۱:۵۸