سلام دوستان وقتتون بخیر
------------------------------------------------------------------------------------------------------------------------------------------------------
من یه سری الگوریتمهای گفته شده رو توی این جلسه بررسی کردم.
این مبحث درسی مربوط به بازیابی اطلاعات هستش .
شما میتونید برای عمیق شدن توی مطالب جلسه به کتاب introduction to information retrieval مراجعه کنید .
------------------------------------------------------------------------------------------------------------------------------------------------------
dft تعداد اسنادی است که شامل کلمه t هستند.
هر چه df یک کلمه بیشتر باشد بار اطلاعاتی آن کمتر است.
dft <= N
بنابراین ما معکوس df را به عنوان امتیاز کلمه در نظر میگیریم.
idf=log (N/df)
ما از لگاریتم (log (N/dft بجای N/dft به منظور متعادل کردن تاثیر ( idf ) استفاده میکنیم.
N = تعداد کل اسناد موجود در مجموعه
------------------------------------------------------------------------------------------------------------------------------------------------------
همچنین برای دانلود اسلاید هایی فارسی شده این کتاب روی این لینک کلیک نمایید.
موفق باشید??