۰ Reza Mobaraki
بررسی بیشتر TF -IDF
جامعه هوش مصنوعی ایجاد شده در ۲۹ بهمن ۱۳۹۹

سلام دوستان وقتتون بخیر

------------------------------------------------------------------------------------------------------------------------------------------------------
من یه سری الگوریتم‌های گفته شده رو توی این جلسه بررسی کردم. 
این مبحث درسی مربوط به بازیابی اطلاعات هستش . 
شما میتونید برای عمیق شدن توی مطالب جلسه به کتاب introduction to information retrieval مراجعه کنید .

------------------------------------------------------------------------------------------------------------------------------------------------------

dft تعداد اسنادی است که شامل کلمه t هستند.

هر چه df یک کلمه بیشتر باشد بار اطلاعاتی آن کمتر است.

dft <= N

 بنابراین ما معکوس df را به عنوان امتیاز کلمه در نظر میگیریم.

idf=log (N/df)

ما از لگاریتم (log (N/dft بجای N/dft به منظور متعادل کردن تاثیر ( idf ) استفاده میکنیم.

N = تعداد کل اسناد موجود در مجموعه

------------------------------------------------------------------------------------------------------------------------------------------------------

همچنین برای دانلود اسلاید هایی فارسی شده این کتاب روی این لینک کلیک نمایید.


موفق باشید??