تا حالا فکر کردی چطوری گوگل میتونه تو چند ثانیه بهترین و مرتبطترین نتایج جستجو رو بهت نشون بده؟ راز این کار تو یه الگوریتم جذاب به اسم PageRank هست. PageRank که توسط دو نابغهی گوگل، لری پیج و سرگئی برین، تو سال 1997 ساخته شد، نه تنها کمک کرد گوگل از بقیه رقبا جلو بزنه، بلکه اینترنت رو هم به یه جای کارآمدتر و مرتبتر تبدیل کرد. تو این مقاله، قراره به جزئیات و نحوهی کار PageRank بپردازیم و نشون بدیم چطور این الگوریتم با ارزیابی لینکها و محتوا، رتبهبندی سایتها رو بهبود میده و هنوز هم تو دنیای سئو نقش مهمی داره. اگه کنجکاوی بدونی این فناوری شگفتانگیز چطوری کار میکنه و چه تاثیری رو تجربه کاربریت داره، با ما همراه باش تا یه نگاه دقیقتر به دنیای جذاب PageRank بندازیم.
PageRank (PR) یه الگوریتم جذاب و کارآمد گوگله که وبسایتها رو تو نتایج جستجو رتبهبندی میکنه. این کار رو با بررسی تعداد و کیفیت لینکهایی که به یه صفحه میخورن، انجام میده. ایدهش اینه که هر چی یه صفحه لینکهای بیشتری از سایتهای معتبر بگیره، مهمتر و معتبرتره و به همین خاطر تو نتایج جستجو بالاتر میاد.
PageRank رو همون بنیانگذاران گوگل، Sergey Brin و Larry Page تو سال ۱۹۹۷ وقتی تو دانشگاه استنفورد بودن، خلق کردن. اسمش هم یه جور بازی با کلمات بوده؛ هم به لری پیج اشاره داره و هم به "صفحه وب" یا همون "webpage".
بیایید با یه مثال ساده بگم. فرض کن تو مدرسهای که هر کسی که محبوبتره، بیشتر مورد توجه قرار میگیره. PageRank هم دقیقاً همینطوری کار میکنه. صفحههایی که لینکهای بیشتری از سایتهای معتبر دارن، محبوبتر و مهمتر به حساب میان. درست مثل یه مجله علمی که هرچی بیشتر بهش ارجاع بدن، معتبرتره. ولی یه تفاوت کوچیک داره؛ PageRank ارزش بعضی لینکها رو بیشتر از بقیه در نظر میگیره.
استفاده از لینکها به همراه محتوای صفحهها باعث شد که نتایج جستجوی گوگل از رقباش خیلی بهتر باشه. لینکها شدن واحد پول اینترنت!
تو دنیای سئوی مدرن، PageRank یکی از اون الگوریتمهاییه که تجربه، تخصص، اعتبار و اعتماد (E-E-A-T) رو شامل میشه. الگوریتمهای گوگل سیگنالهایی رو شناسایی میکنن که با اعتماد و اعتبار صفحات ارتباط دارن. معروفترین این سیگنالها PageRank هست که از لینکهای وب برای فهمیدن اعتبار صفحات استفاده میکنه.
حتی نمایندههای گوگل مثل Gary Illyes هم تایید کردن که PageRank هنوزم استفاده میشه و لینکها برای E-A-T (که حالا شده E-E-A-T) مهم هستن.
وقتی من یه مطالعه انجام دادم که تاثیر لینکها رو اندازه بگیرم و لینکها رو با ابزار disavow حذف کردم، افت رتبه به وضوح مشخص شد. لینکها هنوز برای رتبهبندی اهمیت دارن.
PageRank روی بودجه خزش (crawl budget) گوگل هم تاثیر داره. منطقیه که گوگل بخواد صفحات مهم رو بیشتر بخزه. علاوه بر این، PageRank یه سیگنال برای نشانهگذاری هم هست. صفحاتی که PageRank بالاتری دارن، احتمال بیشتری داره که به عنوان نسخه اصلی که ایندکس و به کاربران نمایش داده میشه، انتخاب بشن.
یه حقیقت جالب: فرمولی که تو مقاله اصلی PageRank منتشر شد، اشتباه بود. بیا ببینیم چرا.
PageRank تو مقاله اصلی به عنوان یه توزیع احتمالاتی توضیح داده شده بود - یعنی احتمال اینکه شما تو هر صفحهای از وب باشید. این یعنی اگه PageRank همه صفحات وب رو با هم جمع کنی، باید جمعشون بشه 1.
این فرمول کامل PageRank تو مقاله سال 1997 بود:
PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))
بیایید یه ذره سادهترش کنیم. فرض کنیم فاکتور کاهشی (d) همونطور که گوگل تو مقاله گفت، 0.85 باشه (بعداً توضیح میدم فاکتور کاهشی چیه)، فرمول میشه:
PageRank for a page = 0.15 + 0.85 (a portion of the PageRank of each linking page split across its outbound links)
تو مقاله گفته شده بود که جمع PageRank همه صفحات باید برابر 1 باشه. ولی این امکانپذیر نیست اگه از فرمول تو مقاله استفاده کنیم. هر صفحه حداقل PageRankش 0.15 (1-d) میشد. چندتا صفحه کافی بود تا جمع کل بیشتر از 1 بشه. نمیتونیم احتمال بیشتر از 100% داشته باشیم. پس یه چیزی اشتباهه!
فرمول در واقع باید اون (1-d) رو بر تعداد صفحات اینترنت تقسیم کنه تا به درستی کار کنه. باید اینجوری باشه:
PageRank for a page = (0.15/number of pages on the internet) + 0.85 (a portion of the PageRank of each linking page split across its outbound links)
1. یه صفحه یه امتیاز اولیه PageRank بر اساس لینکهایی که بهش اشاره میکنن میگیره. فرض کن پنج صفحه داریم که هیچ لینکی ندارن. هرکدوم PageRank (1/5) یا 0.2 میگیرن.
2. این امتیاز بعداً از طریق لینکهای روی صفحه به صفحات دیگه توزیع میشه. اگه چندتا لینک به اون پنج صفحه اضافه کنیم و PageRank جدید رو محاسبه کنیم، به این نتیجه میرسیم:
3. این محاسبات همونطور که گوگل وب رو میخزه، تکرار میشن. اگه دوباره PageRank رو حساب کنیم (که بهش iteration میگن)، میبینی که امتیازها تغییر میکنن. همون صفحات با همون لینکها، ولی PageRank اولیه هر صفحه تغییر کرده، پس PageRank نهایی هم متفاوته.
فرمول PageRank یه چیزی به نام “فاکتور کاهشی” هم داره، همون “d” تو فرمول، که شبیهسازی احتمال کاربر عادی برای ادامه کلیک روی لینکها وقتی که وب رو میگرده، هست.
فکر کن اینجوریه: احتمال اینکه شما روی لینک اولین صفحهای که بازدید میکنید کلیک کنید، نسبتاً زیاده. ولی احتمال اینکه بعد از اون روی لینک صفحه بعدی کلیک کنید، یکم کمتره و همینطور ادامه داره.
اگه یه صفحه قوی مستقیماً به یه صفحه دیگه لینک بده، کلی ارزش منتقل میکنه. ولی اگه لینک چهار کلیک دورتر باشه، ارزشی که از اون صفحه قوی منتقل میشه به خاطر فاکتور کاهشی خیلی کمتر میشه.
اولین پتنت PageRank در 9 ژانویه 1998 ثبت شد. عنوانش بود "روش رتبهبندی نود در یک پایگاه داده متصل". این پتنت در 9 ژانویه 2018 منقضی شد و تمدید نشد.
گوگل اولین بار PageRank رو وقتی دایرکتوری گوگل رو در 15 مارس 2000 راه اندازی کرد، عمومی کرد. این نسخهای از پروژه دایرکتوری باز بود ولی بر اساس PageRank مرتب شده بود. دایرکتوری در 25 ژوئیه 2011 بسته شد.
در 11 دسامبر 2000 بود که گوگل PageRank رو تو نوار ابزار گوگل راه اندازی کرد، که نسخهای بود که بیشتر متخصصین سئو بهش وسواس داشتن.
PageRank تو نوار ابزار آخرین بار در 6 دسامبر 2013 به روز شد و در 7 مارس 2016 حذف شد.
PageRank تو نوار ابزار کمی متفاوت بود. از یه سیستم شماره گذاری ساده 0-10 برای نمایش PageRank استفاده میکرد. ولی PageRank خودش یه مقیاس لگاریتمی بود که رسیدن به هر عدد بالاتر به طور فزایندهای سختتر میشد.
PageRank حتی تو نقشه سایتهای گوگل (که حالا به عنوان کنسول جستجوی گوگل شناخته میشه) در 17 نوامبر 2005 راه پیدا کرد. تو دستههای بالا، متوسط، پایین یا N/A نمایش داده میشد. این ویژگی در 15 اکتبر 2009 حذف شد.
با گذشت زمان، روشهای زیادی برای سوءاستفاده از سیستم به دنبال PageRank بیشتر و رتبههای بهتر وجود داشت. گوگل یه لیست کامل از طرحهای لینک داره که شامل موارد زیر میشه:
سیستمهای مقابله با اسپم لینکها در طول سالها تکامل پیدا کردن. بیایید به برخی از بهروزرسانیهای اصلی نگاهی بندازیم.
در 18 ژانویه 2005، گوگل اعلام کرد که با سایر موتورهای جستجوی بزرگ همکاری کرده تا ویژگی rel=“nofollow” رو معرفی کنه. این ویژگی کاربران رو تشویق میکرد تا ویژگی nofollow رو به نظرات وبلاگ، ترکبکها و لیستهای ارجاع اضافه کنن تا به مقابله با اسپم کمک کنه.
این قسمتی از بیانیه رسمی گوگل در مورد معرفی nofollow هست:
"اگه شما یک بلاگر (یا خواننده وبلاگ) هستید، با افرادی که سعی میکنن رتبه وبسایتشون رو با ارسال نظرات وبلاگ لینکشده مثل "از سایت داروی ارزان من دیدن کنید" افزایش بدن، دردسر دارین. این به نام نظر اسپم شناخته میشه، ما هم ازش خوشمون نمیاد، و ما یه تگ جدید رو آزمایش کردیم که اینو مسدود میکنه. از حالا، وقتی گوگل ویژگی rel=“nofollow” رو روی لینکها ببینه، اون لینکها هیچ اعتباری وقتی که ما وبسایتها رو تو نتایج جستجو رتبهبندی میکنیم، نخواهند داشت."
تقریباً همه سیستمهای مدرن از ویژگی nofollow روی لینکهای نظرات وبلاگ استفاده میکنن.
حتی متخصصین سئو هم شروع به سوءاستفاده از nofollow کردن - چون معلومه که این کار رو میکنیم. nofollow برای صفحهبندی PageRank استفاده میشد، جایی که افراد بعضی از لینکهای روی صفحاتشون رو nofollow میکردن تا لینکهای دیگه قویتر بشن. گوگل نهایتاً سیستم رو تغییر داد تا از این سوءاستفاده جلوگیری کنه.
در سال 2009، مت کاتس از گوگل تأیید کرد که این کار دیگه جواب نمیده و PageRank بین لینکها توزیع میشه حتی اگه ویژگی nofollow وجود داشته باشه (ولی فقط از طریق لینکهای دنبال شده عبور میکنه).
گوگل چند ویژگی لینک دیگه که نسخههای خاصتر ویژگی nofollow هستن رو در 10 سپتامبر 2019 اضافه کرد. این شامل rel=“ugc” برای شناسایی محتوای تولید شده توسط کاربر و rel=“sponsored” برای شناسایی لینکهایی که پرداخت شده یا وابسته بودن، بود.
همانطور که متخصصین سئو روشهای جدیدی برای بازی کردن با لینکها پیدا کردن، گوگل روی الگوریتمهای جدیدی برای شناسایی این اسپم کار کرد.
وقتی الگوریتم اصلی پنگوئن در 24 آوریل 2012 راه اندازی شد، به خیلی از وبسایتها و صاحبان سایت آسیب زد. در همون سال، گوگل با معرفی ابزار disavow در 16 اکتبر 2012، به صاحبان سایت راهی برای بازیابی ارائه داد.
وقتی پنگوئن 4.0 در 23 سپتامبر 2016 راه اندازی شد، تغییری خوشایند تو نحوه برخورد گوگل با اسپم لینکها به ارمغان آورد. به جای آسیب زدن به وبسایتها، شروع به بیارزش کردن لینکهای اسپم کرد. این همچنین به این معنی بود که بیشتر سایتها دیگه نیازی به استفاده از ابزار disavow نداشتن.
گوگل اولین بهروزرسانی اسپم لینک خودش رو در 26 ژوئیه 2021 راه اندازی کرد. این بهتازگی تکامل پیدا کرده، و یک بهروزرسانی اسپم لینک در 14 دسامبر 2022 اعلام کرد که از یک سیستم تشخیص مبتنی بر هوش مصنوعی به نام SpamBrain برای خنثی کردن ارزش لینکهای غیرطبیعی استفاده میکنه.
خب، PageRank اصلی دیگه از سال ۲۰۰۶ استفاده نشده، اینو یه کارمند سابق گوگل گفته. اونا اون سال PageRank رو با یه الگوریتم دیگه عوض کردن که منابع کمتری مصرف میکنه و تقریباً همون نتایج رو میده.
در سال ۲۰۰۶، گوگل یه الگوریتم جدید جایگزین کرد که تقریباً نتایج مشابهی میده ولی خیلی سریعتر محاسبه میشه. این الگوریتم جایگزین، همون عددی رو تولید میکنه که تو نوار ابزار گوگل نمایش داده میشد و گوگل بهش PageRank میگه (اسم این الگوریتم هم شبیه PageRank هست، بنابراین از نظر فنی ادعای گوگل درست هست). هر دو الگوریتم O(N log N) هستن ولی الگوریتم جدید ضریب خیلی کمتری تو عامل log N داره، چون دیگه نیازی به تکرار تا همگرایی الگوریتم نداره. این نکته مهمیه چون وب از ~۱-۱۰ میلیون صفحه به ۱۵۰ میلیارد صفحه و بیشتر رشد کرده.
یادت میاد اون تکرارها و چطور PageRank با هر تکرار تغییر میکرد؟ انگار گوگل این سیستم رو سادهتر کرده.
به جای اینکه PageRank به طور مساوی بین همه لینکهای یه صفحه تقسیم بشه، بعضی لینکها ارزش بیشتری دارن. از پتنتها حدس زده میشه که گوگل از مدل کاربر تصادفی (که کاربر ممکنه به هر لینکی بره) به مدل کاربر منطقی (که بعضی لینکها احتمال بیشتری دارن که کلیک بشن و پس وزن بیشتری دارن) تغییر داده.
سیستمهای مختلفی برای نادیده گرفتن ارزش بعضی لینکها به کار گرفته شده. چندتا از اینا رو قبلاً گفتیم، مثل:
گوگل همچنین لینکهای صفحاتی رو که توسط robots.txt مسدود شدن، حساب نمیکنه. نمیتونه این صفحات رو بخزه و لینکهاشون رو ببینه. احتمالاً این سیستم از اول هم وجود داشته.
گوگل یه سیستم canonicalization داره که کمک میکنه نسخهای از یه صفحه رو که باید ایندکس بشه تعیین کنه و سیگنالهای صفحات تکراری رو به اون نسخه اصلی منتقل کنه.
عناصر لینک canonical در ۱۲ فوریه ۲۰۰۹ معرفی شدن و به کاربران اجازه میدن نسخه مورد نظرشون رو مشخص کنن.
در ابتدا گفته میشد که ریدایرکتها همون مقدار PageRank رو انتقال میدن که یه لینک انتقال میده. ولی در یه نقطهای، این سیستم تغییر کرد و الان هیچ PageRankی از دست نمیره.
وقتی صفحات به عنوان noindex علامتگذاری میشن، دقیقاً نمیدونیم گوگل چطور با لینکهاشون برخورد میکنه. حتی خود گوگلیها هم اظهارات متناقض دارن.
طبق گفته جان مولر، صفحاتی که به عنوان noindex علامتگذاری میشن، نهایتاً به عنوان noindex, nofollow رفتار میشن. این یعنی لینکهاشون نهایتاً هیچ ارزشی منتقل نمیکنن.
طبق گفته گری، گوگلبات تا زمانی که صفحهای هنوز لینکهایی بهش داره، لینکها رو کشف و دنبال میکنه.
این اظهارات لزوماً متناقض نیستن. ولی اگه به گفته گری توجه کنیم، ممکنه زمان زیادی طول بکشه تا گوگل خزیدن و شمارش لینکها رو متوقف کنه - شاید هم هیچ وقت.
الان هیچ راهی برای دیدن PageRank گوگل وجود نداره. اما یه معیار جایگزین خوب برای PageRank وجود داره به نام URL Rating (UR). UR خیلی شبیه به PageRank هست و قدرت پروفایل لینکهای یه صفحه رو تو یه مقیاس ۱۰۰ نمرهای نشون میده. هر چی عدد بزرگتر باشه، پروفایل لینک قویتره.
PageRank و UR هر دو موقع محاسبه، لینکهای داخلی و خارجی رو در نظر میگیرن. اما خیلی از معیارهای قدرت دیگه که تو این صنعت استفاده میشن، لینکهای داخلی رو کلاً نادیده میگیرن. من پیشنهاد میکنم سازندگان لینک به جای معیارهایی مثل DR که فقط لینکهای از سایتهای دیگه رو در نظر میگیره، بیشتر به UR توجه کنن.
UR همه لینکها رو در نظر نمیگیره و لینکهای nofollow رو حساب نمیکنه. ما دقیقاً نمیدونیم گوگل چه لینکهایی رو نادیده میگیره و نمیدونیم چه لینکهایی توسط کاربران disavow شدن، که این موارد روی محاسبه PageRank گوگل تاثیر میذاره. همچنین ممکنه تصمیمات متفاوتی در مورد چگونگی برخورد با برخی از سیگنالهای canonicalization مثل عناصر لینک canonical و ریدایرکتها بگیریم.
پس توصیه ما اینه که از UR استفاده کنی، ولی بدون که دقیقاً مثل سیستم گوگل نیست.
چون PageRank بر اساس لینکهاست، برای افزایش PageRankت باید لینکهای بهتری بگیری. بیا چندتا راهکار رو بررسی کنیم.
ریدایرکت کردن صفحات قدیمی سایتت به صفحات جدید و مرتبط میتونه سیگنالهایی مثل PageRank رو بازیابی و یکپارچه کنه. سایتها به مرور زمان تغییر میکنن و خیلی از مردم به درستی ریدایرکتها رو اجرا نمیکنن. این شاید راحتترین راه باشه، چون این لینکها قبلاً به تو اشاره داشتن ولی الان حساب نمیشن.
اینجوری میتونی اون فرصتها رو پیدا کنی:
اون صفحات رو بگیر و به صفحات فعلی سایتت ریدایرکت کن.
بکلینکها همیشه تحت کنترل تو نیستن. مردم میتونن به هر صفحهای از سایتت که بخوان لینک بدن و هر متن لنگری که دوست دارن استفاده کنن.
اما لینکهای داخلی فرق دارن. تو کنترل کامل روی اونا داری.
جایی که منطقیه لینک داخلی بذار. مثلاً شاید بخوای به صفحاتی که برات مهمتر هستن بیشتر لینک بدی.
تو میتونی لینکهای بیشتری از سایتهای دیگه به سایت خودت بگیری تا PageRankت رو افزایش بدی.
PageRank صفحات وب رو بر اساس تعداد و کیفیت لینکهای ورودیشون رتبهبندی میکنه.
بله، ولی دیگه تنها عامل رتبهبندی صفحات وب نیست. گوگل از الگوریتمهای دیگهای هم استفاده میکنه.
ایجاد محتوای باکیفیت، دریافت لینکهای معتبر از سایتهای دیگه و رعایت اصول سئو میتونه بهت کمک کنه.
نه، گوگل از عوامل دیگهای مثل کیفیت محتوا، سرعت سایت و تجربه کاربری هم استفاده میکنه.
گوگل PageRank صفحات وب رو عمومی نمیکنه، ولی میتونی از ابزارهای سئوی مختلف برای بررسی رتبه سایتت استفاده کنی.
Google PageRank یه الگوریتم قدرتمند و تاثیرگذار تو دنیای اینترنت بود که به ما کمک کرد تا به راحتی و با سرعت اطلاعات درست و حسابی رو پیدا کنیم. بدون PageRank، اینترنت ممکنه یه دنیای پر از اطلاعات نادرست و بیکیفیت میشد. پس اگه دفعه بعدی دیدی که گوگل تو چند ثانیه بهت جواب درست میده، یادت باشه که این جادوی PageRank و هوش نابغههایی مثل لری پیج و سرگئی برین بود که این کار رو ممکن کردن.
هر چقدر هم که الگوریتمها و فناوریها پیشرفت کنن، همیشه باید به یاد داشته باشیم که این انسانها بودن که با خلاقیت و تلاششون دنیای ما رو اینقدر جذاب و قابل دسترس کردن. پس همیشه به دنبال یادگیری و پیشرفت باش و دنیای خودت رو تغییر بده.