ستروکیت
Page Loder

آیا می‌دانید موتورهای جستجویی مانند گوگل، چگونه در بین میلیون‌ها صفحه وب سایتی که وجود دارند، به جستجو در بین آن‌ها می‌پردازند و به آن‌ها امتیاز می‌دهند، تا بتوانند به ازای پرس و جو که شما تایپ می‌کنید نتایجی را برای شما به نمایش بگذارند؟

با اینکه جزییات این فرآیند بسیار پیچیده می‌باشد، اما دانستن اطلاعات پایه درباره چگونگی خزیدن و جستجو بین سایت‌ها، فهرست کردن (index) آن‌‌ها و چگونگی امتیازدهی به آن‌ها می‌تواند به شما پیش‌زمینه‌ای درباره استراتژی‌های بکار گرفته شده در پشت صحنه هر موتور جستجو بدهد.

تعهدی عظیم

در حال حاضر که این مقاله نوشته می‌شود، گوگل اظهار می‌کند بیش از ۱۳۰ تریلیون صفحه وب را در این راستا می‌شناسد البته ممکن است خیلی بیشتر از این عدد نیز باشد. صفحات بسیاری وجود دارند که بنابه دلایلی گوگل آن‌ها را کنار گذاشته و عملیات جستجو، نشانه‌گذاری و امتیازدهی را بر روی آ‌ن‌ها انجام نمی‌دهد.
از آنجایی که موتورهای جستجو همانند گوگل سعی دارند نتایجی مرتبط با درخواست‌های کاربران خود را ارائه دهند، برای آن‌ها فرآیندهای لازم به خوبی تعریف شده‌اند تا قادر باشند بهترین صفحات وب را با توجه به پرسش تایپ شده کاربران خود ارائه دهند.
این فرآیندها در طول زمان تکامل یافته تا بتوانند نتایجی هر چه بهتر را فراهم کنند.
برای آشکار شدن این موضوع ما تلاش کردیم تا بتوانیم به سوال زیر پاسخ بدهیم:
- نتایج جستجوی گوگل چگونه کار می‌کنند؟
بطور خلاصه این فرآیند شامل مراحل زیر خواهد بود:
- خزیدن و جستجو کردن: دنبال کردن لینک‌ها جهت یافتن صفحات مهم در وب
- فهرست کردن: ذخیره کردن کلیه اطلاعات مربوط به صفحات وب بدست آمده برای رجوع‌های بعدی
- امتیازدهی: مشخص کردن آن‌که هریک از آن صفحات وب درباره چه موضوعی هستند و چگونه به آن‌ها امتیاز بدهد تا در نتایج درخواست‌های مرتبط ظاهر شوند.
اجازه بدهید به توضیح واضح‌تری برای هریک از مراحل گفته‌شده بپردازیم:


خزیدن و جستجو کردن دربین صفحات وب

موتورهای جستجو دارای ربات‌هایی تحت عنوان "خزنده” می‌باشند که وظیفه آن‌ها خزیدن در بین صفحات وب و تشخیص بهترین صفحات وب موجود برای ارزیابی پرسش و جوی کاربران می‌باشد.
روش کار این خزنده یا بهتر بگوییم مسیر پیمایش این خزنده لینک‌های یک وب‌سایت خواهند بود.
لینک‌های وب سایت، صفحات وب سایت را کنار یکدیگر نگه می‌دارند. وب سایت‌ها در سراسر وب، مسیری را با توجه به لینک‌های خود بوجود می‌آورند که خزنده می‌تواند به کمک پیمایش این مسیر به میلیون‌ها صفحه وب‌سایت متصل بهم، دست‌یابد.
نظرتون درباره یک مثال تصویری چیه؟
در شکل زیر شما می‌توانید تصویری از صفحه نخست وب‌سایت ستروکیت را ببینید.


زمانی که ربات خزنده به این صفحه نگاه می‌کند، به مدل شیء گرای سند(‌DOM) در هر صفحه نگاهی می‌اندازد تا بفهمد این صفحات شامل چه می‌شوند؟ مدل‌های شئ‌گرای هر صفحه وب کدهای HTML و JAVA SCRIPT آن می‌باشند که خزنده آن‌ها را بررسی می‌کند تا بتواند لینک‌های صفحات دیگر را بیابد.
مثالی از این مطلب در کادر قرمزرنگ تصویر بالا نشان داده‌شده‌است. این روند به ربات‌های خزنده اجازه خواهد داد تا بتوانند صفحات جدید وب را پیدا کنند و هر لینک جدیدی که در این روند جستجو یافت شود در داخل صفی در داخل پایگاه داده آن‌ها قرار خواهد گرفت تا بعدا توسط خزنده‌ها بازدید شوند.
خزیدن روزانه در بین صفحات وب، تعهد و عملکرد بسیار سنگینی است، از این‌رو گوگل خزنده‌های خود را در طول هفته‌ها در بین صفحات وب پخش می‌کند. بعلاوه موتورهای جستجویی همانند گوگل، همان طور که در ابتدای مقاله گفته شد تمام صفحات وب یا بهتر بگوییم هر صفحه موجود در وب را مورد جستجو قرار نخواهد داد.
در عوض آن‌ها کار خود را با مجموعه‌ای از وب‌سایت‌های قابل اعتماد شروع خواهند کرد و آن‌ها را مبنایی برای سنجش دیگر وب‌سایت‌ها قرار خواهند داد و با بازدید از لینک‌های آن‌ها، خزندگان خود را در بین وب گسترش خواهند داد.


ایندکس داده‌ها

ایندکس کردن به معنای ذخیره اطلاعاتی مربوط به یک صفحه وب در فهرست موتور جستجو می‌باشد. ایندکس، مجموعه‌ای از صفحات وب – پایگاه داده – است که شامل اطلاعاتی در مورد کلیه صفحاتی که توسط خزنده‌ها مورد بررسی قرار گرفته‌اند می‌باشد.
ساختار و سازمان ایندکس:
- اطلاعات دقیق درمورد ماهیت هر محتوا و ارتباط موضوعی هر صفحه وب
- نقشه ای از تمام صفحاتی که هر صفحه به آن‌ها لینک شده‌است
- نوشته‌هایی که لینک شده‌اند
- اطلاعاتی بیشتر در مورد لینک‌ها، آیا آن‌ها تبلیغ هستند یا خیر، آن‌ها در کدام بخش از صفحه قرار گرفته‌اند، صفحه‌ای که در ازای لینک به‌ آن میرسیم چه مضمون و مفهومی دارد.
و خیلی مطالب بیشتر …
ایندکس بانک اطلاعاتی هر موتور جستجو همانند گوگل است که زمانی که کاربران پرس و جویی را در آن‌ها تایپ می‌کنند، اطلاعات را از آن بازیابی خواهند کرد.
قبل از اینکه موتور جستجو تصمیم بگیرد چه ایندکسی و طبق چه ترتیبی برای کاربر نمایش داده‌شود، الگوریتمی را اجرا خواهد کرد که به امتیاز دهی آن صفحات وب کمک خواهد کرد.


امتیاز دهی نتایج

به منظور نمایش نهایی نتایج موتورهای جستجو، موتورهای جستجو باید چند گام مهم را انجام دهند:
۱ – تفسیر قصد پرس و جوی کاربر
۲- تشخیص صفحات وب ایندکس شده که باپرس و جوی کاربر مرتبط هستند
۳- امتیازدهی آن صفحات وب با توجه به اهمیت و ارتباط آن‌‌ها
این‌جا یکی از بخش‌های بزرگی‌ است که بحث بهینه‌سازی موتورهای جستجو به میان می‌آید. سئوی خوب و تاثیر گذار به اهمیت و ارتباط آن‌ها برای پرسش مطرح شده کمک زیادی خواهد کرد.
ارتباط و اهمیت به چه معناست؟
ارتباط:
به درجه‌ای از تطابق محتویات یک صفحه وب با منظور جستجوکننده ارتباط می‌گویند. (قصد و منظور در واقع آن چیزی است که کاربر قصد دارد آن را توسط این جستجو به انجام برساند که انجام این وظیفه برای موتورهای جستجو اصلا وظیفه کوچکی نیست )
اهمیت:
صفحات وبی پر اهمیت می‌باشند که در جاهای بیشتری ذکر شده‌باشند. (یا به عبارتی قرارگیری صفحات وب می‌تواند رای اعتمادی برای آن‌ها باشد.) معمولا این اهمیت توسط لینک‌هایی که به آن صفحه داده شده‌اند جلوه می‌کند اما باید درنظر داشت که عوامل دیگری نیز وجود دارند که می‌توانند نقش بسیار مهمی را در این موضوع ایفا کنند.
برای اینکه موتورهای جستجو بتوانند میزان اهمیت و ارتباط صفحات وب را با پرسش مطرح شده تعیین کنند، الگوریتم‌های بسیار پیچیده‌ای را بکارمی‌گیرند که با بررسی صدها معیار این درجه اهمیت و ارتباط را مشخص می‌کنند.
معمولا این الگوریتم‌ها نحوه عملکرد موتورهای جستجو را تغییر می‌دهند تا روند دستیابی آن‌ها به نتایجی بهتر برای کاربرانشان را بهبود بخشند. حتی اگر آن‌‌ها مدام در حال بهینه سازی باشند بازهم برخی از اصولی که موتورهای جستجو بدنبال آن هستند به خوبی درک شده‌اند.
اگرچه ما از لیست تمام معیارهایی که موتورهای جستجویی همانند گوگل در الگوریتم‌های خود بکار گرفته‌اند بی خبریم (که البته این محافظت بسیار خوبی است تا اسپمرها نتوانند سیستم جستجو را بازی دهند) اما موتورهای جستجو برخی از دانش‌های اصولی در این زمینه را منتشر کرده‌اند که ما می‌توانیم با بکارگیری آن‌ها به بروزترین استراتژی‌های بهینه سازی موتور‌های جستجو (SEO) دست‌یابیم.

نوشتن دیدگاه

ورود به پنل کاربری
09127107851
setrokate_support