فایل Robots.txt چیست

سلام خیلی خوش امدید به سئو بلک در این مطلب قصد داریم راجب موضوع ها ی فایل Robots.txt چیست و مثال هایی از فایل robots.txt وچرا باید از آن استفاده کرد؟

صحبت کنیم تا انتها با سئو بلک همراه باشید.

همانطور که همه‌ی ما می‌دانیم
، ربات‌های موتورهای جستجو پررنگ‌ترین نقش ممکن برای معرفی کامل یک سایت به موتورهای جستجو را ایفا می‌کنند.
گوگل به عنوان بزرگترین مرجع و گسترده‌ترین شبکه در این زمینه، ربات‌های اختصاصی و عمومی زیادی گسترش داده است.
وب‌مسترهای موفق همواره عملکرد و تغییرات این ربات‌ها را دنبال کرده و مطابق با استانداردهای آنان پیشروی می‌کنند.

فایل Robots.txt چیست

اما این ربات‌ها به چه صورت به سایت‌های گوناگون دسترسی پیدا می‌کنند؟
چطور می‌توان دسترسی این ربات‌ها به محتوا یا صفحات خاصی از سایتمان را محدود کنیم
یا به آن‌ها دسترسی کامل بدهیم؟ برای این مورد، تکنیکی ساده و در عین حال فوق‌العاده مهم و حیاتی وجود دارد. این تکنیک، استفاده از یک فایل متنی موسوم به Robots.txt است که با کمک آن و درج دستورات تحت وب می‌توان کارهای مختلفی از جمله ایجاد دسترسی یا محدودسازی ربات موتورهای جستجو را انجام داد.

اهمیت و بهینه‌سازی این فایل می‌تواند نقش بسیار مفیدی در پیشرفت سایت اینترنتی شما داشته باشد و درست برعکس، بی‌توجهی و بی‌دقتی در کار با آن، ممکن است به راحتی رتبه سایت شما را چندین برابر بدتر کند. ما در این مقاله قصد داریم تا شما را با ماهیت فایل‌های Robots.txt آشنا کرده و اهمیت بسیار زیاد آن‌ها برای کسب موفقیت بهتر در فرآیندهای سئو به شما بازگو کنیم.

بیشتر بدانید: موتورهای جستجو چگونه کار می‌کنند؟

بیشتر بدانید:

مختص شما:  کد 203 http

فایل Robots.txt چیست؟

یک Robots.txt درواقع یک فایل متنی ساده است که در مسیر اصلی فضای سایت شما یا روت دایرکتوری (Root Directory) قرار می‌گیرد. در حقیقت وظیفه این فایل معرفی بخش‌های قابل دسترسی و بخش‌های محدود شده برای دسترسی ربات‌ها یا با تعریفی دقیق‌تر، خزندگان سطح وب (Web Crawlers) که از سوی موتورهای جستجو به منظور بررسی و ثبت اطلاعات سایت‌ها ایجاد شده اند می‌باشد.

با درج دستوراتی خاص در این فایل، شما می‌توانید به ربات‌های موتورهای جستجو بگوئید که کدام صفحات، کدام فایل‌ها و کدام بخش‌های سایت شما را دیده و آن‌ها را ایندکس کنند و کدام صفحات را نادیده بگیرند. به عبارت دیگر، اولین چیزی که ربات‌های موتورهای جستجو با آن برخورد می‌کنند، همین فایل Robots.txt است. به محض رویارویی با این فایل، خزندگان سطح وب شروع به بررسی محتوا و لیست داخل این فایل کرده تا بخش‌های قابل دسترسی را پیدا کنند.

فایل Robots.txt چیست

همانطور که گفته شد، این فایل باید در روت اصلی هاست شما قرار بگیرد. در این حالت آدرس دسترسی به این فایل به صورت زیر خواهد بود :

www.YourWebsite.com/robots.txt

مثال هایی از فایل robots.txt و فایل Robots.txt چیست

در ادامه مثال هایی را از فایل robots.txt برایتان آماده کرده ایم. دقت داشته باشید که این فایل در مسیر روت سایت یعنی آدرس www.example.com/robots.txt قرار دارد.

جلوگیری از دسترسی تمام پایشگر ها به کل وب سایت:

User-agent: *

Disallow: /

این دستورات در فایل robots.txt به تمام پایشگرهای وب اعلام می کند که هیچ صفحه ای در دامنه www.example.com را پایش نکنند.

دسترسی دادن به تمام صفحات سایت به تمام پایشگرها:

مختص شما:  کد 206 http

User-agent: *

Disallow:

این دستورات در فایل robots.txt به تمام پایشگرهای وب اعلام می کند که می توانند تمام صفحات دامنه www.example.com را پایش کنند.

بلاک کردن دسترسی یک پایشگر به خصوص از یک فولدر مشخص:

User-agent: Googlebot

Disallow: /example-subfolder/

این دستورات به پایشگر Googlebot (ربات پایشگر گوگل) اعلام می کند که یو آر ال های شامل www.example.com/example-subfolder/ پایش نکند.

بلاک کردن دسترسی یک پایشگر به خصوص از یک صفحه وب مشخص:

User-agent: Bingbot

Disallow: /example-subfolder/blocked-page.html

این دستورات به پایشگر Bingbot (ربات پایشگر بینگ) اعلام می کند که صرفا یو آر ال www.example.com/example-subfolder/blocked-page.html را پایش نکند.

برای ایجاد و تست این فایل میتوانید از google webmasters tools استفاده کنید. گوگل وب مستر تولز ابزاری با عنوان robots.txt testing tool ارائه داده است که به شما کمک میکند فایل robots.txt را به آسانی ایجاد و تست کنید.

این ابزار در بخش crawl گوگل وب مستر تولز قابل مشاهده میباشد. در این قسمت شما میتوانید فایلی که با عنوان robots.txt وجود دارد را بررسی کنید، اطلاعات این فایل را تغییر داده و یا توسط این ابزار آنها را چک کنید. توجه کنید که پس از اعمال تغییرات لازم است فایل تغییر یافته را در سرور خود آپلود نمایید تا تاثیرات آن در سایت شما ظاهر شود.

فایل Robots.txt چیست

چرا باید از آن استفاده کرد؟

مونطور که در عکس بالا میبینید ، در سایتی که از فایل robot.txt استفاده نشده باشه روبات‌های موتورهای جستجو همه ی صفحات رو ایندکس می‌کنند در صورتی که با استفاده از این فایل میشه این ایندکس شدنها رو برای پوشه‌های مختلف کنترل کرد ! از این فایل همچنین برای جلوگیری از ایندکس شدن تکراری صفحات با url‌های مختلف استفاده میشه . :: خوب حالا که فهمیدید دلیل استفاده از فایل مهم robot.txt چی هست ، نحوه استفاده از اون رو براتون توضیح میدیم : فایل robot.txt یک فایل متنی ساده (دقیقا با همین نام و پسوند txt) است . در زیر چند تا از مهمترین دستوراتی که توی این فایل می‌تونید بیارید آوردم .

مختص شما:  جریمه الگوریتم پنگوئن گوگل

ممنون از این که با ما همراه بودید

کلیک کنید و رای بدهید
[Total: Average: ]

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

تبلیغات در گوگل چیست x بخوانید...