- از آدرس های canonical در اصول کلی نقشه سایت استفاده کنید. به عنوان نمونه اگر آدرسهای با www مد نظر شما است، همه آدرس های نقشه سایت باید با www باشند.
- آدرس ها نباید شامل پارامترهایی مانند session ID که تغییری در محتوای صفحه ایجاد نمی کنند باشند.
- نقشه های سایت بزرگ باید به تکه های کوچک تر تقسیم شوند. حداکثر تعدا URL در یک نقشه سایت تعداد پنجاه هزار آدرس و حداکثر سایز فایل نقشه سایت می تواند ده مگابایت باشد. نقشه های سایت بزرگ را به تکه های کوچک تر تقسیم کنید و به جای یک فایل، چندین فایل نقشه سایت را به موتورهای جستجو معرفی کنید و یا یک نقشه سایت داشته باشید که در آن آدرس سایت مپ هایتان را مشخص کرده باشید.
- فایل نقشه سایت باید به صورت 8-UTF ذخیره باشد.
- نام فایل نقشه سایت و آدرس های URL درون نقشه سایت باید entity escaped باشند و نمی تواند شامل کاراکترهایی مانند * و } و { باشد. اگر نقشه سایت شامل این کاراکترها باشد، در هنگام اضافه کردن آن در گوگل سرچ کنسول با ارور مواجه خواهید شد. در جدول زیر ۵ کاراکتر را می توانید مشاهده کنید که برای استفاده کردن از آنها باید از entity escaped آنها استفاده کنید.
Escaped | Character | |
---|---|---|
;amp& | & | Ampersand |
;apos& | ‘ | Single Quote |
;quot& | “ | Double Quote |
;agt& | < | Greater Than |
;lt& | > | Less Than |
معرفی نقشه سایت به گوگل
جهت معرفی نقشه سایت به گوگل دو روش رایج وجود دارد :
۱- آدرس نقشه (های) سایت را در فایل robots.txt به صورت زیر قرار دهید.
Sitemap: http://www.example.com/sitemap.xml
٢- از طریق بخش crawl در گوگل سرچ کنسول، نقشه سایت را به گوگل معرفی کنید.
تگ های استفاده شده در نقشه سایت
در ایجاد نقشه سایت از تعدادی تگ اجباری جهت مشخص کردن آدرس و تعدادی تگ اختیاری اضافه کردن متادیتا و برخی جزئیات برای موتور جستجو استفاده می شود.
نمونه زیر یک نقشه سایت است که از متادیتا نیز در آن استفاده شده است.
<?"xml version="1.0" encoding="UTF-8?>
<"urlset t-left">
<url>
<loc>http://www.example.com/page1.html</loc>
<lastmod>2016-12-19T13:10:55+03:30</lastmod>
<changefreq>hourly</changefreq>
<priority>0.9</priority>
<url/>
<urlset/>
- استفاده از تگ های <urlset> و <ul> و <loc> اجباری است.
- استفاده از تگ های <lastmod> و <changefreq> و <priority> اختیاری است.
- تگ اجباری <loc> باید با یک پروتکل مانند http یا https شروع شود و حداکثر تعداد کاراکتر مجاز آن ۲۰۴۸ عدد می باشد.
- تگ اختیاری <lastmod> بیانگر زمان آخرین تغییر صفحه است و از استانداردهای زمانی W3C پشتیبانی می کند. به عنوان نمونه فقط می توان تاریخ را مشخص کرد مانند 01-01-2017 و یا علاوه بر تاریخ، زمان دقیق را با مشخص کردن اختلاف زمان نسبت به GMT مشخص کرد مانند: 2017-01-01T22:10:58+03:30
- تگ <Changefreq> می تواند never , yearly , monthly , Weekly , daily , hourly و always باشد. گزینه always هنگامی استفاده می شود که با هر بار باز کردن صفحه، همه یا بخشی از محتوای صفحه تغییر کند. مورد استفاده never نیز برای صفحاتی مانند صفحات آرشیو شده است که قرار نیست که دیگر تغییری بکنند.
- تگ <priority> نیز برای تعیین میزان اهمیت آدرس ها نسبت به یکدیگر استفاده می شود و مقدار آن از 0.1 تا 1.0 می باشد. اگر priority برای یک آدرس در نقشه سایت مشخص نشده باشد، گوگل میزان اهمیت آن را عدد 0.5 در نظر می گیرد.
نقشه سایت عکس
این امکان وجود دارد که نقشه سایت را برای عکس های سایت نیز ایجاد کرد. نقشه سایت زیر یک نمونه از Image sitemap است.
<?"xml version="1.0" encoding="UTF-8?>
"urlset t-left">
<"t-left">
<url>
<loc>http://www.example.com/page1.html</loc>
<image:image>
<image:loc>http://example.com/image.jpg</image:loc>
<image:caption>Image Caption</image:caption>
<image:geo_location>Torento, Canada</image:geo_location&
gt;
<image:title>Image Title</image:title>
<image:image/>
<url/>
<urlset/>
تگ های استفاده شده در نقشه سایت عکس به شرح زیر می باشد :
- استفاده از تگ <loc> اجباری است و حاوی آدرس صفحه ای است که قصد دارید عکس های آن را در نقشه سایت معرفی کنید.
- استفاده از تگ <image:image> اجباری است و حاوی اطلاعات عکس است. هر تگ <loc> می تواند حداکثر ۱۰۰۰ تگ <image:image> داشته باشد.
- استفاده از تگ های <image:caption> و <image:title> اختیاری است و حاوی اطلاعات caption و title عکس است.
- استفاده از تگ <irnage:geo_location> اختیاری است و همانگونه که از نام آن مشخص است، این تگ حاوی موقعیت جغرافیایی عکس است.
- استفاده از تگ <image:license> اختیاری است و حاوی URL لایسنس عکس می باشد.
مطلب قبلی: نقشه سایت چیست؟
مطلب بعدی: فایل robots.txt چیست؟