14
مارس
غیرفعال

محتوای تکراری چیست و چگونه می‌توان از بروز آن جلوگیری کرد؟

 

سئو و بهینه سازی سایت

سئو

محتوای تکراری چیه و چیجوری میشه از بروز اون جلوگیری کرد؟

رامین محمودی

۸۱

۲۹

۵ ۰۰۰۰

محتوای تکراری یا Duplicate Content محتواییه که بیشتر از یه بار در سایت منتشر می شه. وقتی که تعداد زیادی محتوای به طور کاملً برابر تو یه سایت وجود داشته باشه، اراده کردن واسه موتورهای جستجوگر کمی سخت می شه. در این شرایط موتور جستجوگر نمی تونه تصمیم بگیره کدوم نسخه از محتوا مربوط به کوئری جستجوئه.

اراده کردن

واسه اینکه کاربران تجربه کاریری بهتری داشته باشن، موتورهای جستجوگر با احتمال خیلی کم محتوای تکراری رو نشون میدن و مجبور هستن از بین نسخه های موجود، نسخه اصلی (یا نسخه بهتر) رو پیدا کنن و در اختیار کاربران بذارن.

درسته که وجود محتوای تکراری، سایت رو به گوگل پنالتی دچار نمی کنه، اما می تونه تاثیر بسیار بدی روی رتبه سایت شما داشته باشه.

مشکلاتی که محتوای تکراری بوجود میاره

مشکلات

واسه موتورهای جستجوگر

وجود محتوای تکراری می تونه باعث بروز سه مشکل اساسی واسه موتورهای جستجو شه:

  1. موتورهای جستجوگر نمی دونن چه نسخه ای رو باید از یافته های جستجوی خود حذف کنن یا نمایش بدن.
  2. موتورهای جستجوگر نمی دونن که باید معیارهای مربوط به لینک (مثل اعتماد، Authority، انکر تکست و … ) رو به یه صفحه اختصاص بدن یا اونو بین نسخه های زیادِ محتوا تقسیم کنن.
  3. موتورهای جستجوگر نمی دونن چه نسخه ای رو باید واسه یه کوئری جستجو خاص، رتبه بندی کنن.

واسه صاحبان وب سایتا

وقتی که محتوای تکراری وجود داشته باشه، صاحبان وب سایتا با مشکلاتی مانند از دست دادن ترافیک و افت رتبه سایت در یافته های جستجو روبرو می شن. دو عامل مهم باعث بروز این مشکلات می شن:

  1. جهت ارائه بهترین تجربه کاربری، موتورهای جستجو با احتمال خیلی کم چندین نسخه از یه محتوا رو نمایش میدن. به خاطر همین، موتورهای جستجو مجبور می شن که بهترین نتیجه رو خودشون حدس بزنن. همین موضوع باعث کاهش دیده شدن هر کدوم از صفحات می شه.
  2. توازن لینک دهی به سایت دچار مشکل می شه، چون دیگه وب سایتا هم نمی تونن بین محتواهای برابر شما، فرق قائل شن. اینطوری، به جای اینکه همه لینکا به یه صفحه اشاره کنه، هر لینک به یکی از صفحات شما داده می شه. از اونجایی که لینک بیلدینگ یکی از فاکتورهای مهم رتبه بندی وب سایته، این موضوع در دیدن شدن محتواهای سایت تون در یافته های جستجو تاثیر منفی داره.

، نتیجه چی می شه؟ اینکه یه صفحه از سایت، اون طور که باید دیده نمی شه.

محتوای تکراری چیجوری به وجود میاد؟

در بیشتر موارد، صاحبان سایت از عمد محتوای تکراری ایجاد نمی کنن. اما این موضوع به این معنی نیس که محتوای تکراری در سایت شون وجود نداره. واقعا، اگه بخوایم کمی درباره این قضیه روراست باشیم، باید بگیم که تقریباً ۲۹% از محتوای موجود در اینترنت، محتوای تکراریه.

، در ادامه مقاله عادی ترین روشی که باعث ایجاد محتوای تکراری می شن رو با هم بررسی می کنیم:

متغیرهای نشانی سایت (URL)

پارامترها و متغیرهای مربوط به نشانی سایت مانند فاکتورهایی که واسه پیگیری و ردیابی کلیک و بعضی از کدهای تحلیلی می تونن باعث ایجاد محتوای تکراری در سایت شن. این مشکل نه فقط با حضور پارامترها در ادامه URL به وجود میاد، بلکه ترتیب قرار گرفتن این متغیرها هم در ایجاد محتوای تکراری دخالات داره.

مثلا:

  • نشانی www.widgets.com/blue-widgets?color=blue واقعا، محتوای تکراری نشانی www.widgets.com/blue-widgetsه.
  • یا نشانی www.widgets.com/blue-widgets?color=blue&cat=3 محتوای تکراری نشانی www.widgets.com/blue-widgets?cat=3&color=blueه.

به کار گیری Session ID

Session IDها هم، به طور مشابه، خالق محتوای تکراری هستن. این اتفاق وقتی اتفاق می افته که هر کاربری که از سایت بازدید می کنه، یه Session ID متفاوت دریافت می کنه و این شناسه در نشانی سایت ذخیره می شه.

توانایی پرینت صفحه

صفحاتی که گزینه پرینت رو در اختیار کاربران قرار میدن می تونن باعث ایجاد مشکلات مربوط به محتوای تکراری شن. این موضوع وقتی اتفاق می افته که نسخه های خیلی از یه صفحه ایندکس می شه. اینطوری وقتی که روی این گزینه کلیک می کنین، صفحه ای جدید با نشانی متفاوت و محتوای برابر رو مشاهده می کنین.

روش هدف دار پلیه بین رویا و واقعیت!

مشکلات موجود در HTTP و HTTPS، و صفحات با www و بدون www

اگه سایت تون چند نسخه روی www.example.com و example.com داشته باشه (با و بدون پیشوند www)، و محتوای شما روی هر دو نسخه موجود باشه، باید بدونین که واسه هر کدوم از صفحات سایت خود یه صفحه تکراری ایجاد کردین.

این قانون واسه سایتایی که روی http و https هستن هم صدق می کنه. اگه هر دو نسخه از سایت شما موجود و در موتورهای جستجو قابل دسترس باشه، با مشکل محتوای تکراری روبرو میشین.

محتوای کپی

وقتی از محتوا صحبت می کنیم منظور ما فقط مقالات و پستای وبلاگی سایت تون نیس. سارقان محتوا که پستای وبلاگ شما رو روی سایت خود کپی می کنن هم به عنوان منبعی از محتوای تکرای شناخته می شن. با این حال، یه مشکل عادی واسه سایتای فعال در تجارت الکترونیک هم هست: اطلاعات اجناس.

اگه وب سایتای جور واجور، جنسای برابری رو با اطلاعات برابر واسه فروش در سایت خود بذارن، محتوای مشابه در نقاط جور واجور اینترنت پراکنده می شه.

به دنبال خدمات سئو هستین؟

ما علم لازم واسه افزایش اعتبار و رتبه شما در گوگل رو داریم. پس خوبه با ما تماس بگیرین.
واسه مشاوره رایگان، همین الان با ما تماس بگیرین.

افزایش ترافیک سایت شما

۰۲۱-۶۳۴۰۴داخلی ۳

چیجوری میشه مشکل محتوای تکراری رو برطرف کرد؟

وقتی که محتوای موجود تو یه سایت در آدرسای زیادی یافت شه، باید واسه موتورهای جستجوگر معمولی سازی (Canonicalized) شه. اینک ار رو میشه از راه ریدایرکت ۳۰۱ به نشانی (URL) درست انجام داد. ریدابرکت کردن اینجور صفحه ای از راه تگ rel=canonical یا در بعضی از موارد با به کار گیری وسایل موجود در گوگل وبمستر هم انجام می شه.

ریدایرکت ۳۰۱

در بیشتر موارد بهترین روش واسه مقابله با محتوای تکراری، تنظیم ریدایرکت ۳۰۱ از صفحه شامل محتوای تکراری به صفحه اصلیه. وقتی که صفحات زیاد با پتانسیل رتبه بندی با همدیگه ترکیب می شن، نه فقط با همدیگه رقابت نمی کنن بلکه رابطه عمیق تر و قوی تری با همدیگه ایجاد می کنن و سیگنالای محبوبیت بیشتری واسه موتورهای جستجوگر ارسال می کنن. این موضوع میشه به پیشرفت رتبه شما در یافته های جستجو هم کمک کنه.

به کار گیری تگ “Rel=Canonical”

گزینه دیگه واسه حل مشکل محتوای تکراری به کار بردن تگ “Rel=canonical” است. این تگ مثل ریدایرکت ۳۰۱ قدرتمنده و در بیشتر موارد ایجاد اون به زمان کمتری نیاز داره. تگ “Rel=Canonical” در قسمت هد HTML سایت قرار میگیره.

این تگ متا زیاد هم جدید نیس، اما مثل تگ nofollow، خیلی راحت از پارامترهای rel استفاده می کنه. مثلاً به کد زیر توجه کنین:

<link href="http://www.example.com/canonical-version-of-page/" rel="canonical" />

این تگ به موتورهای جستجوگر بینگ و گوگل میگه که صفحه مورد نظر باید به شکلی رفتار شه که کپی نشانی http://www.example.com/canonical-version-of-page است و همه معیارهای مربوط به لینک و محتوای اونا باید به سمت نشانی جدید منتقل شه.

نمونه های زیر نشون میده که چیجوری خطاهای مربوط به حروف بزرگ، می تونه منتهی به ایجاد محتوای تکراری شه:

  1. http://www.simplyhired.com/a/jobs/list/q-software+developer
  2. http://www.simplyhired.com/a/jobs/list/q-Software+developer
  3. http://www.simplyhired.com/a/jobs/list/q-software+Developer

تنها فرقی که بین این آدرسا هست، بزرگ یا کوچیک نوشته شدن کلمات “software” و “developer” است. موتور جستجوگر، همه این نشانیا رو به عنوان یه صفحه متفاوت می بینه و اونو به عنوان محتوای تکراری می شناسه. با به کار گیری تگ rel=canonical در دومین و سومین مورد و اشاره کردن اون به مورد اول، موتور جستجوگر می دونه که باید با اون دو صفحه تکراری مانند صفحه اول رفتار کنه.

تگ rel=canonical به شکل زیر در هدینگ HTML سایت قرار میگیره.

به کار گیری کد noindex, follow

رباتای متا تگ با مقادیر noindex, follow رو میشه تو یه صفحه مورد استفاده قرار داد. این گزینه نشون میده که صفحه مورد نظر نباید در موتورهای جستجوگر ایندکس شه. اینکار به رباتای موتورهای جستجوگر اجازه میده لینکای موجود در صفحه مشخص شده رو Crawl کنن اما اونو ایندکس نکنن. اینکار با مشکلات مربوط به صفحه بندی کمک می کنه.

باورهای نادرست درباره موتورهای جستجو

مدیریت متغیرها در گوگل وبمستر

گوگل وبمستر تولز به شما اجازه میده دامنه مورد نظر خود رو تنظیم کنین و نسخه های خیلی از پارامترهای URL رو به صورت متفاوت، مدیریت کنین. اصلی ترین عیب این روش اینه که فقط واسه گوگل کار می کنه. هر تغییری که از راه این وسیله انجام می شه تاثیری روی بینگ یا بقیه موتورهای جستجوگر نداره.

این موضوع باید واسه همه سایتا تنظیم شه. این یه روش ساده س! که به گوگل میگه سایت ارائه شده باید به همراه www یا بدون اون در موتورهای جستجوگر نشون داده شه.

روشای دیگه واسه حل مشکل محتوای تکراری

  1. وقتی که در حال لینک سازی داخلی در سایت هستین، پایدار و کامل عمل کنین. مثلا؛ اگه وبمستر تعیین کنه که نسخه معمولی یا همون نسخه canonical یه دامنه به صورت example.com باشه، پس همه لینکای داخلی باید از این روش پیروی کنن (به نبود www در اول نشانی دقت کنین).
  2. در زمان لینک گرفتن واسه صفحه خود دقت کنین که لینک به نشانی اصلی سایت داده شده باشه، نه به یکی از متغیرهای نشانی!
  3. به کار بردن محتوای مشابه در سایت خود رو به کمترین حد ممکن برسونین. مثلا به جای اینکه یه صفحه در مورد “کفش واسه آقایون” و یه صفحه دیگه واسه “کفش واسه بانوان” داشته باشین که ۹۵% محتوای تکراری دارن، تلاش کنین این صفحات رو به یه صفحه واحد تبدیل کنین و همه اطلاعات لازم رو در اون بذارین. هم اینکه، می تونین این صفحات رو به شکلی پیشرفت بدین که شامل محتوای در رابطه و جدا از هم واسه هر URL باشه.
  4. با به کار گیری گزینه noindex, follow، محتوای تکراری رو از موتورهای جستجوگر خط بزنین. شما می تونین این کار رو از راه ربات متا یا وبمستر تولز انجام بدین.

نمونه کد Rel=Canonical

<head> <link rel="canonical" href="https://www.novin.com/blog/" /> </head>

نمونه کد ربات متا

<head> <meta name="robots" content="noindex, follow" /> </head>

نتیجه گیری

همونطور که مشاهده کردین، داشتن محتوای تکراری در سایت می تونه به ضرر رتبه سایت شما در یافته های جستجو باشه. با به کار گیری راهکارهای بالا می تونین خیلی راحت این مشکل رو بر طرف کنین و رتبه خود رو در یافته های جستجو پیشرفت بخشید.

با امید به اینکه خوندن این مقاله براتون به درد بخور بوده باشه. اگه سوالی درباره محتوای تکراری و روشای رفع اون دارین، می تونین از قسما دیدگاه ها سوال خود رو با ما مطرح کنین.

موضوع مرتبطسئو و بهینه سازی سایت