Home > Web

Spam Report from Google Webmaster Tools

28. November 2009

گزارش اسپم به گوگل

google-webmaster-spam چندی پیش در فرندفید بحثی در راستای برخی سایتهای فارسی شد که با ساختن محتوای نامربوط و گول زدن سرچ انجین ها مثل گوگل، در نتایج جستجوی برخی کلمات، رتبه بالایی پیدا کرده‌اند و در واقع به نوعی در حال اسپم کردن گوگل هستند. (در این زمینه این پست ار وبلاگ میلاد را بخوانید)

این نوع سایتها در واقع یا از خودشون چیزی ندارند و یا مطالب دیگر وبسایتها را کپی برداری کرده و با ایجاد کلمات کلیدی گوناگون و نامربوط به سایتشون، رتبه خودشون رو در گوگل بالا می‌برند، بنابراین هنگام سرچ کردن، نتیجه اول تا پنجم می‌آیند و با کلیک کردن یوزر روی لینک اونها، این رتبه بالاتر هم میره.

سایتهای آگهی را هم به این گروه اضافه کنید که با این روش سعی در بالابردن رنک خود در گوگل شده تا با استناد به رتبه خودشون، بتونن یوزر ها رو تشویق به تبلیغ در سایت خودشون بکنن. البته همه سایت های تبلیغاتی این گونه نیستند و استثنا هم وجود دارد.

سرویس سرچ و ایندکس کردن گوگل، تا حدود زیادی میتونه جلوی اسپم رو بگیره و تشخیص بده که سایتی که قراره ایندکس کنه، جزو اسپمرها محسوب میشه یا نه. اما رشد قارچ گونه این سرویس ها، بعضی وقت ها گوگل رو هم دچار مشکل میکنه.

در همین راستا گوگل از همه یوزرهاش دعوت میکنه که توسط فرمی که در سایتش گذاشته، این موارد اسپم رو بهش معرفی کنند که این مورد در پست میلاد کاملا توضیح داده شده.

در وبلاگ های فارسی کمتر به موضوعاتی مثل اسپم، اشاره شده برای همین فکر کردم یک سری توضیحات در مورد انواع اسپم از دید گوگل که البته یک سری مفاهیم جامع هستند، بتونه فایده داشته باشه. شاید که برخی از این موارد در مورد سایت شما هم صدق کنه در حالی که نمیدونید با این کار دارید اسپم میکنید و دیر یا زود در لیست سیاه سرچ انجین ها قرار خواهید گرفت.

در فرمی که در سایت گوگل وجود داره، از شما خواسته شده که نوع اسپمی که دارید گزارش میکنید هم مشخص کنید که توضیح هر مورد رو در ادامه میارم:

 

Hidden text or links

وقتی که گوگل به صفحه شما سر میزنه که اون رو برای خودش ذخیره کنه و در سرچ از اون استفاده کنه، طرح گرافیکی که بقیه آدم ها میبینن رو نمیبینه. به زبون خیلی ساده، اون در واقع سورس صفحه رو میبینه. حالا فرض کنیم که یک سایت با زمینه سفید، شروع به نوشتن ده ها و صد ها کلمه با رنگ سفید در انتهای صفحه بکنه. در واقع با این کار کلمات کلیدی سایت رو به تعداد زیادی به گوگل نشون بده.

من و شما که به سایت میریم این کلمات رو نمیبینیم چون همرنگ زمینه هست و بعضا با فونت خیلی خیلی ریز. اما گوگل که به این سایت میاد، این کلمات رو میتونه در سورس صفحه ببینه و اونها رو به عنوان کلمات کلیدی این سایت، ذخیره کنه که نتیجه ای جز جواب اشتباه دادن به جستجوی مرتبط نداره.

ممکنه برخی “متخصصین” دیگر اعلام کنند که در تگ متا در بالای صفحه این صد کلمه رو قرار میدیم و اینجوری مشکل قانونی هم وجود نداره. خدمت اون دسته هم باید عرض کنم که گوگل و یاهو که دیگه به این تگ دقت نمیکنند و دیگر سرچ انجین ها هم که دقت میکنند، اگر تعداد کلمه های این تگ زیاد باشند، ازش میگذرند و توجهی نمیکنند. بنابراین فقط “کلیدی ترین” کلمات رو در این تگ قرار بدید.

<meta name="keywords" content="کلمه های مهم و کلیدی شما">

 

Misleading or repeated words

این مورد در سایتهایی که در زمینه آگهی های اینترنتی هستند و ماشاالله کم هم نیستند، بسیار واضح دیده میشه. اسکریپتی که برای این مدل سایت ها استفاده میشه، در هر آگهی که مشتریان در سایت وارد کرده‌اند کلماتی رو به صورت کاملا آشکار و با عنوان جستجوهای مرتبط با صفحه اضافه میکنه که کاملا مشخص هست که این کار برای گول زدن سرچ انجین هست و عنوان “بر چسب” یا تگ برای این کار به هیچ وجه قابل قبول نیست. چون اولا تگ برای یک موضوع به مفهوم کلمات کلیدی اون مضوع هست و دوما تعداد این کلمات کلیدی چهار تا، پنج تا خیلی دیگه اصرار کنی ده تا میتونه باشه! نه اینکه برای یک محصول که فرضا دی وی دی یانگو قسمت 18 هست، شما بیای و براش تگ بذاری: جومونگ، لاست، پشت صحنه امپراطور دریا، اوشین… به این صورت شما داری حقه میزنی، پس حقته که گوگل هم شما رو در لیست سیاه قرار بده. و یا مورد دیگه ای که کاملا میشه مشاهده کرد استفاده از کلمات تکراریه که حتی استفاده از تگ های h1 تا h6 هم در دستور کار قرار گرفته تا از این حربه سئو، بر ضد خودش استفاده بشه که به این صورت گوگل فکر کنه این کلمه در متن شما اهمیت زیادی داره و رنک اون رو بالا ببره:

payamsara

 

Page does not match Google's description

در نهایت وقتی با هر روشی، گوگل فریب خورد و آنچه گوگل در مورد یک سایت اعلام میکنه در نتایج جستجو، به اون سایت ربطی نداشته باشه، میشه نتیجه گرفت که سایت مور نظر، خطایی مرتکب شده که میتونه منجر به حذفش ار فهرست گوگل بشه.

 

Cloaked page

برخی از متخصصین روشهای پیچیده تر و نوین تری اختراع کردند. فرض کنید سایتی بسازید که من به عنوان یک یوزر اون رو یه جور ببینم، اما گوگل که سر میزنه به این سایت، اون رو یه جور دیگه ببینه!
این کار در پشت صحنه اتفاق میوفته. صفحه شما تشخیص میده که درخواستی که ازش شده توسط انسان بوده یا سرچ انجین. در صورت مواجهه شدن با سرچ انجین، به اون یک لیست بلند بالا از بهترین کلمات کلیدی رو نشون میده و کلمات زیادی رو بار این مامور سرچ میکنه. سرچ انجین هم از همه جا بیخبر، کل این لیست رو به نام این سایت ثبت میکنه. من این مورد رو در ایران ندیدم جایی انجام بده.(البته خوشبختانه) اما در خارج ایران شرکت هایی هستند که این کار رو انجام میدن و کارشون رو هم توجیه میکنن. اما دقت کنید، گوگل به طور صریح اعلام کرده این کار ممنوع میباشد!

 

Deceptive redirects

وقتی یک صفحه رو به جایی ریدایرکت میکنیم، یعنی توسط کدنویسی، بازدید کننده اون صفحه رو به جایی دیگر منتقل میکنیم. این انتقال چند مدل داره. یک مدل اون کد 302 هست که به درخواست پاسخ میده که “این صفحه موقتا منتقل شده و ممکن است در آینده خود این صفحه، حاوی مطالب باشد” حالا فرض کنید سایتی، یکی از صفحات خود را بر روی سایت دیگری که رتبه خیلی خوبی در گوگل دارد، انتقال 302 بدهد. گوگل هم منتقل میشود اما از آنجا که انتقال موقتی هست، فکر میکند صفحه جدید جایگزین موقتی برای سایت است بنابراین اطلاعات صفحه جدید را به نام سایت متقلب ثبت میکند.

نوع دیگر این نوع تقلب، استفاده از انواع تکنیک ها مثل RSS reader یا استفاده از فریم و آی‌فریم برای خواندن مطالب سایتهای دیگر و استفاده آنها در سایت خود است تا از ارزشی که گوگل برای اون مطالب اعمال میکنه، سایت متقلب هم شریک بشه. به هر حال این روش هر چه هست، همون دزدی مطلب به زبون عامیانه خودمون هست. این کار، وجدانی، قانونی(کپی رایت) و گوگلی! ممنوعه و جزو راه های اسپم شناخته میشه.

 

Doorway pages

یکی دیگر از مواردی که برخی شرکتهای فعال در امر سئو، به انجام اون مشغول هستند و برای خودشون توجیه هم میارن، استفاده از صفحات واسطه برای لینک دادن به صفحه اصلی و مورد نظر هست. صفحاتی که صرفا برای سرچ انجین ها ساخته میشوند و دارای لینکهایی به صفحات اصلی سایت هستند.

این صفحان واسطه در نقشه سایت وجود ندارند و شما هیچ گاه اونها رو نمیتونید در منوهای سایت پیدا کنید. این صفحات تنها به گوگل معرفی میشوند و به خاطر داشتن کلمات کاربردی و کلیدی، میتوانند رتبه خود را در جستجو افزایش دهند و با لینکی که به صفحه اصلی دارند، بازدید کننده رو به سایت اصلی هدایت کنند. توجیه شرکتهایی که این کار رو برای مشتری هاشون انجام میدهند اینه که دسترسی به سورس اصلی صفحات ندارند و بنابراین تمیتوانند بهینه سازی را در خورد صفحات انجام دهند. بنا براین از صفحات واسطه استفاده میکنند. اما گوگل این کار رو هم جزو اسپم حساب میکنه.

نوع دیگر این روش اسپم استفاده از ساب دامین به عنوان کلمه کاربردی هست. مثل keyword1.domain.com another-keyword.domain.com این مدل آدرسها به صورت داینامیک توسط سرور سایت ساخته میشوند و در واقع وجود فیزیکی ندارند. گوگل بسیاری از این مدل اسپم رو در سالهای اخیر شناسایی کرده و حذف کرده، اما همچنان میشه این مورد رو دید. نمونه این مدل اسپم رو میشه در همین اسکریپت های رایج برای ساختن سیستم های آگهی فارسی پیدا کرد. این حرکت نیز اسپم میباشد و ممنوع.

 

Duplicate site or pages

گوگل به شدت مخالف مطالب تکراری در سایت های اینترنتی هست. نه فقط مطالب، حتی اگر <title> صفحات هم مثل هم باشه، اون رو به عنوان فاکتور منفی حساب میکنه. بنابراین اصلا به دنبال این نباشید که صفحات تکراری داشته باشید که حجم مطالب رو بالا ببرید یا از اون بدتر،  چند سایت با یک مضمون با مثلا طراحی مختلف داشته باشید که گوگل رو گول بزنید! یا خودش میفهمه یا کسی پیدا میشه که شما رو گزارش بده. در نهایت شما اسپمر شناخته میشوید!

نکته: برای گزارش اسپم به گوگل، حتما از فرم موجود در قسمت وبمستر تولز اقدام کنید چون به گفته خود گوگل، گزارش های ارسالی از این فرم بسیار سریع تر از فرم همگانی گوگل، مورد بررسی قرار خواهد گرفت.

در نهایت، به فکر گول زدن سرچ انجین ها نباشیم. دلمون رو به چند ماه در اوج بودن خوش نکنیم. اصولی کار کنیم. و حتما منتظر چوب بالاسر نباشیم تا قانون رعایت کنیم.

این مطلب تنها جنبه اطلاع رسانی دارد و هدف آن جلوگیری از اسپمر شناخته شدن شما و رفتن سایت شما در لیست سیاه سرچ انجین ها می باشد. اگر مطالب رو برعکس گرفتید و جنبه بدآموزی مساله رو مورد توجه قرار دادید، هیچ مسوولیتی بر دوش اینجانب نمی باشد و هر چه پیش بیاید، حق شماست!

*این مطالب از خودم میباشد! اگر درآن اشتباهی میبینید، ممنون میشم که اعلام کنید. استفاده از این مطلب آزاد هست و اگر دوست دارید با انصاف باشید، منبع رو هم ذکر کنید.


دسته بندی موضوعی: Web
برچسب ها: - - - - -

Comments

محمدرضا
محمدرضا
11/28/2009 3:01:56 PM #
عداد این کلمات کلیدی چهار تا، پنج تا خیلی دیگه اصرار کنی ده تا میتونه باشه!

تگهای خودتون رو هم دیدیم
me
11/28/2009 3:08:22 PM #
مشکلی اگر می‌بینید، بفرمایید
11/29/2009 2:34:08 AM #
ممنون مفید بود.

توضیحی در مورد کامنت محمدرضا:
تعداد کلمات کلیدی مهم نیست بلکه تعداد کاراکترهای ثبت شده برای کلمات کلیدی و توضیحات نباید بیشتر از 250 کاراکتر بشه و حتی بهتره از 150 تجاوز نکنه.
11/30/2009 4:06:17 PM #
مرسی دوست عزیز مطلب بجا و مفیدی بود. ضمنا ایرادی در کیوردهای اینجا نمیشه پیدا کرد اگر پیدا شد ما رو هم خبر کنید.
hadi
hadi
12/7/2009 12:42:39 PM #
kheili jalaebe shoma ham kenare sitetoon darid az in tarfand estefade mikonid bad migid, ah ah...

manzooram in box e:
Tag cloud

dar zemn emrooze SEO yek elme too donya va google ham agar be hamin rahati farib mikhord ke google nemishod!!!

movafagh bashid
me
12/7/2009 12:51:27 PM #
هادی:
مفهوم tag cloud خیلی متفاوت هست با سیستمی که خودش کلمه کلیدی رو به صورت داینامیک و بر اساس رسیدن درخواست ها از طرف سایت های جستجو کننده میسازه.

در سیستم tag cloud شما برای هر پستی که در وبلاگ دارید، چند کلمه کلیدی یا همون تگ یا برچسب رو انتخاب میکنی. و در نهایت تمامی این کلمات کلیدی که برای کل وبلاگ شما هست به صورت tag cloud نشون داده میشه.

در سیستم هایی که قصد اسپم کردن گوگل و بقیه سرچ انجین ها رو دارند، این کلمات کلیدی به شیوه دیگری ساخته میشوند که نیازی به بازگو کردن نیست.

و صد البته، گوگل به این راحتی فریب نمیخوره، به شرط اینکه بدونه چه بلایی داره سرش میاد. به محض اینکه شیوه ها و الگوریتم های جدیدی که قصد فریب دادن دارند رو گوگل شناسایی کنه، همه اون سایت ها رو در لیست سیاه خودش قرار میده، اما خوب خراب کار ها هم بیکار نیستند و هر روز به دنبال راه جدید برای کلاهبرداری خودشون ار هر مدلی هستند.
SAfiLO
SAfiLO
3/15/2010 1:06:25 AM #
مرسی جالب بود و خوندنی ...
ولی باید این سایت های تبلیغاتی رو حالا اسپم نه ولی حداقل رتبه 1 و اینا نیارن  منظورم به گوگل ...

بعد یکم هم در مورد ین اسپم ها تو ایمیل ها و راهکاره مقابله شون توضیح بده
ممنون
3/19/2010 1:56:31 AM #
مطلب خیلی مفیدی بود
mohammad
mohammad
9/4/2010 4:47:06 PM #
با سلام
یکی از مشکلاتی که من باهاش برخورد کردم سایتهایی هستند که کلماتی جستجو کردم رو در خود آدرس سایتشون یا به صورت query string در انهای آدرس اضافه میکنند
لطفآ اگه امکان داره واسم دراین مورد توضیخ بدین

Pingbacks & Trackbacks

  1. trackback from: mohand.es   (29 Nov 2009)
  2. pingback from: shishlink.com   (29 Nov 2009)
  3. pingback from: imilad.com   (03 Dec 2009)
  4. pingback from: rhrv.com   (04 Dec 2009)
  5. pingback from: archive.mobha.com   (23 Mar 2010)
  6. pingback from: warez7.com   (25 Mar 2010)
  7. pingback from: shz.ir   (02 Apr 2010)
  8. pingback from: nasserghiasi.com   (27 Apr 2010)
  9. pingback from: dalba.wordpress.com   (06 May 2010)
  10. pingback from: shahvar.net   (11 May 2010)
  11. pingback from: 332.1fh.org   (20 May 2010)
  12. pingback from: takpsd.com   (01 Jun 2010)
  13. pingback from: lordweb.ir   (17 Jun 2010)
  14. pingback from: mywindows.ir   (04 Jul 2010)
  15. pingback from: search.droshke.com   (09 Jul 2010)
  16. pingback from: otomatik.ir   (26 Dec 2010)

Add comment


(Will show your Gravatar icon)

biuquoteLTR
Loading



Clicky Web Analytics
Subscribe
Follow me