TL;DR: Duplicate content לא causes penalty ישיר. גוגל פשוט בוחרת גרסה אחת ומתעלמת מהאחרות. זה מפזר את ה-ranking power. הפתרונות: canonical tags, 301 redirects, robots meta, או content rewrite.
מה זה Duplicate Content
תוכן זהה או דומה מאוד במקומות שונים:
- Internal. באותו אתר. דף אחד עם 3 URLs שונים.
- External. קופי מאתר אחר.
- Near-duplicate. דפים עם 80%+ דמיון אבל לא זהים לגמרי.
מקורות פנימיים נפוצים
1. URL parameters
example.com/product?color=red, ?color=blue, ?sort=new. כל אחד URL נפרד, תוכן זהה.
2. WWW vs non-WWW
example.com ו-www.example.com. אותו content, 2 URLs.
3. HTTP vs HTTPS
אם המעבר ל-HTTPS לא עוד 301 redirect של HTTP.
4. Trailing slash
/page/ vs /page. 2 URLs, 1 content.
5. Case sensitivity
/About/ vs /about/. לעיתים 2 URLs שונים.
6. Print versions
example.com/article + example.com/article/print.
מקורות חיצוניים
- סינדיקציה ב-אתרי partners (Medium, LinkedIn, Substack).
- Guest posts שחזרת עצמך.
- Product descriptions שהעתקת מה-manufacturer.
- Scrapers. אתרים שגנבו content שלך.
פתרונות
Canonical tag
ה-default לטיפול. <link rel="canonical" href="..." /> אומר לגוגל. "זו הגרסה הרשמית".
מתי: URL parameters, print versions, near-duplicates.
301 Redirect
הגרסה המוגברת. 1 URL משודר ל-URL אחר permanent.
מתי: WWW consolidation, HTTPS migration, URL restructure.
Robots meta noindex
ל-דפים שרוצים להישאר לא ל-indexing.
מתי: paginated pages, filtered results, thank-you pages.
Rewrite content
לעיתים הפתרון הוא פשוט לא להעתיק.
מתי: product descriptions, syndication, guest posts.
Canonical vs 301. מתי מה
Canonical: 2 URLs נשארים נגישים, אבל גוגל יודע איזה primary.
301: 1 URL מפסיק לעבוד, כולם עוברים ל-target.
מתי canonical: users צריכים access לכל הגרסאות (parameters, filters). מתי 301: אחד אמור להיות רק.
Product variants (ecommerce)
החנות שלך עם אותו מוצר ב-5 צבעים. 5 URLs, לרוב תוכן דומה.
פתרונות:
- Canonical של כל variant למוצר master.
- Schema ProductGroup. אחד עם כל variants.
- Pages מגוונים עם content ייחודי לכל variant (אם worth).
Syndication
אם אתה מפרסם תוכן ב-Medium/LinkedIn במקביל לאתר שלך:
- פרסם קודם באתר שלך (establish origination).
- Wait 1-2 שבועות לפני syndication.
- In the syndicated version. canonical ל-original.
Checking duplicates
Screaming Frog
Duplicate content detection built-in. חזק.
Copyscape
לבדוק external duplicates (scrapers).
Google Search Console
Coverage report. "Duplicate, submitted URL not selected as canonical" = alert.
טעויות נפוצות
- Self-canonical wrong (canonical מצביע על URL שונה).
- Multiple canonical tags בדף (conflict).
- Canonical chain (A canonical ל-B, B canonical ל-C).
- 301 של עשרות URLs ל-homepage אחת (spam signal).