什么是重复内容?
重复内容是指与其他网站或同一网站不同页面上的内容相似或完全相同的副本。网站上存在大量重复内容会对 Google 排名产生负面影响。
换句话说:
重复内容是指与其他页面上显示的内容逐字相同的内容。
但“重复内容”也适用于与其他内容相似的内容……即使它被稍微重写了。
重复内容如何影响 SEO?
一般来说,Google 不希望对内容重复的页面进行排名。
事实上,谷歌指出:
“谷歌努力索引并显示具有不同信息的页面”。
因此,如果您网站上的页面没有明确的信息,则可能会损害您的搜索引擎排名。
具体来说,以下是具有大量重复内容的网站遇到的三个主要问题。
自然流量减少:这非常简单。Google 不希望对使用从 Google 索引中其他网页复制的内容的网页进行排名。
(包括您自己网站上的页面)
例如,假设您的网站上有三个内容相似的页面。
谷歌不确定哪个页面是“原始”。因此,所有三个页面都很难排名。
处罚(极其罕见):谷歌表示,重复内容可能会导致网站受到处罚或完全取消索引。
然而,这种情况非常罕见。而且只有在某个网站故意从其他网站抓取或复制内容的情况下才会这样做。
因此,如果您的网站上有一堆重复的页面,您可能不需要担心“重复内容惩罚”。
更少的索引页面:这对于具有大量页面的网站(例如电子商务网站)尤其重要。
有时,Google 不仅仅会降低重复内容的排名。它实际上拒绝对其进行索引。
因此,如果您网站上的某些页面未编入索引,则可能是因为您的抓取预算浪费在重复的内容上。
重复内容问题是如何发生的?
在绝大多数情况下,网站所有者不会故意创建重复的内容。但是,这并不意味着它不存在。事实上,据估计,高达29% 的网络实际上是重复内容!
让我们看一下无意中创建重复内容的一些最常见方式:
1. URL 变体
URL 参数(例如点击跟踪和一些分析代码)可能会导致重复内容问题。这不仅可能是由参数本身引起的问题,也可能是由这些参数在 URL 本身中出现的顺序引起的。
例如:
- www.widgets.com/blue-widgets?c…与www.widgets.com/blue-widgets?c… &cat=3″ class=”redactor-autoparser-object”> www.widgets重复。 com/blue-widgets是www.widgets.com/blue-widgets ?cat=3&color=blue的重复
同样,会话 ID 是常见的重复内容创建者。当访问网站的每个用户都被分配了存储在 URL 中的不同会话 ID 时,就会发生这种情况。
当页面的多个版本被索引时,适合打印的内容版本也可能导致重复内容问题。
这里的一个教训是,如果可能的话,避免添加 URL 参数或 URL 的替代版本通常是有益的(这些参数包含的信息通常可以通过脚本传递)。
2. HTTP 与 HTTPS 或 WWW 与非 WWW 页面
如果您的网站在“www.site.com”和“site.com”(带有和不带有“www”前缀)上有不同的版本,并且两个版本中存在相同的内容,则您实际上已经创建了每个版本的重复项页。这同样适用于同时维护 http:// 和 https:// 版本的网站。如果页面的两个版本都处于活动状态并且对搜索引擎可见,则您可能会遇到重复内容问题。
3. 抄袭或复制的内容
内容不仅包括博客文章或社论内容,还包括产品信息页面。在自己的网站上重新发布博客内容的爬虫可能是更常见的重复内容来源,但电子商务网站也存在一个常见问题:产品信息。如果许多不同的网站销售相同的商品,并且它们都使用制造商对这些商品的描述,则相同的内容最终会出现在网络上的多个位置。
最佳实践
留意不同 URL 上的相同内容
这是出现重复内容问题的最常见原因。
例如,假设您运营一个电子商务网站。
您有一个销售 T 恤的产品页面。
如果一切设置正确,该 T 恤的每种尺寸和颜色仍将位于同一 URL 上。
但有时您会发现您的网站为产品的每个不同版本创建一个新的 URL…这会导致数千个重复的内容页面。
另一个例子:
如果您的网站有搜索功能,这些搜索结果页面也可以被索引。同样,这可以轻松地向您的网站添加 1,000 多个页面。所有这些都包含重复的内容。
检查索引页面
查找重复内容的最简单方法之一是查看您网站中在 Google 中编入索引的页面数量。
您可以通过在 Google 中搜索 site:example.com 来完成此操作。
或者在Google Search Console中查看您的索引页面。
不管怎样,这个数字应该与您手动创建的页面数量一致。
例如,Backlinko 有 112 个页面被索引:
这是我们制作的页面数量。
如果该数字是 16,000 或 160,000,我们就会知道自动添加了很多页面。这些页面可能包含大量重复内容。
确保您的网站正确重定向
有时,您不仅拥有同一页面的多个版本……而且拥有同一站点的多个版本。
虽然很少见,但我在野外见过很多次。
当网站的“WWW”版本未重定向到“非 WWW”版本时,就会出现此问题。
(或相反亦然)
如果您将站点切换到 HTTPS…并且没有重定向 HTTP 站点,也可能会发生这种情况。
简而言之:您网站的所有不同版本都应该出现在同一个位置。
使用 301 重定向
301 重定向是解决网站上重复内容问题的最简单方法。
(除了完全删除页面)
因此,如果您在网站上发现一堆重复的内容页面,请将它们重定向回原始页面。
一旦 Googlebot 停下来,它将处理重定向并仅索引原始内容。
(这可以帮助原始页面开始排名)
留意类似内容
重复内容不仅仅意味着从其他地方逐字复制的内容。
事实上,谷歌将重复内容定义为:
因此,即使您的内容在技术上与现有内容不同,您仍然可能会遇到重复内容的问题。
对于大多数网站来说这不是问题。大多数网站都有几十个页面。他们为每个页面编写独特的内容。
但在某些情况下,可能会出现“相似”的重复内容。
例如,假设您运营一个教人们如何说法语的网站。
您服务于大波士顿地区。
好吧,您可能有一个围绕关键字优化的服务页面:“学习波士顿法语”。
另一个页面试图为“学习剑桥法语”排名。
有时内容在技术上会有所不同。例如,一页列出了波士顿位置。另一页有剑桥地址。
但在大多数情况下,内容非常相似。
从技术上讲,这是重复的内容。
为网站上的每个页面编写 100% 独特的内容是否很痛苦?是的。但如果您真的想对网站上的每个页面进行排名,那么这是必须的。
使用规范标签
rel =canonical标签告诉搜索引擎:
“是的,我们有很多包含重复内容的页面。但这页是原来的。其余的你可以忽略”。
谷歌表示,规范标签比阻止具有重复内容的页面更好。
(例如,使用robots.txt或在网页 HTML 中使用 noindex 标记来阻止 Googlebot)
因此,如果您在网站上发现一堆包含重复内容的页面,您需要:
- 删除它们
- 重定向它们
- 使用规范标签
使用工具
有一些SEO 工具具有旨在发现重复内容的功能。
例如,Siteliner 会扫描您的网站以查找包含大量重复内容的页面。
合并页面
就像我提到的,如果您有很多包含直接重复内容的页面,您可能希望将它们重定向到一页。
(或使用规范标签)
但是如果您有类似内容的页面怎么办?
好吧,您可以为每个页面打磨出独特的内容……或者将它们合并到一个大型页面中。
例如,假设您的网站上有 3 篇博客文章,它们在技术上有所不同……但内容几乎相同。
您可以将这 3 篇文章合并成一篇 100% 独特的精彩博客文章。
由于您从网站中删除了一些重复的内容,因此该页面的排名应该高于其他 3 个页面的总和。
Noindex WordPress 标签或类别页面
如果您使用 WordPress,您可能已经注意到它会自动生成标签和类别页面。
这些页面是重复内容的巨大来源。
因此它们对用户很有用,我建议向这些页面添加“noindex”标签。这样,它们就可以存在而无需搜索引擎对其进行索引。
您还可以在 WordPress 中进行设置,这样就根本不会生成这些页面。