什么是重复内容(Duplicate Content)?

  • Home / 全部内容 / 什么是…
duplicate-content-img

什么是重复内容(Duplicate Content)?

什么是重复内容(Duplicate Content)?

重复内容是指在互联网中不止一个地方出现过的内容。其中“一个地方”指的是带有独立网页地址(URL)的所在。所以,如果相同的内容出现在不止一个网页中时,就意味着是重复内容。
虽然严格来说不会有惩罚,但是重复内容还是会影响搜索引擎排名。当在互联网的多个地方出现Google称为“明显相似”的内容时,会使得搜索引擎很难去抉择哪一个版本与指定搜索请求更相关。

为什么需要重视重复内容?

从搜索引擎的角度
重复内容的出现会对搜索引擎造成3点问题:

  1. 搜索引擎不知道在索引中应该包含或者移除哪个版本。
  2. 搜索引擎不知道是否该将链接的指数标准(信任值,权重,锚文本,链接权益等)都导向另一个页面,或者是将这些指数标准分成两个版本去看待。
  3. 搜索引擎不知道在搜索结果中应该对哪个版本进行排名。

从网站所有者的角度
当重复内容出现时,网站所有者会遭受排名与流量的丢失。这些丢失通常源自于两个主要的问题:

  1. 为了提供最好的搜索体验,搜索引擎鲜少会展示多有着相同内容不同版本的结果,这样一来就被迫去选择可能会是最好结果的版本。这样就会削减了每个重复内容的可见度。
  2. 链接权益也会被进一步的削减因为其他网站也需要去在重复内容中做出选择。所有的外链将会链接到多个内容而不是只链接到一个,这样链接权益就会分布在这些重复内容中。因为外链是一个排名因素,这也会影响一个内容的搜索可见度。

注:链接权益是指页面上的链接对该页面针对指定搜索请求排名能力的影响。
重复内容最终的结果将会是该内容将不会获得它应有的搜索可见度。
重复内容

重复内容的问题是怎么出现的?

绝大多数情况下,网站的所有者不是有意去创造重复的内容,但是不代表就没有发生。事实上预估大概29%的网页是重复内容。我们来看一下哪几个方面会无意识的创造出重复内容。

1. URL变化

URL参数,例如跟踪点击和分析代码会导致重复内容的问题。这个问题可能不仅是参数本身引起的,也可能是因为这些参数在URL 中的顺序导致的。
示例:

  • www.widgets.com/blue-widgets?color=blue is a duplicate of www.widgets.com/blue-widgets
  • www.widgets.com/blur-widgets?color=blur&cat=3 is a duplicate of www.widgets.com/blue-widgets?cat=3&color=blue

相似的,会话IDs 是一个常见的重读内容制造者。这发生在当每个用户访问网站时,网站会给他们分配一个不同的存在于URL中的会话ID。
重复内容
当多个版本的页面被索引时,打印专用版本的内容也会引发重复内容。
重复内容
如果可能的话,尽量避免添加URL参数或者URL的替代版本(这些包含的信息通常都会通过脚本)。

2. HTTP vs. HTTPS 或者 WWW vs 非WWW页面

如果你的网站有 “www.site.com” 和 “site.com”(带有和没有带有 “www” 前缀)的两个版本且这两个网站有一样的内容,那么你就为了这两个网站上每一个页面都创造了重复内容。对于同时有http:// 和 https://两个版本的网站是同样的道理。如果一个页面两个版本都在线上且对搜索引擎公开,那么你很有可能陷入了重复内容的问题。

3. 抄袭内容和复制内容

内容不止包括博客文章和新闻稿件内容,还包括产品信息页面。抄袭者重新发布你博客内容到他们自己的网站是一个最常见的重复内容来源,但是对于电子商务网站有一个常见的问题就是产品信息。很多不同的网站销售一样的东西,他们都用一样的厂商描述,导致相同的内容出现在网上不同的地方。

关于 如何解决重复内容的问题?请看下一期文章。

Article: https://moz.com/learn/seo/duplicate-content
Feature Images: https://www.actuatemedia.com/what-is-duplicate-content/

Write a Comment

电子邮件地址不会被公开。 必填项已用*标注

wechat

Scroll Up