利用301重定向改变WordPress永久链接

除了在插件、模板等方面有很大吸引力外,在博客推广方面也有很大的优势,尤其是对 的良好支持。URL 静态化、自定义 URL slug 缩略名、强大的 All in One SEO 等插件,可以将 WordPress 打造成一个强悍的 CMS 。出于对 SEO 的考虑,我之前用了 %category%/%postname%.html 的形式,一旦日志太多,每篇文章都要写 slug 是一件很繁琐的事。当然,在 %postname% 中包括关键词的确有利于文章排名。

为了使博客的 URL 统一化方便管理和记忆,昨天改变了  WordPress 博客的永久链接(Permalink)形式,将所有文章都采用了/archives/%post_id% 的永久链接形式。为了防止来自其它网站(尤其是搜索引擎,占有60%甚至更多的流量)的访客看到空虚的 404 错误页面,还必须使用插件来实现 WordPress 博客 URL 的301重定向(301 redirect)。

什么是301重定向

301重定向(301 redirect)是指网址的永久性转移(Permanently Moved),当网站在搜索引擎索引库中的网址发生改变时,搜索引擎并不能及时改变索引库中的网址。网站管理员通过对网址的301重定向转移,可以避免损失来自搜索引擎的用户。更重要的是,通过301重定向转换,URL 的权重、Google PR值都能够不受影响地传递。因此301重定向也是网页更改地址后对搜索引擎非常友好的一种方法。

WordPress 如何实现301重定向

要实现网站的301重定向,网站管理员通常有很多种选择方式。比如改变.htaccess文件、修改服务器设置等方法。当然,这些都有一定的技术门槛。

要对 WordPress 实行301重定向,只需合理应用插件即可。我使用的这款名为 Dean’s Permalinks Migration 的插件就很好的帮我解决了301重定向的问题,使用方法非常简单。

  1. 下载→上传至wp-content\plugins目录→到 WordPress 后台激活;
  2. 设置→PermalinksMigration→输入原来的永久链接形式(我的就是/%category%/%postname%.html),保存;
  3. 设置→永久链接→选择永久链接形式(我的就是/archives/%post_id%);
  4. 为了保证分类、标签(tag)的网址不变,在分类基础中填写/category,在标签基础中填写/tag。【此项可选】

通过以上设置,Googlebot 将可以很快辨别出301重定向,并重新索引更新网址。当然,Googlebot 重新索引也需要时间,Blogger 可以通过 SiteMap.xml 通知 Googlebot。

Google重新索引

在使用/archives/%post_id%后,发现 WordPress 的文章序列(%post_id%)是不连续的。一个猜测是如果一篇文章中如果有附件,则会占用一个post_id,但我发现即使没有附件,post_id仍然是跳跃的 :razz:

P.S:如果通过 WordPress 后台的导出导入功能实现博客主机搬家,由于原博客的post_id是不连续的,而新博客导入后的文章ID则会重新排列。以/archives/%post_id%结构为例,搬家造成的问题就是URL前后不统一,不知可有大侠知道解决方案否,请留言 :smile:

P.S.2:百度至今未重新索引,有说法称百度不支持301重定向,这也就意味着我必须使用 Dean’s Permalinks Migration 插件相当长一段时间,以防止百度过来的访客看到可怕的404页面。到底支持与否,目前还没有统一的看法,过一段时间若有异常则会在博客上写出来分享。

SEO如何处理内容复制可能导制的问题

以下文章由作者Adam Lasnik(谷歌搜索布道者)于2006年12月18日发表在谷歌网络管理员中心英文官方博客

最近,搜索引擎战略会议在寒冷的芝加哥举行。许多谷歌参加者总是被问及关于重复内容的问题。对于这个话题,我们发现有许多破碎的并且有些混乱的理解,我们想在此予以澄清。

什么是内容重复?

重复的内容一般是指在不同域名间存在大量的相同或相似的内容。很多时候,它并非故意或至少本无恶意。譬如说,有些论坛会生成一些专为手机屏幕显示设计的页面;商店物品被显示在(有时甚至是链接到)多种不同的 URL 上,等等。但有些时候,一些网站为了操纵搜索引擎排名,获得更多流行或长尾查询的访问量,大量地从其他网站复制内容。

什么不是重复内容?

虽然谷歌网站有方便易用的翻译功能,我们的算法不会把有着相同内容的英文版和西班牙文版看作内容复制。同样,你不用担心我们把你文章中对其他文章小片段的引用认定为重复内容。

为什么谷歌关心重复内容?

谷歌用户使用 Google 时通常希望看到多样化的原创内容。如果他们找到的都是内容相同的一堆搜索结果,可以想见那是多么烦人。另外,网站管理员不愿意看到 Google 给出象 example.com/contentredir?value=shorty-george〈=en 一样复杂的 URL 。他们往往更喜欢类似example.com/en/shorty-george.htm 的 URL。

谷歌做了些什么?

Google 在抓取网页和获得搜索结果时,总是力图索引并显示内容不同的页面。这种过滤意味着,譬如说,如果你的网站有文章的正常版和打印版,并且你没有在 robots.txt 里设定 noindex 标记,谷歌就只会选择一个版本显示给谷歌用户。对于企图利用复制内容来操控排名,欺骗谷歌用户的少数情况,我们会对相关页面的索引和排名作出适当调整。当然,我们更愿意把重点放在过滤而不是排名调整上,因此,在绝大多数情况下,最坏的结果就是原创者看到了不愿看到的版本出现在我们的索引里。

网站管理员如何主动处理内容复制问题?

* 适当阻止搜索引擎访问:与其让我们的算法来确定一个文件的“最佳”版本,你也许希望指引谷歌选取你的首选版本。譬如说,如果你不想我们索引你网站文章的打印版,你可以在你的 robots.txt 文件中写上目录名或正则表达式来禁止谷歌对那些打印版的抓取。

* 使用 301 重定向:如果你已经重构你的网站,请在你的原网站的 .htaccess 中使用 301 重定向(永久性重定向)来重定向你的用户、Google 爬虫以及其他搜索引擎蜘蛛等。

* 链接要一致:努力使你的内部链接保持一致, 不要既有 /page/ ,又有 /page 和 /page/index.htm 的内部链接。

* 使用顶级域名:为了让我们总是使用最合适的文件版本,请尽可能使用国家特定的顶级域名。与诸如 example.com/de 或 de.example.com 的 URL 相比,谷歌肯定更清楚地知道 example.de 是以德文为核心的内容。

* 小心辛迪加式的联合供文:如果你为其他网站上也提供你的内容,请在每一个其他网站的文章中包括连回原文章的链接。注意:即使是这样,对一个查询,谷歌总是显示我们认为是最适合的(没被网站禁止的)版本,它可能是也有可能不是你所想要的版本。

* 使用谷歌网站管理员工具的首选域功能: 如果其他网站链接你的 URL时 既使用 www 版本又使用无 www 的版本,你可以用谷歌网站管理员工具让我们知道你想要哪种索引方式。

* 减少模板网页上的重复内容:拿版权声明来说,你有两种选择,一种是在你的每一个页面底部都有一个冗长的版权声明;另一种是设立一个专门的版权详细声明页,然后在每页底部写一个非常简短的总结,并链接到版权声明页。

* 避免发布无内容页:用户不喜欢看到无实际内容的页面,要尽量避免空架页。以房地产网页为例,不要发布(或至少要阻止)没有点评的点评网页,或者没有房地产列表的房地产罗列网站等。只有这样,网站用户(以及 Google 爬虫)才不会看到无穷多的写着“以下是在【某城市名】中不可错失的待租房列表……”但其实根本没有什么列表的网页。

* 了解你的内容管理系统:确保你熟悉你的网站是怎样显示内容的,尤其是当它包括了博客、论坛或相关的系统。往往在这些系统中同一内容会以多种形式出现。

* 不要担心,保持快乐:不要过分受搜刮(挪用和转载)你的内容的站点干扰。虽然很恼人, 它们几乎不可能对你在谷歌中的存在产生负面影响。如果你实在忍无可忍, 欢迎你提出千禧年著作权法案申请来声明对你的内容的所有权,我们会处理那些无赖网站。

总之, 如果你对内容复制问题有一个大体的认识,又能花上几分钟有见地地预防性维护一下你的网站,这将既帮助你们,也帮助我们为用户提供独特而相关的内容。