行健网络

?找回密码
?立即注册
查看: 3352|回复: 1
打印 上一主题 下一主题

网站复制内容的消除

[复制链接]
跳转到指定楼层
楼主
发表于 2014-2-8 00:20:13 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

复制内容的产生请见网站复制内容的产生与危害,要消除它当然要具体问题具体分析,对症下药。对于1、2、3、6点产生的复制内容主要是牵涉到网址规范化的问题,第4点是由于网站结构功能上的需要而产生的复制内容,这五点都是可以进行技术处理消除的,而对于5、7点来说,我想那只有老实做站了。

复制内容(重复内容),根据它的含义、产生原因及害处,其消除方法无非是对网址进行规范化、对重复内容禁止收录与禁止传递权重。

一、301重定向

301是http状态码的一种,表示用户或蜘蛛访问的网址已永久转移到另一个网址,跳转的方法有很多种,诸如302临时转向、js跳转、PHP/ASP/JSP/CGI程序跳转、图片跳转、flash跳转与meta refresh标签转身。除301转向外,其它方法俱被视为作弊的方法(但加密的js跳转及图片与flash跳转蜘蛛是难以发现的),而且更重要的一点是301转向还可以传递权重

301跳转根据服务器与程序语言的不同,其操作方法也不一样。

1、Apache服务器下301转向

我们做站长的大多买得是虚拟主机,没有直接更改服务器配置的权限,而Apache服务器提供了.htaccess文件,该文件可以改变它所在目录及子目录的配置,而配置语法与主配置文件一样。

重定向语法:Redirect [status] URL-path URL,其中“URL-path”为老URL,是以“/”开头的绝对路径,后面的URL为目标URL,是以“/”开头的绝对路径或包含协议名称和主机名的完整的URL,如果目标URL不包含协议名与主机名,则将使用与老URL相同的默认值。

301重定向语法:Redirect 301 URL-path URL

当然还可以启用Apache服务器的重写模块mod_rewrite,之后可以使用RewriteRule指令进行URL重定向操作,RewriteRule指令语法:RewriteRule Pattern Substitution,pattern是perl兼容的正则表达式,Substitution是在原始URL与Pattern相匹配的情况下,用来替代的字符串。

当然,在此之前,必须用RewriteEngine指令打开重写引擎,其语法:RewriteEngine on|off

现在,假设要将不带www的exampledomain.com网址301重定向到www.exampledomain.com网址,.htaccess文件指令是:



2、IIS服务器301重定向

现假设要将yyyy.com永久重定向到www.yyyy.com下,操作步骤如下:

(1)、新建站点绑定域名www.yyyy.com,并将文件全部放入该站点所绑定的目录下;

(2)、再新建站点绑定域名yyyy.com,所对应的目录可以为空或仅有index.html文件;

(3)、在yyyy.com站点上右键“属性”---“主目录”,单击“重定向到URL”单选按钮,并在重定向文本框中输入http://www.yyyy.com,再勾选“资源的永久重定向”复选框。

3、代码重定向

PHP代码重定向



ASP代码重定向





二、元标签meta robots的使用

语法:


(1)、all相当于index,follow;

(2)、none相当于noindex,nofollow;

(3)、noindex告诉搜索引擎蜘蛛不要索引当前网页,index则与之相反;

(4)、nofollow告诉搜索引擎蜘蛛不要根据当前页面的链接索引搜索其它网页,follow则与之相反。

三、Nofollow的使用

这里的nofollow独指超链接标签的rel属性值为nofollow,我们知道标签的rel属性是指当前文档与被链接文档之前的关系,而nofollow是“不要跟踪”的意思,组合起来含义是不是很明确啦。据说这个属性是2005年谷歌提议、雅虎与微软拍手赞成的。当初主要是用于博客、论坛防止垃圾帖垃圾评论附带垃圾链接的,告诉蜘蛛不保证该链接页面的质量,这不是一个信任票,请不要传递pr权重。

虽然nofollow可以限制链接网页之间权重的传递,但是并没有明确禁止收录或抓取所链接的页面。那么是不是,nofollow掉的链接所剩下的权重又被平均分配到没有nofollow掉的链接当中呢?关于这个我们seo前辈们也有所论述,其中Zac与国平老师俱认为nofollow的链接权重是被丢弃,而不是被重新分配,而他们的根据俱是来源于Google的一个叫Matt Cutts的一篇帖子。果真如此的话,那么对于本站不重要页面是否要使用nofollow就有待商榷啦。假设有10个页面的链接指向“关于我们”这个非重要页面,这些链接全部被nofollow,原本要传递的页面权重全部被丢弃,而对原网页也没有好处,如果把这10个链接的nofollow去掉,那么,“关于我们”这个页面所得到的权重加上本身的权重还可以通过链接传递回给其它网页。

当然,对这个持反对意见的也不乏其人,他们以博客留言为例(博客留言都带链接签名)进行反驳,如果按照Matt Cutts的原文推理,留言(非垃圾留言)越多的博客pr值越低,而事实并非如此。进而提出nofollow的权是会逐步地重新分配。

四、canonical标签的使用

canonical严格来说是标签rel属性的一个值,HTML标签是定义当前文档与外部资源的关系,而canonical是“典型、标准、典范”的意思,那么的含义也就不言而喻了。

它也是谷歌、雅虎与微软发布的用以规范化网址的,它的使用方法是在“非规范化网址”的网页的头部加入标签,其中的href属性为“规范化网址”。

这个标签是不是有点网页内部301转向的味道,只不过用户并没有网页转向,还是停留在原网页上,但是搜索引擎却把当作301转向处理,将权重集中在规范的网址上。

五、robots文件禁止收录

robots文件运行机制、语句语法在这里就不详述了,拟另发帖进行阐述。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|网站地图|行健网络

GMT+8, 2019-10-16 11:14 , Processed in 0.062473 second(s), 17 queries .

Powered by Discuz! X3.2

? 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表