一、死链介绍
死链是指网站进行优化、改版、管理过程中,不可避免的出现被淘汰、删除、或者无效的网页链接,形式上可分为以下几种:
1、协议死链:http协议返回非20x/30x错误代码,比如404。
2、内容死链:页面语义明确写出内容不存在/帖子已删除/页面不见了等。
3、跳转死链:跳转到首页/报错页等形式。
二、死链的影响
1、影响用户体验:降低用户及搜索引擎对站点的好感。
2、影响搜索权重:影响爬虫爬取效率,优质资源收录概率变低。大量死链低质资源收录后降低百度搜索对站点的评价。
三、百度搜索死链处理机制
1、站长推送:站长最清楚哪些页面产生死链,推送效率高。
2、技术识别:检测滞后,影响体验,误识别。
四、死链的样式建议
1、HTTP协议码:建议返回HTTP状态码为404。
2、页面内容:页面标题语义表示无法访问。页面正文语义表示无法访问,不建议使用火星文,不建议使用纯图片。
五、正常页面样式建议
1、HTTP状态码:HTTP状态码返回200/304,跳转设置301/302。
2、页面内容:页面标题契合页面内容,正文图文并茂(不建议纯图片),布局合理。
六、站点稳定性建议
1、不同网络均可访问:联通/电信/移动均能访问。
2、合理的访问承载能力,访问时延有保障。
3、封禁行为:防火墙等网络设备屏蔽百度爬虫,错误的配置,DNS服务尽量选择非竞争对手厂商避免对百度封禁。子链封禁等。
4、避免被恶意寄生:通过访问日志等行为及时发现处理。
七、其他建议
1、链接主动提交:尤其是大规模死链发生的情况。
2、页面变更:url不复用,避免文不对题或者是误伤。
八、HTTP/HTTPS设置不当引起死链
部分url只能通过HTTP访问,HTTPS无法访