什么是网站重复内容?
网站重复内容一般是指在不同域名间存在大量的相同或相似的内容。很多时候,它并非故意或至少本无恶意。但有些时候,一些网站为了操纵搜索引擎排名,获得更多流行或长尾查询的访问量,大量地从其他网站复制内容。
什么不是网站重复内容?
虽然谷歌有方便易用的翻译功能,算法不会把有着相同内容的英文版和西班牙文版看作内容复制。同样,不用担心文章中对其他文章小片段的引用认定为网站重复内容。
什么谷歌关心网站重复内容?
谷歌用户使用Google时通常希望看到多样化的原创内容。如果他们找到的都是内容相同的一堆搜索结果,可以想见那是多么烦人。
谷歌做了些什么?
Google在抓取网页和获得搜索结果时,总是力图不索引并不显示网站重复内容。譬如说,如果你的网站有文章的正常版和打印版,并且你没有在robots.txt里设定noindex标记,谷歌就只会选择一个版本显示给谷歌用户。对于企图利用复制内容来操控排名,欺骗谷歌用户的少数情况,Google会在对相关页面的索引和排名作出适当调整。当然,Google更愿意把重点放在过滤而不是排名调整上…
网站管理员如何主动处理网站重复内容问题?
适当阻止搜索引擎访问:与其让算法来确定一个文件的"佳"版本,不如指引谷歌选取你的选版本。譬如说,如果你不想谷歌索引你网站文章的打印版,你可以在你的robots.txt文件中写上目录名或正则表达式来禁止谷歌对那些打印版的抓取。
使用301重定向:如果你已经重构你的网站,请在你的原网站的.htaccess中使用301重定向(性重定向)来重定向你的用户、Google爬虫、以及其他搜索引擎蜘蛛等。
链接要一致:努力使你的内部链接保持一致;不要既有/page/,又有/page和/page/index.htm的内部链接
使用谷歌网站管理员工具的选域功能:如果其他网站链接你的URL时既使用www版本又使用无www的版本,你可以用谷歌网站管理员工具让谷歌知道你想要哪种索引方式。
减少模板网页上的网站重复内容:拿版权声明来说,你有两种选择,一种是在你的每一个页面底部都有一个冗长的版权声明。另一种是设立一个专门的版权详细声明页,然后在每页底部写一个非常简短的总结,并链接到版权声明页。
避免发布无内容页:用户不喜欢看到无实际内容的页面。要尽量避免空架页。
了解你的内容管理系统:确保你熟悉你的网站是怎样显示内容的,尤其是当它包括了博客,论坛,或相关的系统。往往在这些系统中同一内容会以多种形式出现。
总之,如果你对网站重复内容问题有一个大体的认识,又能花上几分钟有见地地预防性维护一下你的网站,有很大帮助。
文章出自:北京做网站公司-好好建站网 http://www.haohaoweb.cn 如转载请注明出处!
上一篇:影响Google排名的重要因素 下一篇:针对雅虎网站优化以及推广
|