blog

Google Site on Sitemaps

<p>Google网站管理员中心博客通知我们,Google员工已经在马德里举行的WWW'09会议上发布了一项关于Sitemap的新研究</p><p>这项研究非常有趣,我建议打印出十页PDF文档并阅读它</p><p>对于那些没有时间的人,我希望突出以下研究中最有趣的发现</p><p>该研究的目的是衡量Google过去几年的Sitemap使用情况,以确定Sitemap文件如何改善Google网络索引的覆盖率和新鲜度</p><p>通过报道,我的意思是谷歌如何更深入地抓取网络并找到更多可能找不到的内容</p><p> Bt新鲜度,我指的是与正常抓取相比,Google如何更快地抓取新内容或更新内容</p><p>该研究的有趣事实:本文讨论了Google用于Sitemaps的过程</p><p>这是一个快速解释它的流程图</p><p>覆盖范围:用于衡量Sitemaps“覆盖范围”的数据集大约有300万个URL,特别是来自Sitemaps的170万个URL,其余来自正常的发现过程</p><p>在发现爬网过程中,重复的URL接近一百万,而Sitemaps文件中只有100个重复的URL</p><p>简而言之,该研究发现发现率为63%“有效”,而Sitemaps在以一小部分内容的任务为代价来爬行域时效率高达99%</p><p>新鲜度:Google可以通过Sitemaps获得多少新鲜感</p><p>然后,本文继续讨论如何通过Sitemaps或Discovery来确定爬行顺序</p><p>提出了诸如SitemapScore和DiscoveryScore等概念以及可能的方法</p><p>对于大多数有兴趣了解Google Sitemaps如何运作以及如何使您的网站受益的SEO,

查看所有