理论上我们知道哪些因素会影响 Googlebot 的访问频率。它绝对是页面链接流行度、域流行度(或信任度)、给定网站的更改频率等等。理论是好的,但像往常一样我们想在实践中测试它。
但首先 – 一个问题 – 为什么 Googlebot 访问频率如此重要?我们首先在 SERP 上找到我们想要的短语,那么为什么我们需要让我们的页面超载 Google 机器人呢?答案是:这取决于两个因素。如果我们有静态内容,不经常刷新或添加,那么我们不需要更多的 Googlebot 访问。但对于经常更新的网站(例如包含新闻或分类广告或不断创建的其他内容的网站)来说,这一点极其重要。在这些情况下,更多的 Googlebot 访问意味着我们的内容可以更快、更容易地被 Google 获取和索引,从而带来更多的长尾流量。
我们在波兰的一个分类网站( www.morusek.pl )上进行了实验。应用程序中的一个小升级使我们能够记录每次 Googlebot 访问以及所访问网站的 URI 和时间戳。该实验已进行了30天。
一开始的一些一般数据:首先我们可以看到Google的注意力在页面之间分散了多少。最受欢迎的一个 – 每天大约有 20 次访问主页。接下来的两个热门页面的访问频率为每天 15 次,大约 80 个接下来的页面每天至少被访问一次,而其他所有页面 – 370,000 个页面的访问频率低于该频率(在大多数情况下,整个访问次数只有一次)实验)。
前 150 个页面的 Googlebot 访问频率
该实验的主要目的是研究哪些因素对 Googlebot 访问频率影响最大。我们比较了前 300 个页面的频率,不包括广告详细信息页面,因为它们是临时性的,没有足够的数据,例如 MozRank 或内部链接计数。
频率与三个因素进行比较:内部和外部链接计数(根据 GWT)以及 mozRank。为了评估它们的影响,我们计算了每组因素相对于频率的皮尔逊相关系数。系数为 1 表示理想相关,而最小值为 0(正相关)。
最明显和预期的因素 – mozRank 的相关系数为0.6。它是根据前 20 个 URI 来衡量的,因为不太受欢迎的页面通常数据不足。
问频率与
基于前 300 个页面的内部链接( 0.86 ) 和外部链接( 0.7 )的系数要高得多。
Googlebot访问频 马来西亚电话号码数据 率与不同特征的相关系数
我们可以看到,内部链接数据的系数最大,并且随着考虑页面数的增加,该值略有下降。所以我们可以得出结论,对Googlebot访问频率影响最大的是内部链接的数量,换句话说就是内部交叉链接。
我们还想检查链接页面的流行度是否比单纯的数字更能有效地提高访问频率。我们在主页上放置了不太受欢迎的页面的链接,但它几乎没有带来任何增加(例如从0访问/天到0.1访问/天)。
但这还不是全部。在分析频率与内部链接计数的依赖性时,我们注意到两个奇怪的页面:
访问频率与内部链接计数
我们可以看到两次内部链接数量,访问频率相对较低。这两个 北京列表 页面实际上是两个一级类别(“狗”和“猫”),具有大量外部链接和大量内部链接(例如狗、猫相关类别或广告的面包屑)。这些页面的链接比其子类别多得多,但其中一些子类别的访问频率仍然较高(例如第二和第三最受欢迎的页面:“狗 -> 待售狗”和“狗 -> 待收养狗”)。
我认为这些页面的 Googlebot 访问频率要小得多的原因是,作为顶级类别导致它们包含许多首先出现在列表页面上的特色广告,这反过来又导致整个页面内容的更改频率较低(特色广告是比普通广告频率低,并且存在 2-7 天,具体取决于购买的选项)。对于较低级别的类别,特色广告的数量会随着它们分布在不同的子类别中而减少。
但是,回到我们的相关系数,如果我们排除这两个页面,则内部链接计数的系数将为0.92,这确实非常接近理想值 (1)。