改变文档结构,
为 GoogleProducer 爬虫添加更新编号,
添加有关如何编码内容的信息,
引入专门介绍爬虫技术特性的新部分。
技术特征部分包含全新的内容,这也可能解释决定进行更改的原因。很难指望谷歌改变其文档只是为了清理它并以更直观的方式呈现内容。虽然爬虫的工作方式没有改变,但将文档分成三个独立的主题页面使得 Google 能够在概述中提供更多信息,同时缩短主概述页面。
还有有关内容压缩的新信息,这在有关技术网站优化的讨论中尤为重要。 Google 的一份文档指出:“ Google 爬虫和获取器支持以下压缩方法:gzip、deflate 和 Brotli (br)。每个 Google 用户代理都会在随每个请求发送的 AcceptEncoding 标头中告知我们其支持的压缩方法。例如:“AcceptEncoding: gzip, deflate”。此外,还有关于在 11 和 2 协议中抓取的全新信息,以及 Google 的目标是在不增加网站服务器负担的情况下索引尽可能多的网页的声明。