Sitemap–the Map of Website,顾名思义,就是网站地图。
      但是网站地图有两种,一类主要是给人类看的,用户通过网站地图可以很容易的浏览目标网站,很多网站都有这个页面,不过名称可能不一样,比如叫做网站导航。
    还有一类网站地图主要是给搜索引擎爬虫看的,搜索引擎通过网站地图来获取网站的页面,搜索引擎会把相关页面推荐给进行搜索的用户。
      这类的网站地图有其专业的定义,以下是翻译自sitemap官方机构网站sitemaps.org的定义:
     Sitemap 对于网站管理员来说,是把他们网站上可供抓取的网页提交给搜索引擎的一个简单方法。XML文件是Sitemap最简单的一种格式,这个文件包含了网站的网址以及这个网址的其它附加元数据信息,比如网页最新修改日期、更改频率以及相对于其它网站其它网址的重要性,以方便搜索引擎更加智能的抓取网站。
     网络抓取工具通常会通过网站内部和其他网站上的链接查找网页。Sitemap 会提供此数据以允许支持 Sitemap 的抓取工具抓取 Sitemap 提供的所有网址,并了解使用相关元数据的网址。使用 Sitemap 协议并不能保证网页会包含在搜索引擎中,但可向网络抓取工具提供一些提示以便它们更有效地抓取网站。

发表评论