当前位置:云好站网站目录 » 文章资讯 » 网站运营 » 文章详细

sitemap是什么意思,网站地图sitemap怎么生成

网站运营 109
sitemap是什么意思,网站地图sitemap怎么生成
Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。可以使用Sitemap提供有关网站的一些信息,比如更新日期、Sitemap文件的更新频率等,供搜索引擎的蜘蛛参考,相当于我们在写文章时候的一个提纲,sitemap是一个网站的框架指引文件!
robots和sitemap虽然都是告诉搜索引擎信息的,但robots是告诉引擎哪些该索引,哪些不该索引;而sitemap是告诉引擎站点的哪些路径有什么内容,便于蜘蛛有规律的去爬行,从而快速索引的!
那这个sitemap网站地图怎么去创建呢?放在网站的哪里?需要注意什么?
先来说这个sitemap文件放在哪,这个文件一般是放在网站的根目录的,也可以放在指定的目录中,如果放在指定目录的话,那最好是在robots文件中加上sitemap的文件路径指向,或者去搜索引擎站长平台(百度站长平台、360好搜站长平台、搜狗站长平台)去提交一下自己网站sitemap地图文件的绝对路径位置!
Sitemap文件有三种文件格式,各类工具大多都可以生成:xml文件格式、txt文件格式、html文件格式;
xml格式是最为常见的,而且是几乎通用于所有搜索引擎的,它由XML标签编写,文件本身必须是utf8编码。
标准的XML网站地图格式为:

<?xml version="1.0" encoding="UTF-8"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"><url><loc>http://www.*****.com/</loc><priority>1.00</priority><lastmod>2017-07-24</lastmod><changefreq>Always</changefreq></url></urlset>

解释一下各个标签的含义:
urlset标签:这个是必须存在的,用于声明文件所使用的Sitemap协议版本;url标签:也是必须存在的,它是下面所有网址的目标签;loc标签:也是必须存在的,列出页面完整的URL;priority标签:是可选标签,表示URL的重要程序,数值范围从0.1到1.0不等,1.0代表此页面最为重要,0.0代表最不重要。站长可以使用priority标签告诉搜索引擎这个网页的重要程度。lastmod标签:;是可选标签,表示页面最后更新时间;changefreq标签:是可选标签,代表文件的更新频率,其中的值包括:Always:一直变动;Hourly:每小时;Daily:每天;Weekly:每周;vMonthly:每月;Yearly:每年;Never:从未变动。
这种xml格式是搜索引擎首选索引的地图文件格式,其次是txt文本,工具中也可以生成,文件就是每行是一个页面地址:比如

http://www.*****.com/1.htmlhttp://www.*****.com/2.htmlhttp://www.*****.com/3.htmlhttp://www.*****.com/4.html

HTML版本的网站地图针对的目标是用户,也就是用户在网站上可以看到的网站地图,一般情况下在网站每个页面的顶部或者底部添加一个网站地图的锚文本链接,用户点击之后看到的内容主要是网站主要栏目和页面的链接。
说到这个站点地图,现在来说,国内几大搜索引擎中,份额占据较大的还是百度,那百度支持sitemap的格式是哪几种呢
百度Sitemap协议支持文本格式和xml格式,可以根据自己情况来选择任意一种格式组织sitemap。具体格式说明及示例如下:
1.第一种格式样例:txt文本格式
在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过搜索资源平台进行提交

http://www.example.com/repaste/101562698_5230191316.htmlhttp://www.example.com/repaste/101586283_5230215075.htmlhttp://www.example.com/repaste/101639435_5230310576.html

此文本文件需要遵循以下指南:·文本文件每行都必须有一个网址。网址中不能有换行。·不应包含网址列表以外的任何信息。·您必须书写完整的网址,包括 http。·每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。·文本文件需使用 UTF-8 编码或GBK编码。
2.第二种格式样例:xml格式
单个xml数据格式如下:

<?xml version="1.0" encoding="utf-8"?><!-- XML文件需以utf-8编码--><urlset><!--必填标签--> <url> <!--必填标签,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面,这是必须的 --> <loc>http://www.yoursite.com/yoursite.html</loc> <!--必填,URL链接地址,长度不得超过256字节--> <lastmod>2009-12-14</lastmod> <!--可以不提交该标签,用来指定该链接的最后更新时间--> <changefreq>daily</changefreq> <!--可以不提交该标签,用这个标签告诉此链接可能会出现的更新频率 --> <priority>0.8</priority> <!--可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间--> </url> <url> <loc>http://www.yoursite.com/yoursite2.html</loc> <lastmod>2010-05-01</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </url></urlset>

上述Sitemap向百度提交了一个url:http://www.yoursite.com/yoursite.html
若有多条url,按照上述格式重复<url></url>之间的片断,列明所有url地址,打包到一个xml文件,向搜索资源平台进行提交。
创建sitemap时有哪些注意事项呢?
第一,一个Sitemap文件包含的网址不得超过 5 万个,且文件大小不得超过 10 MB。如果您的Sitemap超过了这些限值,请将其拆分为几个小的Sitemap。这些限制条件有助于确保您的网络服务器不会因提供大文件而超载。
第二,一个站点支持提交的sitemap文件个数必须小于5万个,多于5万个后会不再处理,并显示“链接数超”的提示。
第三,如果验证了网站的主域,那么Sitemap文件中可包含该网站主域下的所有网址。
第四,搜索资源平台sitemap文件提交已不再支持索引型文件形式,历史提交的索引型文件已不再进行抓取,建议站长及时删除,重新进行资源提交。
详细说了站点地图是什么,一些注意事项,接下来说一下比较方便的工具,也是seo从业人员比较常用的工具包!
网站地图Sitemap工具
我给大家推荐三个工具:爱站SEO工具包、站长工具客户端、金花站长工具、还有一款曾经爱用的生成器,很简洁的一款!
一:爱站SEO工具包

通过爱站工具上的【网站地图/sitemap】,勾选要生成的地图格式文件,点击抓爬,工具就自动执行了。

等到抓取完成后,我们就可以下载生成好的xml文件,上传到我们网站的根目录了!
二:站长工具SEO客户端
三:金花站长工具(金花也是一款老牌的seo工具了)

其实无论哪种工具,最后我们都会得到我们想要的xml或者txt文件,但是可以对比一下,哪种格式更适合我们当前的站点!
当然,还有凯哥曾经用着比较顺手的一款地图生成器,老虎sitemap生成器,简洁好用,我贴一下图,然后把文件下载放出来,大家可以下载使用!

好了,介绍这个网站的Sitemap地图文件也是挺全的了,不过也是入门和注意事项,在日常对于这个问题,实操中也会出现很多问题,也欢迎大家留言!