网站地图sitemap的作用
如何选择链接提交方式主动推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。
sitemap:您可以定期将网站链接放到Sitemap中,然后将Sitemap提交给百度。百度会周期性的抓取检查您提交的Sitemap,对其中的链接进行处理,但收录速度慢于主动推送。
手工提交:如果您不想通过程序提交,那么可以采用此种方式,手动将链接提交给百度。
自动推送:是轻量级链接提交组件,将自动推送的JS代码放置在站点每一个页面源代码中,当页面被访问时,页面链接会自动推送给百度,有利于新页面更快被百度发现。使用主动推送功能会达到怎样效果
及时发现:可以缩短百度爬虫发现您站点新链接的时间,使新发布的页面可以在第一时间被百度收录保护原创:对于网站的最新原创内容,使用主动推送功能可以快速通知到百度,使内容可以在转发之前被百度发现
Sitemap文件标准格式和大小说明
1、格式:
您可以采用如下三种格式的文件向360搜索提交Sitemap,文件编码可以是UTF-8或GBK:
1)标准的XML格式文件
2)文本格式文件
3)Sitemap索引文件(可同时包含多个Sitemap文件)
2、大小:
1)单个Sitemap文件:大小不超过10MB,且包含不超过50000个网址。如果网站所包含的网址超过50,000个,则可将列表分割成多个Sitemap文件,放在Sitemap索引中。
2)单个Sitemap索引文件:大小不能超过500M,如果超过请提交多个Sitemap索引文件接口。
1、XML格式Sitemap说明
1) XML格式举例
复制收展XML<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8编码-->
<urlset>
<!--必填-->
<url>
<!--必填,定义某一个链接的入口,每一条数据必须要用<url>和</url>来标示 -->
<loc>http://www.xxxxxx.html/000000.html</loc>
<!--必填,URL长度限制在256字节内-->
<lastmod>2012-12-01</lastmod>
<!--更新时间标签,非必填,用来表示最后更新时间-->
<changefreq>daily</changefreq>
<!--更新频率标签,非必填,用来告知引擎页面的更新频率 -->
<priority>0.8</priority>
<!--优先权标签,优先权值0.0-1.0,用来告知引擎该条url的优先级-->
</url>
<url>
<loc>http://www.xxxxxx.html/000001.html</loc>
<lastmod>2012-12-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
2) XML标签说明
标签名称 |
属性 |
标签说明 |
标签类型 |
标签限制 |
可选/必选 |
changefreq |
/ |
标示数据更新频率 |
字符串 |
有效值为:always、hourly、daily、weekly、monthly、yearly、never |
可选 |
lastmod |
/ |
标示数据最新一次更新时间 |
日期 |
时间格式为yyyy-mm-dd |
可选 |
loc |
/ |
标示该条数据的存放地址 |
url |
最小长度1个字符 |
必选 |
priority |
/ |
标示优先值 |
小数 |
[0.0 1.0](大于等于0小于等于1,保留一位小数)例如:< priority
>0.8< priority > |
可选 |
url |
/ |
url地址的开始和结束 |
/ |
最多出现无限次 |
必选 |
urlset |
/ |
urlset用来标记整个文档的开头 |
/ |
/ |
必选 |
特别的是changefreq和priority。
changefreq: 是用来告诉搜索引擎网站更新的周期,描述的单词:“always”(经常) 、“hourly”(每时)、“daily”(每天)、“weekly”(每周)、“monthly” 月)、“yearly”(每年)。
像首页就可以用“always”;对于很久前的链接或不再更新内容的链接就可以使用“yearly”。
百度官方明确指出:百度Spider会参考设置周期抓取Sitemap文件,因此请根据Sitemap文件内容的更新(比如增加新url)来设置。请注意若url不变而仅是url对应的页 (比如论坛帖子页有新回复内容),不在此更新范围内。Sitemap工具不能解决页面更新问题。
priority:用来指定此链接相对于其他链接的优先权比值,取值范围为0.0~1.0之间。值越大,表示此链接的优先权就越高。
百度官方提示:XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗?
不会。Sitemap 中的“priority”提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。
2、文本格式Sitemap说明
文本格式文件每一行写入一个网址,除此之外不包含其他信息。
网址必须完整,网址中不能有换行,且包括协议头(http://)
3、使用Sitemap索引文件(对多个Sitemap文件)说明
1) 索引Sitemap举例
复制收展XML<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex>
<sitemap>
<loc>http://www.example.com/1.xml</loc>
<lastmod>2012-12-01</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/2.xml</loc>
<lastmod>2012-12-01</lastmod>
</sitemap>
</sitemapindex>
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
2) Sitemap索引文件标签说明:
属性 |
是否必填项 |
说明 |
<loc> </loc> |
是 |
Sitemap位置标签,标示sitemap地址位置 |
<lastmod> </lastmod> |
可填 |
Sitemap修改时间标签,标示最新修改时间 |
<sitemap> </sitemap> |
是 |
Sitemap信息说明,标示某个sitemep的信息 |
<sitemapindex></sitemapindex> |
是 |
标示索引文件中所有sitemap的信息 |
怎样生成网站地图sitemap
1、可以使用工具自动生成,然后上传到网站根目录;
优点:方便生成,
缺点:每次更新都要上传,不方便以后维护
http://tools.bugscaner.com/sitemapspider
2、使用代码自动生成
优点:可以在后台自动生成,方便维护
缺点:编码复杂
Java生成sitemap网站地图
添加网站地图sitemap遇到的问题
百度添加网站地图sitemap 一直验证码信息有误
重复10遍都是的,偶尔能成功。。。
使用2345加速浏览器多试几次可以成功。
Google Chrome 都成功不了。
360添加网站地图sitemap 包含URL为0
有共同问题的人
https://bbs.360.cn/forum.php?mod=viewthread&tid=14644476
使用Sitemap索引文件(百度,Google都不支持了)
不知道啥时候不支持索引型文件了 2020-08-04
资料