河南网站建设,重庆森林台词,wordpress+sdk.js好卡,网络平台指网站 建设项目所在地http://teachmyself.blog.163.com/blog/static/18881422920119895248288/ Sitemap.xml是 google搞出来的#xff0c;也就是网站地图#xff0c;不过这个网站地图是用xml写的#xff0c;而且要按google的标准来写#xff0c;并且要将写出来的这个文件 sitemap.xml上传到自己…http://teachmyself.blog.163.com/blog/static/18881422920119895248288/ Sitemap.xml是 google搞出来的也就是网站地图不过这个网站地图是用xml写的而且要按google的标准来写并且要将写出来的这个文件 sitemap.xml上传到自己的服务器空间中去。目前Google, Yahoo, MSN都已经声明支持这种格式Baidu还没有声明支持但估计走这一步也是大势所趋。这将是向众多搜索引擎提供你网站信息的一种很好的方法。 提交sitemap一是有利于搜索抓取一些正常抓取过程中无法抓取的网址比如动态网页包含大量AJAX的网页或者flash的页面。二是为搜索蜘蛛 指明“工作方向”。Sitemap就是你网站上页面的列表googlebot就按照这个去一个个的抓取收录页面显然比它自己去找会效率高而且要全。 Google网站上有完整的关于sitemap.xml的详细说明 http://www.google.com/support/webmasters/bin/answer.py?answer40318hlzh_CN 但很多站长看后仍然不会操作下面这个教程就是手把手教会你创建Sitemap.xml。 1. Sitemap.XML 的格式 完整格式如下 ?xml version1.0 encodingUTF-8?
urlset xmlnshttp://www.google.com/schemas/sitemap/0.84 urllochttp://www.yrtrip.com/default.asp/loclastmod2008-07-17/lastmodchangefreqdaily/changefreqpriority1.0/priority/urlurlloc http://www.yrtrip.com/search2.asp?id32003044amp;sq1/loclastmod2008-07-17/lastmodchangefreqweekly/changefreqpriority0.9/priority/url……
/urlset 下面对以上标签分别加以解释 a) ?xml version1.0 encodingUTF-8? urlset xmlnshttp://www.google.com/schemas/sitemap/0.84 这两行就相当于网页文件中的html标签一样的作用。不必管这两行什么意思照抄即可。 切记一个字符也不能错即使多一个空格google网站采集时也会报错。另外千万别忘了在文件的末尾加上/urlset标签。 b) url:每个标签包含一个网页地址是以下标签的父标签。 c) http://www.yrtrip.com/default.asp 这里是页面链接地址也就是你希望蜘蛛访问的地址。 切记在地址中出现的某些特殊字符需要使用转义字符否则google也会报错。最典型的就是 号经常在动态网址中出现在提交地址中必须写成 如提交http://www.yrtrip.com/search2.asp?id32003044sq1google管理员工具就会 报错而改为 http://www.yrtrip.com/search2.asp?id32003044sq1提交后就没有问题了。我看到网上有人说 sitemap.xml只能提交一个参数的网页的说法其实多半是因为没有使用转义字符而导致出错的。其他的转义字符就不一一列出了大家可以在网上查。 d) lastmod:页面最后修改时间 这个很重要。Google的机器人会在索引此链接前先和上次索引记录的最后更新时间进行 比较如果时间一样就会跳过不再索引。所以如果你的链接内容基于上次Google索引时的内容有所改变应该更新该时间让Google下次索引时会重新 对该链接内容进行分析和提取关键字。这里必须用ISO 8601中指定的时间格式进行描述格式化的时间格式如下 年YYYY(2008) 年和月YYYY-MM(2008-06) 年月日YYYY-MM-DD(2008-06-04) 年月日小时分钟YYYY-MM-DDThh:mmTZD(2008-06-04T10:3708:00) 年月日小时分钟秒YYYY-MM-DDThh:mmTZD(2008-06-04T10:37:3008:00) 这里需注意的是TZDTZD指定就是本地时间区域标记像中国就是08:00了 切记其他格式可能引起出错比如将2008-08-08 写成2008-8-8就会出问题。 e) changefreq:页面内容更新频率。 这里可以用来描述的单词共这几个always, hourly, daily, weekly, monthly, yearly具体含义我就不用解释了吧光看单词的意思就明白了。 f) priority:相对于其他页面的优先权 定于0.0 - 1.0之间 。 切记建议将各类网页根据重要性给出不同的数值以方便蜘蛛的采集不要耍小聪明全部写1.0google管理工具会报错的。 2. Sitemap.xml制作方式 制作方式无非两种自动方式和手动方式。 自动方式一般使用生成工具自动生成只需输入自己的网址就可以得到完整的xml文件。这种方式一般适用于静态网站在此不再赘述。但需要提醒的是网上的工具良莠不齐生成的文件经常有错误不一定能通过google的校验使用者需认真辨别。 手工方式则是由站长手工填写或写程序完成均可代码很简单大家可以到网上查找。 3. 提交 Sitemap.xml制作完成后就需要将xml文件提交到相关搜索引擎。 Google提交网址http://www.google.com/webmasters/sitemaps/?hlzh-CN Yahoo提交网址http://sitemap.cn.yahoo.com/ 提交后一般在几个小时之内系统就开始下载处理了。 4. Sitemap.xml的校验 至于你的网站地图是否符合标准最方便的手段就是使用google的管理员工具了。 在他下载你的sitemap.xml后几天内这个工具就会将详细的分析结果反馈回来包括sitemap.xml中包含了多少地址google已 将多少地址加入索引sitemap.xml中出现了哪些错误甚至蜘蛛采集过程中遇到的各种问题比如哪些网页有404500错误都会详细的罗列出 来非常方便。 如果你提交的xml文件一切无误那么接下来你就是等着让它的搜索蜘蛛来爬了sitemap的文件告知了文件更新的频率这样搜索蜘蛛来得更勤快页面被收录当然也就更快。 5分半钟Google网站地图 Sitemap.xml