一、关于Google Sitemap的几点认识
很多朋友刚步入SEO行业,可能是带着很多疑问的,比如:我的站排名为什么不太好?我的站的收录为什
么这么少等。
当你咨询一些SEOER时,他们也会教你一些措施,其中关于Google的收录就有一条Google Sitemap中文名
为google网站地图。
Google Sitemaps是google在2005年6 月份推出的一项服务,关于Google Sitemap(s),google是这样描
述的:
The Sitemap Protocol allows you to inform search engine crawlers about URLs on
your Web sites that are available for crawling. A Sitemap consists of a list of URLs and
may also contain additional information about those URLs, such as when they were last
modified, how frequently they change, etc.
在一则国外的博客读到关于“为什么要使用Google Sitemap”的文章,标题为“Why use a Google
Sitemap”,里面是这样阐述的:
Why use a Google Sitemap
Does Google misjudge the importance of pages on your website?
Perhaps you have a product page in your catalogue that is linked to from lots of
sites on the web and has a high pagerank - this page may often appear above your home page
in the search engine results page even for searches that are for your company generally,
not that specific page. The sitemap protocol enables you to indicate the relative
importance of the pages on your site.
Do you have dynamic content that is not indexed by search engines?
There are many ways of tackling this problem, the sitemap protocol is a new tool
to help ensure that your site is indexed in depth. As the sitemap protocol is new (and
still in beta) it should not be relied upon to ensure deep indexing.
Do search engines crawl your site too much?
The sitemap protocol enables webmasters to suggest to search engine robots how
often particular pages should be indexed. This could potentially reduce the bandwidth used
by search engine robots on dynamic sites.
对于Google Sitemap,枫林是这样认识的,现在有很多的在线生成网址,当然还有一些Google sitemap
在线生成软件之类的东西,但是这类工具都有个特点,都是完全的机器或者智能化操作,这样虽然方便
也很节约时间,但是带来更多的不良因素。
在线生成工具往往过于笼统的加入某些网址,甚至有些加入的网址是该站早一不存在的,这样导致的后
果是什么呢?Robot无法抓取,这也就是很多朋友查看Google Sitemap帐户中的Robot爬行日志看到有很
多网址无法抓取的原因。
枫林认为如果一个站出现大量的Robot无法抓取的页面,这个不但不能提高收录量反而会影响正常的收录
,Google Sitemap原本是为Robot提供方便的通道,使得该站的收录数量更为良好,然而在线生成致使大
量页面无法抓取,这也无疑是对Robot的一种欺骗,很有可能影响到网站以后的收录,这也就是很多朋友
制作了xml的sitemap,收录量反而降低的原因之一。
关于Google Sitemap,枫林是这样看的:
1.千万不要笼统的把每个页面都加入到sitemap之中(robots.txt里的除外)
2.认真查看和修改在线生成的sitemap,相信我们的眼睛
3.如有sitemap的制作基础或者站点的内容比较少,手动制作是首选
4.记得定期查看Robot日志,定期更新你的sitemap
5.对于Google收录已经很好的站(根据站点规模而定),建议不要使用sitemap
Google Sitemap的制作方法主要包括:手动制作,软件生成,在线生成
Google sitemaps 生成软件:Google sitemaps Builder .Net V1.5
自动生成Google地图所需要的.xml文件,很实用!
运行环境:
Windows XP, 2000, 2003
.NET Framework
Google Sitemap在线生成的地址:
http://www.sitemapspal.com/
Google Sitemap提交地址:
https://www.google.com/webmasters/sitemaps/
以上仅代表枫林个人观点,仅供参考。
作者: 枫林
原载: 点石互动搜索引擎优化团队博客
二、Google Sitemap 制作方法
什么是Google Sitemap
Google新推出的Sitemap,是对原来robots.txt的扩展,它使用XML格式来记录整个网站的信息并供Google读取,使搜索引擎能更快更全面的收录网站的内容。
Sitemap的作用就好像为网站提供了整站的RSS,而Google就是这些RSS的订阅者,只要网站有更新就会自动通知Google。这样一来,搜索引擎的收录由被动的Pull变成了主动的Push。
如何制作sitemap:
一、确保自己有Google帐号
二、制作Sitemap(生成http://www.naichafans.ik8.com/的sitemap)
1、打开http://www.sitemapspal.com/

2、在黄色输入框中输入自己的网址:http://www.naichafans.ik8.com/,回车。
3、向下拖动滑动条,就能看到生成的Sitemap代码。
4、打开记事本,新建文本文档。将所有文件拷入,保存为"sitemap.xml"
5、将Sitemap。Xml上传到服务器
我传上去后地址是http://www.naichafans.ik8.com/sitemap.xml
6、打开http://www.google.com/webmasters/sitemap/,以Google的帐号登录(还没有,就申请一个)。
7、如果已经添加过网站,就直接添加sitemap文件

点击“添加”,选择添加一个常规的Sitemap站点。点击下一步。
输入刚才Sitemap的地址http://www.google.com/webmasters/sitemaps。
8、验证自己为网络管理员
进行到上一步后,Google找到这个文件,会提示需要一个googlexxxxx.html的空文件。
在自己的服务器根目录下建立这个文件即可,里面不需要有任何内容。
9、 搞定。
这样就搞定了,根据提示一下步即可。
其他:合并Sitemap
由于我有原来的站点,需要将原网站添加到Sitemap中 原来网站首页为www.googlejava.com/index.html。
1、重复制作第一个的方法,将地址输入sitemapspal.com得到新的代码。
2、合并代码
将
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
</urlset>
之间的部分复制。
添加到第一次的代码</urlset>之前,保存为sitemap.xml即可。
3、上传覆盖原文件。
[如果重复网址多可在推荐的地方软件列表中下载SitemapFilter.sfx过滤]






