前言
经过前面一系列的工作,我们的博客搭建已经接近尾声了,剩下的就是添加内容和优化结构了。但令人难过的是,无论用什么方式,哪怕是直接在百度的搜索栏输入精确的网址,也找不到我们的网站,这是为什么呢?这是因为百度没有收录我们的网站,它根本就不知道我们网站的存在,又怎么可能搜得到呢?
这就是为什么我们在搭建好网站之后,一定要去向搜索引擎提交收录请求的原因了,如果搜索引擎不收录,网站无法触达用户,那么即使我们的内容做得再好,也将毫无意义。
1. 选择搜索引擎
我们知道了搜索引擎收录的重要性,但是搜索引擎千千万,难道要让所有搜索引擎都收录我们的网站吗?
理论上讲,为了最大化网站的曝光率,我们确实应该让尽可能多的搜索引擎收录我们的网站。事实上,即使我们不主动提交收录请求,只要给足够长的时间,我们的网站也会被搜索引擎逐渐收录,因为每个搜索引擎都有自己的网络蜘蛛,它们会不断地在网络上寻找新的网站页面,如果发现页面有价值就会自动收录。但很明显,等待网络蜘蛛的爬取,网站想被收录就不知道要等到猴年马月了,例如我的个人博客,上线半个多月了,依然没有被百度蜘蛛发现。因此,对于一些主流的搜索引擎,为了加快收录进度,我们就很有必要主动提交申请了。
好在搜索引擎虽多,但是综合评估下来,市场占有率高、用户体量大的,也就只有Google、Bing和百度了,所以,我们主要关注这三家就可以了,其他的搜索引擎,就让他们的蜘蛛慢慢爬吧。
2. 主动申请收录
向各大搜索引擎提交网址收录的方式大同小异,我这里不逐个介绍,就以老大哥Google为例简单说明一下,其他搜索引擎的收录步骤参考Google即可。
2.1 检测是否已被收录
在提交网站之前,我们可以检测一下我们的网站是否已经被搜索引擎收录了,如果已经被收录,就不需要再重复提交申请了。
具体操作很简单,在搜索栏输入site:你的网址
,如果已经被收录了,就会显示你的网站信息,如下图所示:
震惊,竟然有部分页面已经被谷歌自动收录了,而且其中还有我刚上线不久的游戏网站,大哥不愧是大哥,效率就是高。我赶紧又用Bing和百度也试了一下,果然不出我所料,毛都没有。
2.2 网站所有权认证
如果没有被收录或者只收录了部分页面,我们可以点击上图中的Try Google Search Console,进入Google Search Console页面。
点击立即使用,这时提示需要登录谷歌账号,输入账号密码登录即可。
如果没有谷歌账号,则需要创建一个,创建过程比较简单,不展开说明,唯一需要注意的是,期间可能出现“此电话号码无法用于进行验证”的问题,需自行百度解决。
登录成功后,会进入如下认证页面,如果网站是基于云服务器部署,这里就推荐域名验证。
输入域名或子域名,点击Continue,会进入如下页面:
点击COPY按钮复制内容到剪贴板,然后打开腾讯云(你配置域名解析的地方)的云解析 DNS页面,添加一条TXT记录,记录值就是刚才复制的值,详细过程请参见域名注册、网站备案、域名解析的域名解析部分,结果如下图所示:
最后返回验证页面点击VERIFY,如果弹出如下窗口,则说明网站验证成功了。
2.3 提交站点地图
点击GO TO PROPERTY进入如下页面,我们就是要在这里提交sitemap
文件,用来告诉谷歌有哪些页面需要被收录。
在我们的网站中,通常可以通过插件自动生成sitemap
文件,例如,我的个人博客就是使用的Sitemap
插件,具体详见完成基本设置,美化博客网站的插件部分,这里不再赘述,我的sitemap
地址是https://ilaozhu.com/sitemap
(我这里是sitemap
,其他插件生成的可能是sitemap.xml
或sitemap.txt
)。
然后回到谷歌的Google Search Console页面,添加sitemap
文件地址,点击SUBMIT提交,就可以等待谷歌收录了。
当然,为了被收录得更快,你也可以逐个页面提交,但是那样太麻烦了,我这里不做介绍。sitemap
的好处就是,只需要提交一次,后续只需要更新sitemap
文件即可,而通常情况下,插件会让sitemap
文件自动更新,所以我们也不需要担心网站内容更新后,忘记更新sitemap
文件的问题了。
好了,到这里提交谷歌收录的申请就完成了,这时,我们可以依葫芦画瓢,把sitemap
文件也提交到Bing和百度了,提交入口如下:
吐槽一下:
Bing提交申请过程非常简单,数据和谷歌是互通的,可以直接从谷歌导入,一分钟就能搞定,但百度就很麻烦,一堆的认证之后还是提交不了sitemap
,显示“今日提交余额:0条”,不知道是不是关联主体没有配置,然而,注册新主体又要审核2-5天,所以最后只能退而求其次,先手动录入页面,sitemap
过段时间再说,但万万没想到,即使这样,竟然也还有坑,貌似一天只能提交10条,算了,再等等看,让它审核吧!
3. 被动收录
我们知道除了主动提交,我们的网站也有可能被动被搜索引擎蜘蛛爬取并收录。但被动收录就无法避免一个问题,就是蜘蛛不知道哪些页面该收录,哪些不该收录,从而导致有些希望被搜索引擎收录的页面(如文章页)没有被收录,而有些不希望被收录的页面(如后台管理页)却被收录了。
真的是既怕他不来,又怕他乱来。好在这个问题解决起来也很简单,跟sitemap
文件类似,我们只需要告诉搜索引擎,哪些页面该收录,哪些不该收录即可。这就需要用到另一个文件:robots.txt
。
robots.txt
就相当于一份君子协议,并不是强制性的,但好在所有搜索引擎都遵守这份协议,其内容也很简单,如下所示:
User-agent: *
Disallow: /admin/
Disallow: /feed
Sitemap: https://ilaozhu.com/sitemap
格式比较固定,编写好了放在网站的根目录就可以了,其中,User-agent
是搜索引擎蜘蛛的名称,*
表示所有,Disallow
是禁止爬取的路径,Sitemap
则是可以爬取的sitemap
文件路径。
结语
提交搜索引擎收录是网站推广的重要一步,但并不意味着提交了申请就一定会被收录,也并不意味着收录了就一定容易被搜到,这取决于网站的质量和价值,因此,后续还需要不断优化网站,提供更有价值的内容,才有可能获取到更好的排名。
评论0
暂时没有评论