让Google搜索到搭建在Github Pages上的博客

使用Hexo博客框架和GitHub结合搭建博客是一种很不错的选择,但是如何能让博客被Google到呢?

查看是否被收录

首先查看是否已被Google收录,在Google中搜索:
site:https://liwen-git.github.io/
如果未查询到则继续往下看。

搜索资源提交

进入Google Search Console
登录之后,提交自己的博客网址:

选取HTML标记来进行验证,使用推荐方法会被sudo hexo clean命令清除:

将Search Console给的meta标签的信息添加到主题的目录下head.swig文件中,这里使用的是Next主题,其他主题也是类似的,在Hexo/themes/next/layout/_partials/head/head.swig文件中原有meta标签后面添加刚才复制的meta标签。

这时点击验证是无法通过的,需要将你的修改后的Hexo博客更新并部署到Github Pages上之后才可以验证,

1
2
sudo hexo g
sudo hexo d

验证后会提示成功,点击”继续“,先不要关闭这个页面,后面还要用。

添加站点地图

站点地图(Site Map)是用来注明网站结构的文件,我们希望搜索引擎的爬虫了解我们的网站结构,以便于高效爬取内容,快速建立索引。

安装插件

首先为Hexo安装hexo-generator-sitemap插件,在Hexo博客目录下运行:

1
npm install hexo-generator-sitemap --save
重新编译

配置Hexo的_config.yml文件,添加如下字段:

1
2
sitemap:
path: sitemap.xml

然后重新生成博客文件,运行

1
2
3
sudo hexo clean
sudo hexo g
sudo hexo d

此时应该可以在public目录下看到sitemap.xml文件了。

添加/测试站点地图

回到之前提交搜索资源的页面,在左边侧边栏找到“站点地图”,添加新的站点地图,将https://liwen-git.github.io/sitemap.xml提交并刷新,就可以看到博客的网站结构了。

如果没有什么问题的话,到这里就结束了,但是现在用Google还不能立即查到博客的内容,要等到搜索引擎下一次更新检索时才会有显示。

若站点地图无法获取

如果出现了上图的情况,可能是站点地图生成有问题,可以使用XML-Sitemaps重新生成站点地图,然后下载,替换blog/public中的sitemap.xml文件。

若站点地图报错:不允许此网址

可能是站点地图sitemap.xml中的所有网址是以yousite.com开头的,所以站点地图报错

解决:在blog/_config.yml中修改url为你自己的地址
之后重新编译上传,重新生成sitemap.xml,重新提交即可。