[halo-dev/halo]search google 提交站点地图 google 提示无法抓取

2024-04-01 461 views

回答

3

建议更新 sitemap 插件至最新,并同时删除外部访问链接(external-url)配置。

2
  1. 我访问 sitemap.xml 还是 http image

是不是因为我外部套了一层 cloudflare 导致的,我是服务器开 nginx 暴露 80 端口,然后 cloudflare 开代理模式进行 https 的访问 image

1

小哥哥你好,我看你的sitemap里面的链接协议已经变成https了请问一下你是怎么搞的?我external-url设置为https或者不设置这项配置,sitemap里面的链接都还是http协议的链接

1

我是将 cloudflare CDN 改成了直接访问 nginx,nginx 配置 ssl。但目前 google 还是无法抓取 image

5

IMG_8104 那就真的奇怪了?,难道是nginx的问题么

5

应该不是图中说的 content type 的问题,sitemap.xml 的 content type 使用的是 text/xml,和 google 的 sitemap一致,所以 google 不会因为这个问题无法抓取,我们的都是可以成功的:

image
9

我看你的 sitemap.xml 访问很慢,需要 17.9 秒,google 会不会因为访问超时而抓取失败,你可以先让你的 sitemap.xml 访问的快点然后在重试 google 抓取

4

不好意思,有其他变量导致了我这个访问出现了卡顿,周五在服务器上跑了 k3s 的节点,安装了一些吃性能的服务。我现在已经将 k3s 关闭了,访问正常了。稍微慢点也比较正常,我这个服务器在香港。 image 目前速度上来了,结果还是依旧,我还是比较头疼。期间我怀疑过是不是生成链接中包含中文,转义为 url 编码导致 xml 不识别,我把链接地址全改了好像也没解决问题。 image 这里的检查确实没问题了,但 google 还是没有抓取 image

2

我安装了最新版的 1.1.1 的 feed。 生成链接如下:https://blog.aicq.icu/feed.xml google 结果 image 我开始怀疑是不是谷歌无法访问我的站点,于是我拨测了海外的线路 image 最慢的也没有超过 2 秒。 Google 也不给个提示还是比较难排查

8

你可以试试看有没有报告里面可以看到一些信息 路径在:设置-抓取统计信息-打开报告 里面可以看到一些信息 image

9

我尝试了一下通过 https://www.xml-sitemaps.com/ 填入我站点的链接生成 sitemap 后放到站点然后重新提交 sitemap 到 google 发现也无法抓取,但是其他人的可以,所以估计跟 sitemap 插件没有什么关系,原因不明?

image
2

image 我看到响应中都是成功的,404的 favicon.ico 是因为我确实没有传,但里面没有 sitemap image

3

我可以尝试先把 sitemap 插件卸载了,然后在用 feed 试试