互动 先见
+ - - - - - -
{{项目。标签}}
的见解

仅使用浏览器识别关键技术SEO问题

在搜索引擎优化中可能会出现很多问题,完成一次全面的审计可能会非常耗时——尤其是如果你只是想确定是否有机会提高网站的自然可见性。有时您只需要找到快速的胜利,并且您可能并不总是能够访问一个庞大的工具套件。下面的提示可以用来快速识别是否有主要的障碍将你的网站与成功分开,仅仅使用浏览器。检查这些检查点将使您能够非常快速地确定是否存在值得投资的严重问题SEO技术审计

目录表

1)丢失或写得很差的Robots.txt

2)没有xml站点地图

3)指数膨胀

4)多个或没有GA标签

5)未优化的404页面

6)失效链接

7)多个接入点

8)缺少或容易出错的模式标记

9)子域的存在

10)隐藏/初始HTML和完全渲染的站点之间的主要区别

如何识别常见的SEO问题与您的浏览器

重要:

robots.txt文件是搜索引擎在抓取网站时首先检查的地方之一,这使得不仅有robots.txt文件非常有价值,而且要确保其中列出的指令(基本上,说明大G应该或不应该查看的规则)是准确的,并且不会阻止网站的关键方面。我们还希望确保在这里声明了我们的XML站点地图,因为它使搜索引擎更容易在我们的站点上找到这个关键页面存储库。

使用工具:

你的浏览器

如何检查:

每个站点的robots.txt文件通常位于www.example.com/robots.txt.它是一个纯文本文件,包含用于爬虫的正则表达式驱动规则。换句话说,将/robots.txt添加到您的主页中,您应该可以找到该文件。

注意事项:

当我们检查robots.txt文件时,我们要确保有以下指令:

用户代理:*

允许:/

网站地图:www.example.com/sitemap.xml

这基本上表示允许任何用户代理查看每个页面,然后我们希望它检查出我们的XML站点地图。这个例子对于一个没有很多我们不想被抓取的页面的基本站点来说非常有效。

什么我们不想当我们打开网站上的robots.txt文件时,会看到这样的内容:

用户代理:*

不允许:/

这告诉搜索引擎,我们不希望他们抓取我们网站上的单个页面。当我们的网站已经被索引时,这尤其无效,因为这意味着谷歌将无法抓取看到我们的页面标题,元描述等内容。

如何解决:

这看起来应该很简单——确保你设置了抓取规则,这样你的网站就可以被搜索引擎解析。值得注意的是,这一点经常被忽略。所以,仔细检查你网站的robots.txt文件,确保你没有阻止整个网站被抓取。不要成为那样的人。检查robots.txt确保爬虫是允许的。

2.缺少XML站点地图

为什么重要:

XML站点地图是搜索引擎在抓取站点时通常到达的第二个位置。它是我们想要提供给搜索引擎的网站上每个页面的集合。通过拥有一个状态良好的XML站点地图,我们可以确保搜索引擎可以在我们的站点上找到关键页面。

使用工具:

你的浏览器

如何检查:

如果站点上存在XML站点地图,则可能在两个url中的一个中找到它。在www.example.com/sitemap_index.xml或在www.example.com/sitemap.xml.这两种URL结构都可以,尽管谷歌可能会在默认情况下检查/sitemap.xml。第一个通常是多个站点地图的集合,而第二个通常只有一个站点地图。这也可以发生在,例如,www.example.com/post_sitemap.xml,以及其他变化。您还可以(也应该)检查robots.txt文件(如上所述),以确保XML站点地图在那里被调用。

注意事项:

在这个阶段,我们实际上只是检查确保XML站点地图在那里,我们可以通过转到那个页面来做到这一点。下一步是检查该XML站点地图中所有url的状态,因为搜索引擎对站点地图中的“脏”或非200个状态url的容忍度非常低。这可以在尖叫青蛙,甚至在G-Sheets中完成,但实际上,我们只想检查是否有一个XML站点地图。所以,如果它在那里,并报告为正确阅读谷歌搜索控制台,那么你很好去!

如何解决:

如果您缺少XML站点地图,使用本指南去创造一个!另外,网上有许多选项可以为您创建XML站点地图。如果你的网站是基于WordPress的,也有各种各样的插件可以生成动态XML站点地图,当新内容发布时,它会自动更新。

3.指数膨胀

2019 12 30 11h14 40为什么重要:

当搜索引擎开始索引不应该被索引的页面时,就会出现索引膨胀。当一个电子商务网站有成千上万个相似的产品类别时,这可能会导致搜索引擎的混乱。当有许多几乎相同的页面时,这意味着搜索引擎很难确定哪个页面与搜索者最相关,并且可能提供不相关的结果而不是理想的页面。索引膨胀也会导致大量的重复内容问题——特别是如果被索引的页面没有特别独特的信息来区分它们。通常,当站点上存在索引膨胀时,还可以解决一些抓取预算问题,因为这两个方面是密切相关的。基本上,因为我们有糟糕的抓取指令,搜索引擎正在访问我们不希望他们访问的页面,并选择索引它们。这可能意味着搜索引擎也很难找到对用户真正重要的页面,因为搜索引擎无法从对网站没有什么价值的页面中跳转出去。

使用工具:

你的浏览器

谷歌搜索控制台

链接打捞工具

如何检查:

好吧,这有点难诊断和解决只是你的浏览器,但这不是不可能的。首先,我们要运行一个站点搜索(site:example.com)。以了解谷歌索引了多少页。然后,我们将跳转到谷歌搜索控制台,转到提交的站点地图,并查看在那里发现了多少url。我们还想看看GSC,以确定在12个月内有多少页面获得了自然流量。如果这里存在明显的不匹配(见上图),那么您很可能受到索引膨胀的影响。

注意事项:

完成上述步骤后,您应该对谷歌的索引中有多少页面,以及您实际提交给搜索引擎的页面数量(通过XML站点地图)有了相当的了解。在索引中出现比在GSC或XML站点地图中更多的结果是很正常的,但是如果这个比例非常大——比如一个500页的站点有20,000多个页面——那么您可能会遇到一些索引问题。实际上,页面的比例不应该是1:1:1,但这里受影响的页面数量也不应该有太大的不同。

如何解决:

索引膨胀的解决方案有点棘手,因为将站点放入尖叫青蛙中并了解在爬行中可以找到多少页面是非常有用的。但是,我们还可以做的是,扩展我们的谷歌SERP,每页显示100个结果,然后我们可以使用插件链接打捞工具抓取每个结果页面上的每个URL。然后,我们将进行过滤,只看到我们想要的域,并且可以开始了解哪些类型的页面正在淹没索引。在许多情况下,这是参数化页面、类别或标记页面以及子域的结果。一般都是带/的东西?Stuff&是一个低质量的页面,我们宁愿优先考虑其他地方。

现在我们已经有了一个URL列表,下一步是使用GSC中的Inspect URL工具来确定页面是如何被发现的(XML站点地图还是抓取?),并创建一个攻击计划,以确定如何从索引中删除这些页面——无论是通过创建健壮的robots.txt指令,实现nofollow或noindex标记,还是通过识别页面添加410标头状态,以便页面最终从索引中删除。有很多可能的步骤,所以最好先了解这个问题有多广泛,然后开始制定解决这个问题的策略。

4.多个或缺失谷歌分析标签

2019 12 30 11h19 38

为什么重要:这通常是分析顾问要解决的问题,但也非常容易识别。基本上,我们希望确保在我们的站点上有一个谷歌Analytics跟踪代码的实例。如果有不同的GA标签,甚至不同的视图有不同的标签,这是可以的,但不应该在一个页面上有多个相同的标签,因为它可能会导致分析中的重复计算。

使用工具:

标签助理插件Chrome

如何检查:

首先,下载标签助理插件Chrome.然后,您将转到主页或您希望调查的任何其他页面。选择“记录”,然后刷新页面,并查看标签助手找到的内容。

注意事项:

我们在这里要查找的是相同标签的倍数。如果有以不同方式提交的标记,例如一个通过谷歌Tag Manager提交,另一个通过原始HTML提交,那么这就是一个问题。同时,如果我们在页面上有多个相同跟踪代码的实例,这也是一个问题。

如何解决:

首先,确定您希望如何确保您的跟踪信息部署在站点上。你想要硬编码吗?或者你更喜欢谷歌标签管理器?从这里开始,就是清理站点上不相关的脚本并确保只有一个脚本。虽然您不能完全用浏览器解决这个问题,但这可以非常快速地完成使用尖叫的青蛙

5.未优化的404页面

为什么重要:

好了,直截了当地说,只有一种正确的方法来配置404页面。当你去一个不存在的页面,那么你应该看到一个错误或404页面。这应该提供一些链接到网站的顶部页面,以及一个搜索栏,通常消息说“对不起,你的页面找不到”。该页面还应该向浏览器发送404标题状态,表明它确实不存在。这种实现的任何其他变体基本上都是错误的,并且可能导致搜索引擎出现一些令人困惑的情况。所以,确保你的404页面配置正确

使用工具:

你的浏览器

Ayima重定向插件

如何检查:

因此,为了确定这是否是个问题,我通常会去一个网站,然后创建一个URL (www.example.com/your-full-name/),并使用Ayima重定向插件看看会发生什么。如果页面显示404状态,那么一切正常,没有问题。如果我们被重定向,那我们就有麻烦了。如果我们在一个绝对不应该存在的页面上看到200状态标题,那么这就是一个问题。

注意事项:

一个常见的例子是,当一个网站301将用户从一个不存在的页面重定向到一个特定的404页面(想想被重定向从www.example.com/your-full-name/www.example.com/page-not-found/),它会向你的浏览器发送一个200头的状态。问题是404页面可以向搜索引擎发出信号,表明资源应该从索引中删除,但是通过将不再存在的页面重定向到404页面,那么我们就没有结束相同的信号。潜在地,通过在这个页面上没有NoIndex标签,那么有一个很好的机会,你的200状态404页面实际上会被索引,这是超级可以避免的,只要在第一个地方设置正确的方式。

如何解决:

长话短说,如果页面不存在,它应该显示404状态,并使用模板设计来帮助用户。任何其他替代方案都是根本不正确的。不仅仅是从搜索引擎优化的角度来看,而是从如何构建网页的角度来看。

6.失效链接

为什么重要:

断开的链接是一个问题,有很多原因,但主要是,它只是一个麻烦的用户和搜索引擎。没有人想被链接到一个不存在的页面(如果第5条是网站上的一个问题,那么就加倍了)。所以重要的是要确保如果你有一个链接,它会跳转到200状态页。

使用工具:

断开链接检查器

如何检查:

现在,不可否认,这并不是找到坏链接的最快方法,相反,这是一种抽查页面的好方法。首先,安装断开链接检查器或任何其他坏链接检查插件。选一页,任何一页。然后运行这个插件,看看它能找到什么。

注意事项:

说实话,你的插件将会完成大部分的工作。只需点击它,让它运行,看看它找到了什么链接。

如何解决:

如果你的页面上有一个坏链接,那么把它更新到正确的目标页面。没有人想被链接到404,所以,修复它。同时,如果你发送某人通过重定向循环,那么你的插件可能也会发现这一点。所以也要修复这个链接。

7.多个接入点

为什么重要:

好了,再说一遍,只有一种正确的方法。每个站点应该只有一个访问点。HTTP应该重定向到HTTPS(如果启用)。WWW应该重定向到非WWW,反之亦然。尾随斜杠应该重定向到非尾随斜杠,等等。大写(有时)应该重定向为小写。基本上,只需要url的一个可访问版本,替代版本需要重定向到首选版本。

这里的危险在于,如果页面的非首选版本被任何东西(内部或外部链接)链接,那么搜索引擎很有可能将其视为第二页。我们需要避免这种情况,因为这是一个质量信号,而且我们为什么愿意创造重复的内容?此外,如果有人链接到http://[示例网站]. com如果我们不重定向那个页面那么我们就失去了链接权益。也就是说,http://(例子网站]. com可能有很多域名指向它,但这对我们想要的URL没有帮助https: /(例子网站]. com除非我们301重定向这些页面。

所以总结起来……

一个接入点。

就是这样。

没有更多的。

没有更少。

不管怎样…

使用工具:

Ayima重定向插件

如何检查:

您可以在您的站点上安装Ayima重定向插件(这个工具从我这里得到了很多使用)在你的网站上尝试下面的每个替代方案:

HTTP与HTTPS 末尾斜杠 WWW vs no-www 小写字母vs大写字母
.com/网站https://www。(例子) .com/网站https://www。(例子) .com/网站https://www。(例子) .com/网站https://www。(例子)
.com/网站http://www。(例子) 网站https://www。[例]. com .com/网站https://(例子) .com/网站https://www。(例子)

*为了它的价值,我只包括HTTPS的例子。您将希望对HTTP页面进行相同的检查。

注意事项:

如果您的主页的每次迭代都重定向到正确的目标页面,那么您就很好,并且没有太多需要担心的。如果您没有被重定向到首选协议,那么……你有问题了。

如何解决:

我不会在这里做太多规定,因为,像SEO中的大多数事情一样,视情况而定。

8.缺少或错误的架构标记

为什么重要:

每个网站都应该有一些模式。你是本地企业?得到LocalBusiness。你是一个组织?添加组织。模式有助于在实体之间建立关系,例如服务到网页、到服务区域、到业务,甚至到特定人员。你需要它,而且它必须准确。

使用工具:

你的浏览器

结构化数据测试工具

如何检查:

所以从这里开始:The结构化数据测试工具,然后把你的网站放进去。如果您没有看到任何东西,实际上可能是由于不理想的实现。最好将模式放在原始HTML中,但有时人们会使用谷歌标签管理器作为解决方案。这很好,它会被读取,但不会在SDTT中被拾取。把你的网站放到这里:移动友好测试工具抓住它吐出的代码,然后把它放回SDTT。这是渲染后的DOM——基本上就是谷歌看到的。

注意事项:

一旦我们通过这些工具运行我们的网站,我们基本上只是寻找是否有模式在网站上被触发或没有。如果您仍然没有看到任何模式,或者您的模式充满了错误,那么您就有问题了。需要注意的是,谷歌将忽略警告,但是错误表示问题。

如何解决:

如果你没有图式,然后写一些!如果你这样做了,但它会触发大量错误,那么你一定要解决这些问题。一个专业提示是不能在标记中使用大引号("),这是导致模式错误的常见原因。

9.存在子域(你不知道和优化不足)

为什么重要:

信不信由你,谷歌将子域视为完全独立的域。这意味着他们需要自己的XML站点地图,自己的Robots.txt指令,甚至自己的GSC帐户,以确保您始终处于这些站点的顶端。不幸的是,它并不总是很容易判断,如果你工作的网站有多个子域名或没有。

使用工具:

你的浏览器

谷歌

https://findsubdomains.com/

如何检查:

有几种方法可以用来识别站点上的子域。我的首选是使用搜索操作符,这类操作符有数十亿之多。蚊子的皮特博士甚至写了5344个字展示有多少个搜索运算符。就我个人而言,我不认为你作为一个SEO需要知道更多17个搜索操作员

具体来说,我们要用到的是这个家伙:

19

它的作用是搜索任何包含yourdomain。,但它不包括com.这意味着你甚至可以找到你不知道的顶级域名。在现实中,虽然,唯一真正可靠的方法找到其他子域,在我看来,是尖叫青蛙,但我最近发现了这个工具:https://findsubdomains.com/这是相当可靠的。绝对是一个起点。只要在那里弹出你的网站,如果它找到一些子域名,然后你会做一个网站:搜索,看看这个子域名到底有多大。

注意事项:

子域可能会导致索引膨胀、重复内容问题以及其他各种问题。一旦我们确定了它的存在,我们就需要确保它有自己的XML站点地图和Robots.txt。

如何解决:

子域名本身不是网站的问题,因此这里没有固有的解决方案。子域名优化不足?是的,它们可能是有问题的。目前,我们只关注通过确保他们有自己的robots.txt和xml站点地图文件来解决抓取问题,但子域名可能会引入许多问题。一般来说,我总是建议使用子文件夹而不是子域来承载内容。

10.初始HTML和完全渲染站点之间的隐藏/主要差异

2019 12 30 11h26 16

为什么重要:

SEO,在其核心,归结为一个抓取->渲染->索引->排名模型。这里有很多步骤,但我们保持简短。现在网络上的一个问题是大量使用JavaScript来制作网站,谷歌所做的一件事就是检查原始提交的HTML与渲染后的DOM有何不同。这是我们开始进入第一和第二波渲染的地方,这是另一个棘手的话题可能变得无关紧要.基本上,他们只是确保你没有隐藏任何东西,用户看到的页面和谷歌看到的页面是一样的。

使用工具:

你的浏览器

视图渲染源

如何检查:

这很容易测试。我们可以使用像GSC渲染这样的东西,但如果我们想看到两者在代码方面的实际区别,我们可以使用这个超级粗糙的插件-视图渲染源了解发生了什么变化。

注意事项:

如果有巨大的变化,那么这可能是一个问题,可能需要你的网站通过第二波渲染之前,它的索引。

如何解决:

这里的解决方案听起来很简单,但背后的工作相当紧张。基本上,要确保在初始HTML加载中尽可能多地发送站点的核心内容。如果这是不可行的,那么我强烈建议审查Jamie Alberico对渲染的介绍给你一个起跑的机会。从那里,

就这样了,各位。

这篇文章真的不打算完全诊断和描述一些相当沉重的SEO问题。您应该将其视为一些快速检查,并使用一些方向性信息来解决。还有很多其他的问题可能会发生,老实说,其中一些方法并不是在您的站点上识别或解决问题的快速方法。也就是说,如果你想确定一个网站有多少改进的机会,那么你应该能够在10-15分钟内完成这个过程。你的决心是什么?那要花更长的时间了。随时与我们联系解决你的技术SEO问题

仅使用浏览器还能发现哪些常见问题?让我知道并联系@TheWarySEO


注册我们的时事通讯,更多这样的帖子会直接发送到你的收件箱:

注册时事通讯

我们喜欢帮助像您这样的营销人员。

注册我们的时事通讯以获取更新和更多信息: