技术SEO健康对你整个网站的有机表现很重要,就像关键字、链接建设、内容构思等一样。
忙碌的营销人员只有90分钟来了解你的网站是否健康?你的老板刚刚问了你觉得网站有多健康吗?想向你的老板提出一个商业案例,为明年增加一些搜索引擎优化预算?业务开发部有没有向你询问:“嘿,你觉得这个网站怎么样?”
如果这是你一直想要涉足的东西,但不确定从哪里开始,或者时间有限,这篇文章就是为你准备的!
“技术健康”是什么意思?
站点的技术运行状况指:
- 你的网站可以是爬?
- 如何很快而且很容易?
你有没有让搜索引擎更容易做到寻找和分享对搜索者有价值的内容?
SEO高级技术术语
在本文中,我们将参考许多技术SEO元素!如果这些条目对您来说是新的,请查看本文底部的术语表。
提示1:检查重复内容
估计时间:15分钟
这些常见的搜索引擎优化问题会导致大问题,可以通过抽查相当快。
什么是重复内容?
重复内容是指web上任何相同或几乎相同的可索引内容。
为什么重复内容是一个问题?
搜索引擎不知道该将哪个版本的页面包含在索引中。这通常会稀释反向链接的权威,因为它不再清楚链接指标如权威和链接值应该给予哪里,搜索引擎不知道哪个版本的查询结果排名。
通过检查以下元素,您可以检查站点中的简单复制(vs复杂复制)。这些技术元素旨在解决网站上的基本技术问题。
- 拖尾vs非拖尾斜杠
- HTTP vs HTTPS
- 大小写混合url
- 设备参数
对于所有这些类型的重复内容,处理过程是类似的,但我们将使用尾随与非尾随斜杠元素作为示例。
1.1检查尾随与非尾随斜杠:
步骤1:导航到站点上的一个页面
例子:
步骤2:
- 如果页面当前有一个拖尾/ -删除它!
- 它是301重定向吗?
- 它被规范化了吗?
- 它会404吗?
- 如果页面当前没有拖尾/ -添加它!
- 它是301重定向吗?
- 它被规范化了吗?
- 它会404吗?
步骤3:在站点的几个不同模板和区域重复这个过程。
例子:
- A服务页面:
- //www.merkalis.com/work/seo/
- //www.merkalis.com/work/seo
- 一种形式:
- //www.merkalis.com/contact/
- 类型://www.merkalis.com/contact
- 内容:
- //www.merkalis.com/people/
- 类型://www.merkalis.com/people
我如何知道这是一个问题?:
如果每个页面的两个版本都得到了解析,并且没有正确地规范化或301重定向,这就是一个问题,被认为是重复内容。
解决方案是什么?
在你的网站上选择一个主要的规范的URL版本的URL,网站上的每个URL应该强制一个结尾斜杠或一个非结尾斜杠。其中只有一个是正式的。其他的都是廉价的泰勒·斯威夫特(Taylor Swift)演唱会录音的盗版。这使得搜索引擎能够清楚地找到您站点的主要规范URL。
- 最好的:从拖尾/重定向到非拖尾/或反之
- 好:从拖尾/到非拖尾/的Canonical标记,反之亦然。这将浪费抓取预算,因为谷歌必须抓取页面的两个版本。
- 缺点:这两种情况都没有发生,而且两个版本的页面都是可索引的,从而产生了重复的内容问题。现在你卖的是官员,规范泰勒·斯威夫特演唱会和廉价盗版。没有好。
特定于服务器的解决方案:
下面是Apache, NGINX和IIS的官方文档关于如何执行这个:
- 使用Apache的httpd.conf文件
- http://httpd.apache.org/docs/2.0/misc/rewriteguide.html
- 使用Apache的。htaccess文件
- http://httpd.apache.org/docs/2.0/misc/rewriteguide.html
- 使用NGINX 21
- https://www.nginx.com/blog/creating-nginx-rewrite-rules/和https://www.ateamsystems.com/tech-blog/nginx-add-trailing-slash-with-301-redirect-without-if-statements/
- NGINX详细说明了如何将Apache HTTP服务器重写规则转换为NGINX重写规则。
- 使用IIS 7。X及以上
以下问题请重复执行此步骤:
1.2 HTTP与HTTPS
例子:
-
- A服务页面:
-
-
- //www.merkalis.com/work/cro/
- //www.merkalis.com/work/cro
- 一种形式:
- //www.merkalis.com/contact/
- 类型://www.merkalis.com/contact
- 内容:
- //www.merkalis.com/people/
- 类型://www.merkalis.com/people
-
我如何知道这是一个问题?:
如果http和https都解决了,这是一个问题。
解决方案是什么:
最好的:从HTTP版本到HTTPs版本的301重定向,很多时候这也是通过307重定向完成的。
特定于服务器的解决方案:
下面是Apache, NGINX和IIS的官方文档关于如何执行这个:
- 使用Apache的虚拟主机文件
- https://cwiki.apache.org/confluence/display/httpd/RedirectSSL
- 使用Apache的。htaccess文件
- https://cwiki.apache.org/confluence/display/httpd/RedirectSSL
- 使用NGINX
- https://www.nginx.com/blog/creating-nginx-rewrite-rules/
- NGINX详细说明了如何将Apache HTTP服务器重写规则转换为NGINX重写规则https://www.nginx.com/blog/converting-apache-to-nginx-rewrite-rules/
- 使用IIS 7。X及以上
1.3大小写混合url
例子:
- A服务页面:
- //www.merkalis.com/work/paid-media
- 类型://www.merkalis.com/work/Paid-Media
我如何知道这是一个问题
- 如果url的大写和小写版本都可以解析并且是可索引的,这就是一个问题。
解决方案是什么?
- 最好的:站点范围内的301重定向将URL的任何大写版本强制转换为小写。
- 好:将URL的大写版本转换为小写版本的Canonical标记。这浪费了抓取预算,因为谷歌必须抓取两个版本的页面。
- 缺点:这两种情况都没有发生,而且两个版本的页面都是可索引的,从而产生了重复的内容问题。
服务器特定解决方案:
下面是Apache, NGINX和IIS的官方文档关于如何执行这个:
- 使用Apache的httpd.conf文件
- http://brianflove.com/2014/08/11/lowercase-your-uris/
- 使用Apache的。htaccess文件
- https://www.linode.com/docs/guides/how-to-set-up-htaccess-on-apache/
- 使用NGINX
- 有关所需特定PERL脚本的详细信息,请访问:https://dodwell.us/rewrite-uri-to-lowercase-using-nginxperl-nginxlua-or-apache.html
- 也可以使用LUA脚本。
- 使用IIS 7。X及以上
- IIS URL重写有一个实用程序导入Apache mod_rewrite规则如果从Apache迁移到IIS web服务器。虽然这需要编辑和测试,但它确实使迁移过程比从头开始重新创建规则更快更容易。
1.4 UTM参数说明
例子:
- //www.merkalis.com/work/analytics
- 添加UTM参数://www.merkalis.com/work/analytics? utm_source = seertest&utm_medium = test&utm_campaign =测试
我如何知道这是一个问题?
- 如果UTM参数不包含页面主版本的规范标记,这就是问题所在。
解决方案是什么?
- 最好的:找到并修复这些链接。Analytics Fight Club的第一条规则是,不要用UTM参数标记内部链接。你可以链接到尖叫蛙指南,了解如何在URL中找到包含UTM的链接。
- 好:规范标签+ GSC参数处理。是的,GSC参数处理可能很快就会被弃用(请验证),但您可以将UTM参数指定为…跟踪参数。
提示2:检查GA是否有404个会话错误
估计时间:10分钟
这个专业技巧来自我们自己的技术SEO专家Allison行也是我个人的最爱!在谷歌分析的帮助下查看404页面的实时页面浏览量。
步骤1:在您的站点上触发404错误
在你的网站上输入一串随机的数字和字母来触发404错误。
例子://www.merkalis.com/23ou4234uo23
步骤2:复制404页的标题标签
在我们的例子中,它是“页面未找到| Seer互动”。
通过输入CTRL + F找到标题标签并搜索“ ”。
步骤3:导航到谷歌分析网站内容报告
进入行为>站点内容>所有页面
步骤4:为有机流量添加一个段
步骤5:更改日期范围
考虑选择过去90天,因为任何更长的时间都可能是重新添加或重定向的页面。
步骤6:为“Page Title”添加第二个维度
第七步:为页面标题添加高级过滤器
将高级筛选器设置为包含>页面标题>包含,然后在404页面上键入< Title >元素,然后单击应用。
在这里,您将能够看到404页面和他们的实际页面浏览量!301重定向有大量页面浏览量的页面。下面您可以看到,过去X天的404错误已经超过864页。导出这个列表,将404ing页面映射到一个新的源,并将其交给开发人员来实现301重定向!
技巧3:设置变更跟踪警报
估计时间:10分钟(每天开机后)
这个技巧太棒了,感觉就像作弊一样!你的网站是否已经处于顶级的技术状态?这随时都可能改变!我们经常在客户的网站上看到一些奇怪的事件,比如主页没有索引,规范标签在站点范围内更改为站点的staging版本,hreflang标签被删除,站点上的关键页面没有索引标签,高价值页面被删除——你能想到的都有!
使用自动搜索引擎优化页面变化跟踪工具,手动检查您的网站的技术问题,影响搜索引擎性能!这通常是相对较低的成本,特别是对于一个单一的网站。
设置SEO页面更改跟踪一旦你设置了自动化,你就可以被动地接收网站的警报,而不必寻找它们!在初始设置时间之后,查看这些警报通常需要大约10-15分钟!
在Seer,我们偏爱内容王但也有几种选择。
这个工具可以检查的一些项目的例子:
- 站点上所有页面和/或优先级页面的索引
- robots.txt文件的更改
- SSL证书过期
- 规范化的变化
- 元标签更改
- 标题标签,H1,元描述,复制更改
- Hreflang标签变化
...而且more!
技巧4:审计XML站点地图文件
估计时间:20分钟
良好的技术健康从顶部开始!
检查您的XML站点地图文件是否需要更新!XML站点地图是搜索引擎在你的站点上最先查看的东西之一,它应该是一个清晰的地图或图例,应该没有错误。XML站点地图中应该只存在HTTP状态码为200的可索引页面。这下一步需要尖叫青蛙许可证,但我已经包括了一个免费的解决办法在底部,如果需要。
步骤1:开放式尖叫蛙
欲了解更多信息,请阅读我们的综合尖叫蛙指南.
用尖叫青蛙爬你的XML站点地图
步骤2:下载你的XML站点地图文件到尖叫蛙:模式>列表
步骤3:下一步单击上传>下载XML Sitemap
你的网站地图应该开始下载,一旦完成点击“确定”,该工具将开始爬行你的XML网站地图文件。
步骤5:一旦爬行完成,导出“内部全部”
步骤6:打开您的CSV和过滤您的CSV为任何不可索引的url
如何解决:
- 你的XML站点地图应该是免费的
- HTTP状态码不为200的任何页面
- 在“可索引性”一栏中标记为“不可索引”的任何页面
第七步:检查您的XML Sitemap文件是否在Robots.txt文件中声明
当搜索引擎第一次到达你的网站,他们首先寻找robots.txt文件!确保您的XML站点地图在这里被整齐地声明,这样搜索引擎就可以继续抓取这个文件。
例子://www.merkalis.com/robots.txt
上面你可以看到Seer站点上使用“Sitemap:”声明的所有XML站点地图。
如果你没有尖叫蛙执照:
如果你没有尖叫蛙执照,可以使用免费的工具,比如https://httpstatus.io/,从XML站点地图文件中抓取url,并将它们粘贴到工具中!删除一个XML站点地图
技巧6:使用谷歌的移动友好测试工具
估计时间:5分钟
自2018年3月宣布移动优先索引以来,它一直是镇上的话题。你的网站应该针对移动设备进行优化,因为大多数搜索都是在移动设备上进行的。
使用谷歌自己的移动友好测试工具,快速找出是否你的网站是移动友好的!
例子:
在这里,您可以看到谷歌如何在移动设备上查看您的页面的实时渲染!是否支持您的视频类型?风格元素表现出来了吗?您的页面是否与用户看到的页面有显著不同?
发现自己想要走得更远一点?下面是一个额外的技巧,可能需要你花更多的时间来解决,但你会发现(希望)指数价值!
额外提示:使用谷歌搜索控制台抽查错误
估计时间:60分钟。
了解谷歌如何爬行和理解您的站点的最佳方法是什么?直接来自马的口。我们最喜欢的容易理解的发现技术问题的报告是“覆盖”报告,它可以给你方向性的建议,关于你的网站上最严重和最频繁的技术问题发生在哪里!
要找到这个,请访问索引>覆盖率
在这里你可以发现各种不同的问题,包括服务器错误,重定向错误等。虽然深入研究每个问题都需要超过20分钟的时间,但20分钟可以帮助您更准确地了解谷歌在您的网站上遇到的问题。
开始审计每个部分的列表,从错误报告开始,记录趋势线和受影响的页数。
- 审计的“错误”
- 它们是什么:
- 这些错误被整齐地排列出来,让您很好地了解谷歌在爬行站点时在哪里遇到了问题
- 如何评估他们:
- 如果趋势线急剧上升,这可能是最近出现问题的迹象。
- 它们是什么:
- 审计“有效且有警告”
- 它们是什么:
- 这些页面已被编入索引,但上面有警告。
- 如何评估他们:
- 看一下具体的问题,从页数最多的问题开始。
- 它们是什么:
- 审计“有效的”
- 它们是什么:
- 这些页面已被编入索引,没有任何已知问题
- 如何评估他们:
- 看一下被索引的页面,是否有不应该被索引的页面?参数化的页面?只有内部页面?
- 它们是什么:
- 审计“排除”
- 它们是什么:
- 这些页面还没有被编入索引
- 如何评估他们:
- 看看这些页面,为什么还没有被编入索引?这是故意的吗?
- 它们是什么:
在技术搜索引擎优化的世界里,有指数级更多的领域需要探索!但我们希望这些能给你一个从哪里开始的好主意。
搜索引擎优化技术术语
在本文中,我们将参考以下技术SEO元素!如果这些术语对您来说是新的,请查看下面的术语表。
- XML站点地图
- 它是什么:XML站点地图实际上就是站点的地图。无论你是在商场里还是在意大利迷路,你都需要一张地图来确定所有东西的位置。搜索引擎也是一样。
- 如何建立一个:
- robots . txt文件
- 它是什么:robots.txt文件指定搜索引擎应该包含或排除的页面。txt文件还应该声明XML站点地图的位置。把您的robots.txt文件想象成狭窄桥上的一个疯狂的巫师——巫师正在决定谁应该和谁不应该通过,以及他们可以或不可以去哪里!向导也给出了XML站点地图在桥上给所有敢于通过的人。
- 如何建立一个:
- 爬的预算
- 它是什么:谷歌花在爬取和索引页面上的时间。谷歌几乎不可能抓取和索引你网站上的所有内容。谷歌创建一个从最重要页面到最不重要页面的列表,并从上到下爬取该列表。影响URL优先级的一些因素:站点/页面权限(高质量反向链接和内容质量),XML站点地图,内部链接。
在运行此列表时发现了一个问题?不知道怎么解决?有点超出你的能力范围?Seer的技术搜索引擎优化团队在这里提供帮助!点击此处联系我们.