TL;博士:最常见的SEO答案,看情况而定!
pdf文件在搜索引擎优化社区中被广泛争论是否“对搜索引擎优化有害”。这很大程度上取决于我们将要讲到的几个不同的项目:
- 为什么pdf可能不利于搜索引擎优化
- 如何判断你的pdf文件是有害的还是有助于你的网站的成功
- 如何让你的pdf文件“SEO友好”
为什么pdf可能“不利于搜索引擎优化”?
以下是一些常见的原因,为什么pdf可能不利于搜索引擎优化:
- 对于机器(搜索引擎)来说,HTML页面比pdf页面更容易理解。对于机器(搜索引擎)来说,它们很难理解
- 通常pdf对用户或移动设备都不友好。这是因为pdf不像标准网页那样具有交互性,它们更适合离线阅读和打印
- 不可导航:很难在PDF文件和主网站之间来回导航
- 它们占用了大量的“资源”,因为它们通常有更大的文件大小(因为它们包含许多图像和更高质量的文本),并可能消耗过多的抓取预算
- 不包含结构化数据元素,使搜索引擎更容易理解
- 通常缺乏元数据元素,如标记的标题标签,元描述和H1的
- 通常不如HTML页面
- 他们可能在serp上有一个较低的点击率(点击率),因为他们奇怪的格式
如何判断pdf是否有助于你的网站的成功
1.检查ahref的反向链接到你的pdf
如果你的pdf文件有大量的反向链接,它们可能会对你的网站的整体成功做出贡献。如果没有,考虑让你的pdf文件更有利于搜索引擎优化(说明如下)。
2.检查SEMRush或其他KW研究工具
你的pdf文件有效果吗?他们有高质量的流量和反向链接吗?他们是否对精选片段进行排名?如果没有,可以考虑让你的pdf文件对搜索引擎优化更友好。
3.在谷歌分析或谷歌搜索控制台查看PDF
pdf会带来流量吗?他们转换吗?如果没有,考虑下面的一些技巧,使你的页面SEO友好。
注意,您将需要启用谷歌Analytics中的具体跟踪查看pdf格式的转换。
4.高级:检查日志文件
对您的pdf执行日志文件分析可以帮助确定您的抓取预算有多少用于抓取和呈现您的pdf。在过去,Seer发现大部分的爬行预算都浪费在了表现不佳的pdf文件上。如果大量的爬行预算被用在了性能不佳的pdf文件上,考虑将pdf转换为HTML或在robots.txt文件中阻止它们。
如何让你的pdf文件“SEO友好”
解决方案1:转换您的pdf到HTML页面
为了提高pdf着陆页的性能,考虑将高性能的pdf或性能较差的pdf转换为HTML,因为HTML页面的性能往往优于pdf。
确保将规范HTTP头或301重定向放置在指向HTML页面的PDF页面上,以合并搜索引擎的信号并防止重复内容。
示例规范化:
- 古老的PDF页面:https://examplesite.com/market-research-stats.pdf
- 新建HTML页面:https://examplesite.com/market-research-stats
遵循以下步骤:
- 规范添加到https://examplesite.com/market-research-stats.pdf使用HTTP报头
- 在服务器中添加规范的HTTP报头
- 示例代码:
< http://www.example.com/downloads/white-paper.pdf >;rel = "规范"
确保在规范标记中使用绝对路径和相对路径。
更多信息请访问:https://support.google.com/webmasters/answer/139066?hl=en#rel-canonical-header-method
例301重定向:
- https://examplesite.com/market-research-stats.pdf301重定向https://examplesite.com/market-research-stats
解决方案2:创建一个HTML挑逗页面
如果由于时间或资源的限制,无法将所有pdf文件全部转换为HTML页面,可以考虑创建一个“挑逗性”的HTML登陆页面,它对搜索引擎更友好,并链接到您的pdf页面。包括相关的和独特的内容从PDF在着陆页几乎像“挑逗”类型的内容。
确保在指向挑逗性页面的PDF页面上放置规范标签,以巩固排名信号并防止重复内容。
示例规范化:
- 古老的PDF页面:https://examplesite.com/market-research-stats.pdf
- 新建HTML页面:https://examplesite.com/market-research-stats
遵循以下步骤:
- 规范添加到https://examplesite.com/market-research-stats.pdf使用HTTP报头
- 在服务器中添加规范的HTTP报头
- 示例代码:
< http://www.example.com/downloads/white-paper.pdf >;rel = "规范"
确保在规范标记中使用绝对路径和相对路径。
更多信息请访问:https://support.google.com/webmasters/answer/139066?hl=en#rel-canonical-header-method
解决方案3:添加SEO元素到您的PDF,以提高性能
如果转换你所有的PDF太大的工作或创建一个挑逗性的登陆页面是不可行的,考虑以下策略来提高PDF页面性能:
- 添加元数据到您的pdf
- 标题标签
- 元数据描述
- H1标签
例如,在Adobe Acrobat中,你可以进入文件>属性,并添加标题标签、作者、主题和关键字:
- 内部链接到和从您的PDF
- 从网站上的其他HTML页面链接到您的PDF文件,以鼓励索引和抓取PDF文件。
- 确保页面内容是纯文本的
- 确保您使用的是基于文本的PDF,并且页面上的文本可以被搜索引擎读取。
- 压缩PDF文件
- PageSpeed也适用于pdf !考虑压缩页面速度文件。
例如,在Adobe Acrobat中,您可以选择“文件>压缩文件>立即压缩”来轻松压缩文件。
你也可以在网上使用免费的工具https://smallpdf.com/!
- 使您的PDF用户友好
- 确保你的PDF文件是用户友好的,模仿传统文章的格式,使用标题、要点、副标题等,使文档更易于用户阅读。
- 认为移动
- 确保PDF是移动友好的,并且在移动设备上易于阅读。
- 使文件名具有可读性
- 确保PDF文件的文件名是用简单的英语写的。避免使用参数、特殊字符或数字。
- 而不是https://example.com/239840923_234%r.pdf
- 让它:https://example.com/marketing-stats-figures.pdf
- 确保PDF文件的文件名是用简单的英语写的。避免使用参数、特殊字符或数字。
例如,在adobeacrobat中,转到文件>另存为并输入可读的文件格式。
解决方案4:跟踪PDF页面性能
可下载的文件如pdf需要在谷歌Analytics中单独设置为事件或虚拟页面浏览量。根据你的谷歌分析,这个设置可能看起来有点不同。
如果您正在查看PDF上的点击,设置一个事件来捕获链接上的点击,允许谷歌Analytics将点击计数为事件点击。
- 如果您使用谷歌标签管理器使用这个文档
- 如果您使用谷歌Analytics跟踪代码在您的网站使用这个文档
- 查看事件跟踪的更多细节,或学习如何跟踪事件作为虚拟页面浏览量的pdf去在这里
- 有关事件跟踪的更多信息,请参阅命名约定在这里